Libertonia
Portada · Todo · Software Libre · Desarrolladores · Comunidad · Internet · Tecnología · Meta · Diarios
Ver: Modo: Orden:
La proliferación de la información en la era Internet | 12 comentarios (12 temáticos, editoriales, 0 ocultos)
La biblioteca universal. (4.33 / 3) (#5)
por jamarier a las Mon Jun 21st, 2004 at 09:23:02 PM CET
(Información Usuario) http://barbacana.net/blog/

Tal y como lo veo, el problema no es la información que existe en internet. El problema es la des-información que existe. O dicho con términos ingenieriles, la relación señal/ruido. A mi cada vez me cuesta más encontrar información útil. Porque cuando tengo necesidad de cierta información concreta cada vez me sale más información menos útil ¿quién de los que usamos LaTeX no le a pasado que al buscar información en google nos remite a páginas pornos de fetichistas? Y si al menos fueran buenas...

Para aumentar el nivel de ruido de internet voy a aportar dos enlaces a dos relatos cortos sobre la información. El primero es de Jorge Luís Borges y se titula "La Biblioteca de Babel" y da una visión (como no podría ser de otra forma) poetica del asunto. Sobre esta idea tenemos un relato anterior de Kurd Lasswitz llamado "La Biblioteca Universal" que trata del tema de forma mucho más didactica y desenfadada.

Ambos relatos hablan de libros de papel debido a la antigüedad de los mismos (el más antiguo data de 1901) pero podríamos hacer una versión digital moderna: si determinamos que cualquier obra escrita puede ser en 1 mebibyte de espacio (realmente el espacio es indiferente, ya que podría existir un segundo tomo que se llame 2ª parte de ... y hasta 3ª y 4ª...) podremos determinar que la cantidad de libros distintos posibles es 256^1048576. Cantidad que mi calculadora se ha negado a calcular.

Además, para liar un poco más la marrana, esta información se puede comprimir B-). Pongamos por simplificar que queremos tener todas las combinaciones de 3 bits, estas son:
000,001,010,011,100,101,110,111

hemos utilzados para describirlas 3*8 digitos. Mucho desperdicio. Hagamos un código cíclico:
00011101

si suponemos que el final está enlazado con el inicio, tomando 3 digitos consecutivos en orden ¡obtenemos todas las combinaciones!
(veamos: 000,001,011,111,110,101,010,100)

con este sistema se ha "comprimido la información 8 veces. Empleando el sistema en los ficheros anteriores, reduciríamos en 1048576 veces el tamaño de nuestra biblioteca. Y ahora podemos aplicar un sistema de compresión estándar sin pérdida tipo rar, bz2 o el que queramos.

La producción de estos libros es de forma absolutamente determinista. De forma que para referirnos a un libro nos basta con indicar el número de orden de generación en nuestra biblioteca. Si en ambos extremos se tiene el mismo programa generador, bastaría con decir: --oye el Quijote está muy bien es el libro #1284618372112 de la biblioteca universal--. El receptor introduce en su generador de la biblioteca universal y se produce el texto completo. Es decir no es necesario almacenar toda la biblioteca en ningún disco duro (altamente improbable) simplemente citando el número de orden del libro que nos interese se genera exclusivamente ese.

Yo ya tengo un par de prototipos de generadores de texto en perl. Y me han dado una beca para continuar experimentando por ahí (para los curiosos estoy implementado un sistema recursivo primero genero todas las palabras posibles de 5 o menos letras, a partir de ahí todas las frases posibles y así en adelante). Os pongo un prototipo.
perl -e 'for($_="aaaaa"; $_ ne "zzzzz"; $_++) {print "$_\n";}'


Ahí quedó.

PD: Antes de plantearte contestar fubibundamente a este mensaje he de decir que aunque es cierto es absolutamente falso. Es cierto , salvo de transcripción, en la cuantificación del tamaño de la biblioteca universal tal y como se explica en el relato de Lasswitz. Es falso en la extrapolación y aplicaciones prácticas del invento en la era digital.

El usar un código cíclico es un sistema de reducir la información pero no es un buen sistema de compresión. Fijaros que si quiero transmitir el número 2 (010 en binario) tengo que decir "Mira el offset 6 (110) de la cadena cíclica. El índice o indicador 6 ocupa 3 bits al igual que el número 2. Luego para transmitir de forma milagrosa el quijote, habría que indicar un número índice tan grande como el propio libro de el quijote. ¡Vaya ahorro! Además la cadena cíclica propuesta es poco compresible por medios tradicionales (zip y otros) porque todas las combinaciones son equiprobables y, como sabemos, estos sistemas se aprovechan de las repeticiones.

Como atopos ha utilizado la palabra palimpsesto dos veces sin poner su definición, ahora yo voy a hacer lo mismo y así entre los dos mejoramos la cultura de los lectores de Libertonia: Alcorque, Alcorque y Trébede, Trébede.

-----
- Porque mañana será un gran día.



Others have rated this comment as follows:
Kazgor 5
porras 5
advocatux 3

La proliferación de la información en la era Internet | 12 comentarios (12 temáticos, editoriales, 0 ocultos)
Ver: Modo: Orden:
Menu
· crear cuenta
· FAQ
· búsqueda
· Fuentes de Noticias

Login
Nueva cuenta
Usuario:
Contraseña:

ecol Logo Powered by Scoop
Todas las Marcas Registradas y copyrights de esta página son propiedad de sus respectivos dueños.
Los comentarios son propiedad del que los escribe.
Los iconos de las noticias y el logotipo son propiedad de Javier Malonda.
El Resto © 2002 Escomposlinux.org y aledaños.

Puedes sindicar los contenidos de libertonia en formato RSS 1.0 y RDF 0.9. También se puede sindicar la cola de envíos pendientes de moderación.

El proyecto escomposlinux.org está dedicado a la memoria de tas

crear cuenta | faq | búsqueda