Libertonia
Portada · Todo · Software Libre · Desarrolladores · Comunidad · Internet · Tecnología · Meta · Diarios
Ver: Modo: Orden:
La proliferación de la información en la era Internet | 12 comentarios (12 temáticos, editoriales, 0 ocultos)
La biblioteca universal. (4.33 / 3) (#5)
por jamarier a las Mon Jun 21st, 2004 at 09:23:02 PM CET
(Información Usuario) http://barbacana.net/blog/

Tal y como lo veo, el problema no es la información que existe en internet. El problema es la des-información que existe. O dicho con términos ingenieriles, la relación señal/ruido. A mi cada vez me cuesta más encontrar información útil. Porque cuando tengo necesidad de cierta información concreta cada vez me sale más información menos útil ¿quién de los que usamos LaTeX no le a pasado que al buscar información en google nos remite a páginas pornos de fetichistas? Y si al menos fueran buenas...

Para aumentar el nivel de ruido de internet voy a aportar dos enlaces a dos relatos cortos sobre la información. El primero es de Jorge Luís Borges y se titula "La Biblioteca de Babel" y da una visión (como no podría ser de otra forma) poetica del asunto. Sobre esta idea tenemos un relato anterior de Kurd Lasswitz llamado "La Biblioteca Universal" que trata del tema de forma mucho más didactica y desenfadada.

Ambos relatos hablan de libros de papel debido a la antigüedad de los mismos (el más antiguo data de 1901) pero podríamos hacer una versión digital moderna: si determinamos que cualquier obra escrita puede ser en 1 mebibyte de espacio (realmente el espacio es indiferente, ya que podría existir un segundo tomo que se llame 2ª parte de ... y hasta 3ª y 4ª...) podremos determinar que la cantidad de libros distintos posibles es 256^1048576. Cantidad que mi calculadora se ha negado a calcular.

Además, para liar un poco más la marrana, esta información se puede comprimir B-). Pongamos por simplificar que queremos tener todas las combinaciones de 3 bits, estas son:
000,001,010,011,100,101,110,111

hemos utilzados para describirlas 3*8 digitos. Mucho desperdicio. Hagamos un código cíclico:
00011101

si suponemos que el final está enlazado con el inicio, tomando 3 digitos consecutivos en orden ¡obtenemos todas las combinaciones!
(veamos: 000,001,011,111,110,101,010,100)

con este sistema se ha "comprimido la información 8 veces. Empleando el sistema en los ficheros anteriores, reduciríamos en 1048576 veces el tamaño de nuestra biblioteca. Y ahora podemos aplicar un sistema de compresión estándar sin pérdida tipo rar, bz2 o el que queramos.

La producción de estos libros es de forma absolutamente determinista. De forma que para referirnos a un libro nos basta con indicar el número de orden de generación en nuestra biblioteca. Si en ambos extremos se tiene el mismo programa generador, bastaría con decir: --oye el Quijote está muy bien es el libro #1284618372112 de la biblioteca universal--. El receptor introduce en su generador de la biblioteca universal y se produce el texto completo. Es decir no es necesario almacenar toda la biblioteca en ningún disco duro (altamente improbable) simplemente citando el número de orden del libro que nos interese se genera exclusivamente ese.

Yo ya tengo un par de prototipos de generadores de texto en perl. Y me han dado una beca para continuar experimentando por ahí (para los curiosos estoy implementado un sistema recursivo primero genero todas las palabras posibles de 5 o menos letras, a partir de ahí todas las frases posibles y así en adelante). Os pongo un prototipo.
perl -e 'for($_="aaaaa"; $_ ne "zzzzz"; $_++) {print "$_\n";}'


Ahí quedó.

PD: Antes de plantearte contestar fubibundamente a este mensaje he de decir que aunque es cierto es absolutamente falso. Es cierto , salvo de transcripción, en la cuantificación del tamaño de la biblioteca universal tal y como se explica en el relato de Lasswitz. Es falso en la extrapolación y aplicaciones prácticas del invento en la era digital.

El usar un código cíclico es un sistema de reducir la información pero no es un buen sistema de compresión. Fijaros que si quiero transmitir el número 2 (010 en binario) tengo que decir "Mira el offset 6 (110) de la cadena cíclica. El índice o indicador 6 ocupa 3 bits al igual que el número 2. Luego para transmitir de forma milagrosa el quijote, habría que indicar un número índice tan grande como el propio libro de el quijote. ¡Vaya ahorro! Además la cadena cíclica propuesta es poco compresible por medios tradicionales (zip y otros) porque todas las combinaciones son equiprobables y, como sabemos, estos sistemas se aprovechan de las repeticiones.

Como atopos ha utilizado la palabra palimpsesto dos veces sin poner su definición, ahora yo voy a hacer lo mismo y así entre los dos mejoramos la cultura de los lectores de Libertonia: Alcorque, Alcorque y Trébede, Trébede.

-----
- Porque mañana será un gran día.



El marciano que llegó del frío. (5.00 / 1) (#6)
por jamarier a las Mon Jun 21st, 2004 at 09:56:52 PM CET
(Información Usuario) http://barbacana.net/blog/

El siguiente relato es de Martín Gardner (lo escribo de cabeza) es está relacionado con información y compresión:

Un día llegó un marciano a la tierra diciendo «buenos días» soy un enciclopedista y necesito un compendio de toda el conocimiento de la humanidad. Se reunió un comité de científicos y determinaron que la enciclopedia britanica podia ser lo que el Marciano podia necesitar así que le dieron un DVD [N.T. en el original eran los 30 tomos de papel, hay otras pequeñas modificaciones en el texto para hacerlo más creible en la actualidad] pero el marciano dijo que no podía llevar eso porque era demasiado pesado y voluminoso; pero que no se preocuparan

El marciano sacó su Mac, pidió una cerilla y metió el DVD por una ranura y la cerilla por un agujero. Dijo aquí está toda la información del DVD.

Los científicos preguntaron al marciano cómo podría ser eso y la respuesta fué: he puesto todos los bytes del DVD uno a continuación del otro haciendo un número muy largo, al que he antepuesto u cero y una coma delantes, obteniendo un número decimal y finito entre 0 y 1. Mi Mac ha marcado con precisión suficiente, 1 marca en la cerilla de forma que cuando llegue a mi planeta mediremos la longitud entre cada extremo y la marca y al dividir la menor longitud por la mayor obtendremos el número decimal original que nos permitirá grabar un DVD allí.

Suponiendo que podemos hacer marcas de precisión atómica ¿Cuál sería la capacidad de una Cerilla?

P.D: Ah, aquiescencia, aquiescencia

-----
- Porque mañana será un gran día.
[ Padre ]



 
Borges: de ruido, nada (none / 0) (#8)
por atopos a las Tue Jun 22nd, 2004 at 01:46:54 AM CET
(Información Usuario) http://los-pajaros-de-hogano.blogspot.com

Pues creo que mentar a Borges en relación con la historia está pero que muy bien. Lo que se cuenta en una parte de ella es una de las obsesiones de Borges, uno de los escritores de relatos cortos que más admiro.

Si Borges hubiera vivido lo suficiente, quiza hubiese escrito algo sobre Internet en la línea del relato que citas, o de estos dos, entre otros muchos, que ahora se me vienen a la cabeza:

Tlön, Uqbar, Orbis Tertius

El jardín de senderos que se bifurcan

De lo de Perl y tus experimentos ya te escribiré algún día. Me fascina ese tema.

[ Padre ]


Más Borges (none / 0) (#9)
por porras a las Tue Jun 22nd, 2004 at 10:04:17 AM CET
(Información Usuario) http://www.lacoctelera.com/porras

También algo relacionado (aunque menos, va por la vastitud de combinaciones posibles en un conjunto dado lo suficientemente grande, cosa que a mí, como buen iletrado en matemáticas, me sigue pasmando) está otro relatito que a mí me gusta mucho, la lotería en Babilonia. Qué grande sos, Borges.

Por cierto, y cambiando radicalmente de tema, ¿soy en único que flipa con el nivel intelectual de algunos libertonianos? De verdad que es un gustazo leeros hablar casi de cualquier tema, casi acojona abrir uno la boca...

--
Con las cosas que no sé, se podrían escribir 10.000 Enciclopedias Británicas.
[ Padre ]


Y no olvidéis... (none / 0) (#11)
por davinci (davinci at ecol org) a las Wed Jun 23rd, 2004 at 08:47:58 AM CET
(Información Usuario)

El congreso, uno de esos relatos que, en su simplicidad, muestran lo complejo del mundo desde una perspectiva sorprendente.


¡Es la guerrrrrrra!
[ Padre ]


 

La proliferación de la información en la era Internet | 12 comentarios (12 temáticos, editoriales, 0 ocultos)
Ver: Modo: Orden:
Menu
· crear cuenta
· FAQ
· búsqueda
· Fuentes de Noticias

Login
Nueva cuenta
Usuario:
Contraseña:

ecol Logo Powered by Scoop
Todas las Marcas Registradas y copyrights de esta página son propiedad de sus respectivos dueños.
Los comentarios son propiedad del que los escribe.
Los iconos de las noticias y el logotipo son propiedad de Javier Malonda.
El Resto © 2002 Escomposlinux.org y aledaños.

Puedes sindicar los contenidos de libertonia en formato RSS 1.0 y RDF 0.9. También se puede sindicar la cola de envíos pendientes de moderación.

El proyecto escomposlinux.org está dedicado a la memoria de tas

crear cuenta | faq | búsqueda