Libertonia
Portada · Todo · Software Libre · Desarrolladores · Comunidad · Internet · Tecnología · Meta · Diarios
La proliferación de la información en la era Internet

Debates
Por atopos
departamento vértigo-al-infinito , Sección Software Libre
Puesto a las Mon Jun 21st, 2004 at 01:54:58 PM CET
Una de las características destacadas de la era de Internet, tal como la conocemos hoy, es la descomunal producción y difusión de información y conocimiento que las nuevas tecnologías favorecen.

 


Es cierto que avances técnicos previos al ordenador, el acceso cada vez mayor de grandes sectores de la población a la cultura, que tiene lugar sobre todo en la segunda mitad del siglo XX, y otros factores socio-culturales y económicos procuraron la posibilidad de un intercambio a gran escala de información y conocimiento. Basta, por ejemplo, con pasarse por una gran libería para reconocer, sin ningún genero de duda, que la cantidad de libros almacenados en sus anaqueles durante un sólo año supera las posibilidades de recepción de una vida entera. Y basta ---por continuar con otro ejemplo--- con revisar la bibliografía existente sobre un campo muy especializado de un ámbito de conocimiento cualquiera para reconocer la imposibilidad de leer aunque sea una mínima parte de ese legado.

Con Internet esta situación llega a un extremo vertiginoso. ¿Cuántas páginas indexa Google? ¿Cuántos productores de conocimiento pueden ser enumerados como creadores activos de la red de redes? Nos movemos, sin duda, en cifras astronómicas. Y esto no ha hecho más que empezar.

Defender la libre diseminación del conocimiento parece algo indiscutiblemente bueno, por muchas razones que no voy a enumerar aquí.

Pero del mismo modo que han de ser fomentados los esfuerzos en esta dirección, es necesario empezar a plantearse el problema que la proliferación indiscriminada de conocimiento puede provocar, y empieza a provocar ya.

Hoy en día la Red mundial es una especie de palimpsesto cuasi-infinito de información interconectada por una inextricable red de relaciones. Si un hipotético historiador del futuro acometiese la tarea de descifrar este palimpsesto dinámico, continuamente cambiante y en continua ampliación, caería en un vértigo mortal que le paralizaría.

Signos de esta misma parálisis pueden observarse en tendencias aparentemente irrelevantes como la de almacenar en el disco duro ese vínculo o ese artículo que nunca visitaremos o leeremos, por miedo a perdernos algo importante; o aquella otra de vagar de aquí y allá durantes horas en busca de algo de lo que ni siquiera podríamos asegurar su conveniencia. Estos comportamientos no son en el fondo sino síntomas leves de un problema más grave: la dificultad ---quizá habría que decir imposibilidad--- de catalogar, organizar, filtrar y asimilar adecuadamente la ingente cantidad de información que tenemos hoy en día ante nosotros.

Pero la información en sí misma no es suficiente. Es necesario encontrar un medio para hacerla nuestra, al menos potencialmente.

Hay, es cierto, trabajos en esta dirección: el propio Google u otras arañas semi-inteligentes son formas de clasificar primitivamente la información. En otros ámbitos más especializados proyectos como DOAJ o las correspondientes infraestructuras ---ver, por ejemplo, OAI--- tratan de proporcionar sistemas de organización eficaces.

No obstante, existe todavía el problema del filtrado. Entiendo por esto lo siguiente: aunque construyeramos bases de datos extraordinariamente comprehensivas y perfectamente organizadas, una busqueda, aun compleja, en esas bases de datos arrojaría todavía demasiados registros y, en un futuro no muy lejano probablemente, tantos como para marear al más equilibrado de los usuarios. ¿Quién decidiría sobre la calidad y / o pertinencia de cada uno de esos registros? ¿Nos conformaríamos con una mera estadística hecha a partir de la valoración de los usuarios? ¿Y si nuestro punto de vista y nuestra forma de evaluar es diferente de la mayoría? ¿Estaríamos dispuestos a ceder la responsabilidad al experto de turno, que como humano que es tiene también sus preferencias personales y sus gustos completamente subjetivos? ¿Veríamos con buenos ojos una especie de Canon como los que ahora están de moda en contextos literarios?

Yo, en particular, no tengo respuesta a estos problemas. Pero se me ocurre otra forma de acercarse a la cuestión, que esbozaré sólo en sus líneas generales.

El problema de lo que he llamado proliferación indiscriminada de información es una consecuencia de la multiplicación ad infinitum del número de productores de conocimiento. Cada productor es sujeto posible de una serie relativamente limitada de obras, pero en el concepto tradicional ---esto es, moderno--- de producción subyace la idea de la atribución de un producto a un creador. Si el número de creadores tiende a infinito, también tiende a infinito el de creaciones. Ahora bien, si somos capaces de concebir la creación no como una relación de uno-a-uno entre el creador y su obra, sino como una relación de muchos-a-uno, el problema podría desaparecer, al menos paliarse.

El modelo de desarrollo del software libre, tanto en su aplicación al software en concreto, como a otros terrenos ---wikies de mayor o menor alcance--- muestra aquí, de nuevo, su originalidad y sus ventajas. En mi opinión una gran parte del éxito de Linux radica en este hecho. Dicho de otra forma, si cada desarrollador hubiera creado su propio sistema operativo ---cosa nada fácil para un solo hombre, entiéndase no obstante el sentido del ejempo---, nada sabríamos de este software. El encadenamiento de esfuerzos dirigidos a una única meta no sólo tiene la ventaja de la calidad suficientemente contrastada, sino el de evitar la disolución del producto en el marasmo, potencialmente infinito, de otros productos semejantes.

Sabemos ---aquí en Libertonia se ha recordado varias veces--- que este modelo de desarrollo no es nada nuevo, pues es sustancialmente el mismo que ha seguido la ciencia históricamente. Pero conviene recordar ---al menos así lo creo yo--- su importancia y las consecuencias que una aplicación de la teoría artística del genio ---el modelo contrario--- pudiera tener en la era de Internet.

¿Cómo veis vosotros este asunto? ¿Os parece que es solo una tendencia a lo apocalíptico lo que promueve mis temores? ¿Veis otras opciones?

< Las patentes de Microsoft (14 comments) | Sun libera Looking Glass (13 comments) >
Enlaces Relacionados
· Google
· DOAJ
· OAI
· More on Debates
· Also by atopos

Menu
· crear cuenta
· FAQ
· búsqueda
· Fuentes de Noticias

Login
Nueva cuenta
Usuario:
Contraseña:

Ver: Modo: Orden:
La proliferación de la información en la era Internet | 12 comentarios (12 temáticos, editoriales, 0 ocultos)
La biblioteca universal. (4.33 / 3) (#5)
por jamarier a las Mon Jun 21st, 2004 at 09:23:02 PM CET
(Información Usuario) http://barbacana.net/drupal/

Tal y como lo veo, el problema no es la información que existe en internet. El problema es la des-información que existe. O dicho con términos ingenieriles, la relación señal/ruido. A mi cada vez me cuesta más encontrar información útil. Porque cuando tengo necesidad de cierta información concreta cada vez me sale más información menos útil ¿quién de los que usamos LaTeX no le a pasado que al buscar información en google nos remite a páginas pornos de fetichistas? Y si al menos fueran buenas...

Para aumentar el nivel de ruido de internet voy a aportar dos enlaces a dos relatos cortos sobre la información. El primero es de Jorge Luís Borges y se titula "La Biblioteca de Babel" y da una visión (como no podría ser de otra forma) poetica del asunto. Sobre esta idea tenemos un relato anterior de Kurd Lasswitz llamado "La Biblioteca Universal" que trata del tema de forma mucho más didactica y desenfadada.

Ambos relatos hablan de libros de papel debido a la antigüedad de los mismos (el más antiguo data de 1901) pero podríamos hacer una versión digital moderna: si determinamos que cualquier obra escrita puede ser en 1 mebibyte de espacio (realmente el espacio es indiferente, ya que podría existir un segundo tomo que se llame 2ª parte de ... y hasta 3ª y 4ª...) podremos determinar que la cantidad de libros distintos posibles es 256^1048576. Cantidad que mi calculadora se ha negado a calcular.

Además, para liar un poco más la marrana, esta información se puede comprimir B-). Pongamos por simplificar que queremos tener todas las combinaciones de 3 bits, estas son:
000,001,010,011,100,101,110,111

hemos utilzados para describirlas 3*8 digitos. Mucho desperdicio. Hagamos un código cíclico:
00011101

si suponemos que el final está enlazado con el inicio, tomando 3 digitos consecutivos en orden ¡obtenemos todas las combinaciones!
(veamos: 000,001,011,111,110,101,010,100)

con este sistema se ha "comprimido la información 8 veces. Empleando el sistema en los ficheros anteriores, reduciríamos en 1048576 veces el tamaño de nuestra biblioteca. Y ahora podemos aplicar un sistema de compresión estándar sin pérdida tipo rar, bz2 o el que queramos.

La producción de estos libros es de forma absolutamente determinista. De forma que para referirnos a un libro nos basta con indicar el número de orden de generación en nuestra biblioteca. Si en ambos extremos se tiene el mismo programa generador, bastaría con decir: --oye el Quijote está muy bien es el libro #1284618372112 de la biblioteca universal--. El receptor introduce en su generador de la biblioteca universal y se produce el texto completo. Es decir no es necesario almacenar toda la biblioteca en ningún disco duro (altamente improbable) simplemente citando el número de orden del libro que nos interese se genera exclusivamente ese.

Yo ya tengo un par de prototipos de generadores de texto en perl. Y me han dado una beca para continuar experimentando por ahí (para los curiosos estoy implementado un sistema recursivo primero genero todas las palabras posibles de 5 o menos letras, a partir de ahí todas las frases posibles y así en adelante). Os pongo un prototipo.
perl -e 'for($_="aaaaa"; $_ ne "zzzzz"; $_++) {print "$_\n";}'


Ahí quedó.

PD: Antes de plantearte contestar fubibundamente a este mensaje he de decir que aunque es cierto es absolutamente falso. Es cierto , salvo de transcripción, en la cuantificación del tamaño de la biblioteca universal tal y como se explica en el relato de Lasswitz. Es falso en la extrapolación y aplicaciones prácticas del invento en la era digital.

El usar un código cíclico es un sistema de reducir la información pero no es un buen sistema de compresión. Fijaros que si quiero transmitir el número 2 (010 en binario) tengo que decir "Mira el offset 6 (110) de la cadena cíclica. El índice o indicador 6 ocupa 3 bits al igual que el número 2. Luego para transmitir de forma milagrosa el quijote, habría que indicar un número índice tan grande como el propio libro de el quijote. ¡Vaya ahorro! Además la cadena cíclica propuesta es poco compresible por medios tradicionales (zip y otros) porque todas las combinaciones son equiprobables y, como sabemos, estos sistemas se aprovechan de las repeticiones.

Como atopos ha utilizado la palabra palimpsesto dos veces sin poner su definición, ahora yo voy a hacer lo mismo y así entre los dos mejoramos la cultura de los lectores de Libertonia: Alcorque, Alcorque y Trébede, Trébede.

-----
- Porque mañana será un gran día.



motivaciones y demás (4.00 / 2) (#3)
por thibaut (asp16 [ykwim] alu.ua.es) a las Mon Jun 21st, 2004 at 05:57:58 PM CET
(Información Usuario)

El encadenamiento de esfuerzos dirigidos a una única meta no sólo tiene la ventaja de la calidad suficientemente contrastada, sino el de evitar la disolución del producto en el marasmo, potencialmente infinito, de otros productos semejantes. [...] y las consecuencias que una aplicación de la teoría artística del genio ---el modelo contrario--- pudiera tener en la era de Internet.
La teoría artística del genio doesn't scale, pero motiva más (al menos de momento). Y lo que toca ahora es darse cuenta de ello.

Lo que quiero decir es que, si esa relación uno a muchos creación-autor va siendo cada vez más frecuente, es porque esos muchos autores han transferido su motivación de «haber hecho esto yo» a «uno, se ha conseguido hacer esto, dos, he participado en ello». Bajando al ejemplo concreto, en el desarrollo de Linux han participado y participan personas muy inteligentes, y seguro que muchas de ellas tienen un ego no pequeño que satisfacer. Pero han conseguido que el hecho de tener Linux tal y como es hoy compense con creces el típico «Yo crearé el mejor S.O. que se haya visto...»

Cuando yo empecé a hacer pequeñas colaboraciones al S.L., para mí era importane obtener algún tipo de reconocimiento. Hoy, no negaré que me sigue gustando, pero algo ha cambiado en mí porque ahora ya la mayoría de las veces me basta con haber mejorado algo, aunque sea de forma invisible.

Creo ciertamente que este cambio le ocurre a mucha gente que entra en el modelo de creación colaborativo (uno a muchos), y que la capacidad para operar este cambio es clave para el éxito de este modelo.

Más o menos.



Referencia o conocimiento (3.50 / 2) (#7)
por man ls a las Mon Jun 21st, 2004 at 10:36:17 PM CET
(Información Usuario)

Esto me parece una especulación interesante, así que me meto al trapo. (Quiero decir que lo que sigue es mi humilde opinión, y además por lo largo.)

Yo pienso que el conocimiento no deja de ser una ilusión. Por poner un ejemplo: supongamos que quiero saber todo lo que se puede saber sobre las patatas. Google me devuelve 221,000 referencias sobre patata, y 224,000 sobre patatas. Sobre potato son ya 4 millones y pico (3 y pico para potatoes). Pero no me creo ni de broma que todas hablen sobre la especie solanum tuberosum; hay miles de expresiones coloquiales que incluyen estas palabras: "menuda patata", "no sabes ni patata". Si me pongo pijo y busco "solanum tuberosum", seguramente me esté perdiendo mucha información escrita por gente que usa el término coloquial.

Así que me voy a la wikipedia y vuelvo a buscar, me encuentro con página y media de información (en inglés 5 o 6), o sea nada en comparación. ¿No me resulta más fácil ir a la librería y comprar un libro sobre el aspecto que más me interese: el cultivo, la cocina o la historia de la patata? ¿O a una biblioteca, si además quiero disponer de material variado?

Sin embargo, como apunta atopos, entonces el problema es que tengo que fiarme del tipo que escribió el libro (la "autoridad"), o contrastar cada dato con fuentes independientes. Vamos, a la vieja usanza.

Yo creo que el meollo de la cuestión está en que un experto puede decirme que no sabe algo. Sin embargo, Google no. Yo me doy cuenta de que no encuentro lo que busco, pero sigo con el gusanillo de si el dato que me falta no estará por ahí en algún sitio esperándome, cuando a lo mejor nadie lo sabe.

¿Conocéis Google Answers? Es un intento de la compañía estrella hoy día para dar un servicio más completo a los que buscan información. No sé qué tal les irá, pero sospecho que no muy bien -- por $50, $100 o $200 tienes a un tío haciendo búsquedas sobre el tema que te interesa. Me parece poco interesante: para eso busco yo gratis.

Una cosa distinta es para cierto tipo de obras de referencia. No conozco en papel nada parecido a the Internet Movie Database, donde se encuentra una cantidad ingente de información sobre todas las películas que uno se pueda imaginar, y actualizada al minuto. Por poner otro ejemplo, vienen 220 películas de José Luis López Vázquez -- sólo como actor. Además viene que ha hecho de director adjunto e incluso diseño de vestuario.

En este caso, la autoridad es la propia IMDb. No por nada, sino por los millones de contribuciones de usuarios (y al principio funcionaba sólo así). Muchas veces he echado de menos algo parecido, pero de música: que vengan todos los discos que ha hecho no-se-quién, en qué grupos ha estado, y qué tocaba.

A lo mejor es algo así a lo que se refiere atopos. Cada uno pone su granito de arena, y entre todos conseguimos el recurso definitivo sobre algo. Creo que tiene sus propios problemas, pero dejo ya de dar la paliza.



Física (3.00 / 1) (#1)
por sanko (jsancho@aditel.org) a las Mon Jun 21st, 2004 at 08:30:50 AM CET
(Información Usuario) http://www.jsancho.org/

Es imposible luchar contra la entropía ;-)



La proliferación de la información en la era Internet | 12 comentarios (12 temáticos, editoriales, 0 ocultos)
Ver: Modo: Orden:

ecol Logo Powered by Scoop
Todas las Marcas Registradas y copyrights de esta página son propiedad de sus respectivos dueños.
Los comentarios son propiedad del que los escribe.
Los iconos de las noticias y el logotipo son propiedad de Javier Malonda.
El Resto © 2002 Escomposlinux.org y aledaños.

Puedes sindicar los contenidos de libertonia en formato RSS 1.0 y RDF 0.9. También se puede sindicar la cola de envíos pendientes de moderación.

El proyecto escomposlinux.org está dedicado a la memoria de tas

crear cuenta | faq | búsqueda