Libertonia
Portada · Todo · Software Libre · Desarrolladores · Comunidad · Internet · Tecnología · Meta · Diarios
No me gustan la Sindicación (los RSS)

jamarier's Diary
Por jamarier
departamento Comite por una red mejor , Sección Diarios
Puesto a las Fri May 21st, 2004 at 02:09:15 PM CET

Antes de que empeceis a tirar piedras, diré que el título fué escogido por sensacionalista. No por porque sea exactamente mi pensamiento. Ahora que tengo vuestra atención puedo desarrollar la idea:

[Nota del autor: Tenía una preciosa introducción sobre el tema, pero superaba el límite de palabras, así que hago un feo resumen aquí para el que no quiera leer la noticia completa y el resto en el cuerpo de la misma: la utilidad que proporcinal la sindicación me parece buena. la implementación no.]

 


Existe una posible clasificación de las páginas web:

  1. Las que generan información. Pueden tener una tematica más o menos definida, pero el contenido exacto de cada noticia o información no se sabe hasta que no se publica. Esta publicación puede ser «síncrona» o «asíncrona» es decir, publicarse de forma regular en el tiempo o cuando le da la gana a los mantenedores. Las web de noticias como libertonia, weblogs y otras están en esta categoría.
  2. Las que tienen información a consultar. Solo visitamos dichas páginas cuando necesitamos una información y sabemos que la vamos a encontrar ahí: los buscadores como google o imdb están entre ellas.
  3. Las páginas de nuestros amigos que las actualizan cuando les da la gana. Con minutos, dias o meses entre cada actualización. Como por ejemplo la mía propia
(Por supuesto estas categorias se solapan en mayor o menor medida).

La idea es buscar un mecanismo para estar al tanto de cuando se producen cambios en los casos 1 y 3 sin tener que hacerlo nosotros manualmente. Aquí entra el «Fabuloso mundo de la sindicación» (los RSS).

(No voy a dar definiciones precisas, porque tampoco son necesarias. Además aunque aquí emplee el término RSS, os comentaré que es uno de los distintos formatos disponibles para la sindicación, otros son RDF, atom y no se que más.)

Visto desde fuera, la sindicación es lo siguiente: Cuando una página web te gusta y ofrece posibilidades de sindicación, tu la activas y cada vez que cambia la página automáticamente te avisan los cambios con un pequeño resumen de dicho cambio. ¡Prueba superada!

Desde dentro la realidad es bien distinta: las páginas que ofrecen sindicación, son aquellas que tienen a disposición de los usuarios de un fichero resumen de si misma (en el formato RSS u otro). Cada vez que se actualiza la página se hace consecuentemente lo mismo con el resumen. Cuando un usuario se sindica lo que hace es suministrar a un programa (el lector de RSS) la dirección de dicho resumen. La misión del lector es cada cierto tiempo bajarse el resumen y compararlo con un resumen previamente bajado. Si existen diferencias se las comunica al usuario.

Se supone que esto anterior lo debe saber todo el mundo que lee libertonia. Quizás el siguiente apartado no lo sepa ya tanta gente:

En la electrónica digital y en la informática existen 2 sistemas de controlar recursos externos (los perifericos): el poll y las interrupciones. En el primer caso, el micro deja de trabajar cada cierto tiempo para preguntar a cada periférico si tiene alguna información nueva que suministrar, espera la respuesta de cada periférico y sigue trabajando con lo suyo. En el segundo caso, el micro trabaja sin parar y cuando un periférico tiene nueva información este manda al micro una petición de interrupción («oye, cuando puedas te paras y miras lo que te tengo»). Este, cuando puede se para y atiende a la petición.

En función de las necesidades y la simplicidad requerida del diseño, se emplea un sistema u otro. El poll es bastante simple de utilizar. Aunque tiene 2 inconvenientes: el micro deja de trabajar para consultar cosas (perdida de potencia) y los buses de comunicaciones se llenan de mensajes del tipo: "¿tienes algo para mí?", "no". El sistema de interrupción en cambio tiene un inconveniente: es más complejo de implementar periféricos inteligentes.

Volvamos al mundo de la sindicación. Como podreis suponer, todo el sistema de la sindicación se efectuan por llamadas tipo poll. Esto significa que estamos bajandonos a nuestro equipo resumenes que en la mayoría de los casos no varía con respecto lo que ya teníamos. Es cierto que los resumenes, como su nombre indica, no pesan tanto como las páginas web completas, pero los lectores comprueban cada muy poco tiempo (30 minutos, 1 hora aprox) si ha habido variación. Con lo cual al cabo del día lo descargado llega a ser superior a visitar la página web.

Hay un segundo aspecto a tener en cuenta. La multiplicidad de usuarios. Si muchos usuarios te sindican, significa que muchos robots van a bombardear el servidor para conseguir el resumen cargando constantemente el equipo. Recientemente he leido (lo siento, no recuerdo el enlace) de una página que retiraba el RSS de su web. Había muerto de éxito. Tenía tantas peticiones de RSS que le hundían el servidor.

No me gusta la sindicación

En general mueve mucha información que no sirve para nada. Sobrecarga innecesariamente al cliente y al servidor. Consume ancho de banda.

Solución, la generación de eventos de cambio de página o fórmulas híbridas.

  • Generación de eventos o suscripción. Determinar algún sistema para que la página web pueda emitir un aviso de que ha variado (por correo electrónico y otro sistema a determinar) esto permite la serialización en los avisos: Si una web puede dar 10 páginas por minuto y tiene a 100 personas suscritas, puede avisar a cada persona con 6 segundos de intervalo. Así evita que 100 personas o robots accedan simultáneamente a la página.
  • Fórmulas híbridas. Es el sistema que yo empleo en este momento. En vez de tener un lector de RSS particular, me he suscrito a un robot jabber: jabrss@jabber.at Este robot, es un lector RSS que hace las consultas via RSS. Cuando hay variaciones en una de las páginas web, me envia un mensaje y me lo comunica. ¿Cuál es la ventaja respecto al método directo? Si 2 personas que usan el servicio están suscritos a la misma página web no hace falta dos peticiones del RSS. Imaginad el ahorro para 10 o 100 usuarios. Creo que http://www.syndic8.com (no los voy a enlazar porque no se lo merecen B-P ), tambien tiene un servicio similar aunque cobran ¡¡$25!! por la sindicación de una página web durante ¡una semana!

Para terminar, la idea es que hay que intentar ser respetuosos con los servicios que nos ofrecen desde internet para no agotar los recursos de los que los ofrecen gratuitamente. El uso de lectores «comunitarios» frente a los personales, es una buena medida de cortesía.

< Introducción a Subversion (8 comments) | De GNOME a KDE (57 comments) >
Enlaces Relacionados
· escomposlinux.org
· libertonia
· google
· imdb
· More on jamarier's Diary
· Also by jamarier

Encuesta
Tu sindicas...
· No sindico, visito regularmente las páginas que me interesan (1 vez/día o menos) 15%
· No sindico, visito compulsivamente las páginas que me interesan (más de 1 vez/día) 53%
· Sindico con programa personal pero intervalos de consulta del robot de 1 vez/día o menos 7%
· Sindicación programa personal de forma intensiva (más de 1 vez/día) 23%
· Lo que diga la rubia, digo^U Uso algún sistema de sindicación comunitaria 0%

Votos: 13
Resultados | Otras Encuestas

Menu
· crear cuenta
· FAQ
· búsqueda
· Fuentes de Noticias

Login
Nueva cuenta
Usuario:
Contraseña:

Ver: Modo: Orden:
No me gustan la Sindicación (los RSS) | 15 comentarios (15 temáticos, editoriales, 0 ocultos)
If-Modified-Since y Last-Modified. Poll y más (none / 0) (#1)
por jorginius ("jorginius" en Google Mail) a las Fri May 21st, 2004 at 08:16:29 PM CET
(Información Usuario) http://www.rodriguezmoreno.com

Esto significa que estamos bajandonos a nuestro equipo resumenes que en la mayoría de los casos no varía con respecto lo que ya teníamos.

No te los bajas de nuevo, a menos que el programador del cliente de sindicación y/o el administrador de la web sindicado hayan metido la pata. Se espera que con la sindicación uses GET condicionado a la fecha del último cambio en el resumen.

Del lado del cliente descargas la primera vez y de la respuesta que te da el servidor te quedas con la cabecera Last-Modified. Al siguiente intento, el cliente debería incluir en su petición una cabecera If-Modified-Since con el último valor de Last-Modified que obtuvo: en caso de que no haya habido cambios desde entonces, el servidor responderá con un 302 y no despachará de nuevo el resumen.

Esa es la idea, pero puede que el cliente esté mal escrito ignore las pistas que le da el servidor y se empeñe en volver a descargar lo que ya tiene. También puede ocurrir que el servidor esté mal configurado y o bien no incluya Etag y Last-Modified en sus respuestas o bien mienta en esos campos. Esto último es bastante común en todos esos servidores configurados mal apropósito para ¿boicotear? el proxy transparente de Telefónica (y cualquier otro proxy, de paso).

Por otra parte, la puntilla pedante:

El poll es bastante simple de utilizar. Aunque tiene 2 inconvenientes: el micro deja de trabajar para consultar cosas (perdida de potencia) y los buses de comunicaciones se llenan de mensajes del tipo: "¿tienes algo para mí?", "no".

Depende, no siempre "se pierde potencia". En ocasiones el mecanismo de poll es el más eficiente. Una interrupción implica un cambio de contexto y los cambios de contexto son caros en tiempo. En un sistema monoproceso gana de calle el polling frente a las interrupciones (quizás no en consumo, pero si en velocidad de respuesta) y en un sistema multiproceso puede que el polling sea una buena idea si el dispositivo es más rápido que un cambio de contexto, o si es crítico actualizar una salida lo más deprisa posible en función de lo que leamos de un dispositivo.



Más lectores comunitarios (none / 0) (#2)
por filete a las Fri May 21st, 2004 at 08:17:32 PM CET
(Información Usuario) http://adobo.org

Buenas, precisamente hace 3 ó 4 días me metí un poco más en el tema. La razón es que leí en microsiervos.com que se había lanzado un lector vía web de RSS, programado por dos personas, Feedmanía. Es un servicio al estilo bloglines, aunque este último no lo he usado. Por si a alguien le interesa probar Feedmanía, he de decir que va muy bien, no tiene publicidad y... cumple con su función.

En cuanto a mi opinión acerca de los RSS, pues tengo básicamente la misma que tú. Yo creo que el problema es que, al transmitirse XML, hay un tráfico excesivo. Es algo parecido a lo que ocurre con Jabber, algo que creo que se ha discutido y se discutirá siempre acerca de él: el uso de XML es una ventaja pero a la vez una desventaja, por el ancho de banda que consume.

Volviendo al tema original, creo que hasta que no se invente algo mejor, RSS cumple su cometido, ya que hace la visita a tus webs preferidas más cómoda.

Un saludín

---
Estoy en mi salsa...


RSS Reader para Firebird/Firefox (none / 0) (#14)
por jcantero (jcantero@agujero-negro.escomposlinux.org) a las Sun May 23rd, 2004 at 11:02:34 AM CET
(Información Usuario) http://www.escomposlinux.org/jcantero/

Je, tu mensaje me ha motivado a echar un vistazo para ver si había salido alguna nueva herramienta de lectura de RSS, y me he encontrado en el Wiki de la Blogosfera con el RSS Panel Reader para Firebird (0.7) y Firefox (0.8). Muy fácil de instalar y configurar, y sólo hace peticiones --salvo que lo configures de otro modo-- cuando tú le digas. ¿Alguien más lo ha probado?

--
"Papá, ¡Internet es más que una red pornográfica global!" -- Lisa Simpson


 
A favor de la sindicación (none / 0) (#15)
por RinzeWind (chema AT sl-form DOT com) a las Sun May 23rd, 2004 at 10:10:16 PM CET
(Información Usuario) http://chema.sl-form.com

Pero con un poquito de control, como todo. Yo tengo ahora mismo sindicados (entre blogs y sitios de noticias) unas 60 webs. Lógicamente no me voy a pasar todos los días por ellas para ver si se han actualizado (ni siquiera tengo la mayoría en mis bookmarks. Si quiero monitorizar alguna, la añado al Liferea y a correr).

Lo único que hay que tener es un poco de sentido común y no recargar los feeds cada rato. Con una vez que se recarguen al día (que es lo que hago yo) va que arde. Algunos sitios incluso te niegan el acceso al feed si ven que abusas (creo que Slashdot lo hace si refrescas cada menos de media hora, aunque ahora mismo no recuerdo dónde vi eso).

--
Las Penas del Agente Smith


 
No me gustan la Sindicación (los RSS) | 15 comentarios (15 temáticos, editoriales, 0 ocultos)
Ver: Modo: Orden:

ecol Logo Powered by Scoop
Todas las Marcas Registradas y copyrights de esta página son propiedad de sus respectivos dueños.
Los comentarios son propiedad del que los escribe.
Los iconos de las noticias y el logotipo son propiedad de Javier Malonda.
El Resto © 2002 Escomposlinux.org y aledaños.

Puedes sindicar los contenidos de libertonia en formato RSS 1.0 y RDF 0.9. También se puede sindicar la cola de envíos pendientes de moderación.

El proyecto escomposlinux.org está dedicado a la memoria de tas

crear cuenta | faq | búsqueda