Libertonia
Portada · Todo · Software Libre · Desarrolladores · Comunidad · Internet · Tecnología · Meta · Diarios
Ver: Modo: Orden:
Programas de radio | 21 comentarios (21 temáticos, editoriales, 0 ocultos)
Se puede reducir (4.00 / 2) (#6)
por jorginius ("jorginius" en Google Mail) a las Tue Jan 6th, 2004 at 02:23:23 AM CET
(Información Usuario) http://www.rodriguezmoreno.com

El tamaño del archivo de audio se puede reducir a la mitad, sin pérdidas apreciables, usando el codec Speex y bitrate variable.

Por si alguien no lo conoce (supongo que Envite :-)), Speex es un codec libre (libre de royalties y de patentes) especializado en el tratamiento de la voz y apto para trabajar a bajísimos bitrates. Quizás no es tan popular como su hermano mayor Vorbis pero no le anda detrás en calidad siempre que, por supuesto, no lo saquemos de la compresión de voz.

Para convertir la entrevista de MP3 a Speex he hecho lo siguiente:

$ mpg321 2003.12.17.mp3 -w - | \
	speexenc --vbr - 2003.12.17.spx
Hay más opciones para el que quiera apurar un poco más la compresión. La salida del mpg321 se ha escogido wav por comodidad, por no tener que especificar el ancho de banda como argumento de speexenc. El formato de archivo spx no es más que el mismo contendor ogg de siempre.

La comparativa entre los dos archivos:
  • 2003.12.17.mp3: 7.0 MB
  • 2003.12.17.spx: 3.4 MB
Para escucharlo podemos usar mismamente speexdec o xmms, no conozco más reproductores con soporte para este codec. Para Windows existe al menos un plugin dde Speex para Winamp.

En resumidas cuentas, pienso que las posteriores entregas deberían estar codificadas con Speex. porque, sobre todo con audio digitalizado a una frecuencia de muestreo adecuada (no como la del ejemplo), el tamaño es mucho menor.

[ Padre ]


Las casualidades de la vida... (3.00 / 1) (#17)
por jamarier a las Wed Jan 7th, 2004 at 06:06:01 PM CET
(Información Usuario) http://barbacana.net/blog/

En estos dias, yo también he estado buscando informacion sobre el codec speex.

Ogg al igual que Avi es un formato contenedor. Es decir, que dentro de la extructura de un avi podemos encontrar compresion divX, mpg2, indeo o cualesquiera que se llame. Como decia Ogg también es contenedor; aunque estamos acostumbrados a decir fichero ogg de sonido cuando lo más correcto sería hablar de ogg vorbis (el «equivalente» a mp3). Existen otros dos formatos que pueden ser interesantes conocer: uno es flac un formato de compresión de sonidos sin perdidas, equivalente por tanto a un wav que estuviese comprimido y el otro formato que es del que quería hablar: speex preparado para grabación de voz.

El contenedor ogg tiene una serie de características muy interesantes que hereda speex (ya sería tema para un artículo) Aunque voy a citar una que me resulta especialmente interesante (ojo: explicacion simplista): Cuando se emite una señal de alta calidad, realmente se está emitiendo una señal de calidad peor más un añadido que permite «mejorar» la señal para que sea de alta calidad. Esto permite que con un solo flujo de datos estamos emitiendo simultáneamente en todas las calidades posibles. Y es el receptor el que en función de su capacidad de decodificación selecciona cuanta señal usa en cada ocasión para generar el sonido ( y por tanto selecciona la calidad resultante).

Por añadir información a lo ya dicho sobre reproductores, el reproductor de ogg: ogg123 puede reproducirlo perfectamente.

-----
- Porque mañana será un gran día.
[ Padre ]



 
Por si al final se cambia de codec (2.50 / 2) (#7)
por jorginius ("jorginius" en Google Mail) a las Tue Jan 6th, 2004 at 11:24:41 AM CET
(Información Usuario) http://www.rodriguezmoreno.com

Lo comenté al final del anterior comentario y creo que lo sabe todo el mundo, pero por si acaso...

La entrevista está digitalizada a una frecuencia de muestreo de 44.1 KHz y 16 bits por muestra (un bitrate de 64 Kb/s) por un solo canal: esto es una monstruosidad si consideramos que ni aún la radio comercial FM alcanza ni de lejos esas cifras (37.8 KHz y 4 bits por muestra) y es aún más monstruoso sabiendo que la más de la mitad del audio es una conversación telefónica. 8 KHz y un bitrate de 4 Kb/s deberían ser más que suficientes.

No tengo el audio original, así que lo más que puedo hacer es remuestrear el MP3 de Envite (deteriorando de partida el audio bastante) pero por completar: la entrevista muestreada a 8 KHz, a un bitrate de 4 Kb/s y comprimida con Speex ocupa 518 KB, bastante lejos de las 7.0 MB originales y mucho más adecuado para su descarga por modem.

Y bueno, ya al hilo del programa de radio, he escuchado un traspies que me ha chirriado un poco: no hay modems de "56 kilobaudios" (al menos sobre el canal telefónico normal), pero sí de 56 kilobits por segundo.

[ Padre ]


Esas cuentas (3.00 / 1) (#8)
por ridiculum a las Tue Jan 6th, 2004 at 03:09:14 PM CET
(Información Usuario)

44.1 kHz * 16 bits es un canal de un cd-a y no son 64 kbps. Son 705.6kbps.

FM comercial, o lo que yo creo que es FM comercial no emite en digital. No se como gaitas haces esa conversion :). El ancho de banda maximo de la señal moduladora son 15 kHz (señal mono en este caso), 200kHz el ancho del canal, y una desviacion de frecuencia de 75 kHz.

En el caso de DAB (Digital Audio Broadcasting), que es lo que se supone que va a eliminiar la radio clasica de AM/FM la cosa es algo enrevesada. La modulacion que usa es OFDM y cada contenedor tiene un regimen binario de 2.3 Mbps El audio por lo visto puede ir codificado en MPEG1 o 2 y se definen varios regimenes binarios y frecuencias de muestreo para la señal fuente, asi como diversos grados de proteccion (intuyo que en forma de codigos de error o algo asi.)

[ Padre ]


Ya sabía yo que tendrías algo que decir :) (3.50 / 2) (#9)
por jorginius ("jorginius" en Google Mail) a las Tue Jan 6th, 2004 at 04:36:26 PM CET
(Información Usuario) http://www.rodriguezmoreno.com

44.1 kHz * 16 bits es un canal de un cd-a y no son 64 kbps. Son 705.6kbps.

Ya, ya... Pero es que yo contaba la compresión del MP3. El audio original se ha grabado como digo (44.1 KHz, 16 bits por muestra, un solo canal) y se ha comprimido fijando un bitrate de 64 Kbps. El bitrate necesario es, entonces, sólo 64 Kbps (frente 705.6 Kbps sin comprimir), aunque no deja de ser excesivo.

FM comercial, o lo que yo creo que es FM comercial no emite en digital. No se como gaitas haces esa conversion :).

No he hecho cuentas, es culturilla general. Esas son las cifras que aparecen en el Yellow Book del CD. La calidad equivalente a radio FM es, según el libro, ADPCM tipo B (37.8 KHz, 4 bits por muestra).

La radio digital emite con una calidad mucho mayor y a diversos bitrates así que aquí no entro (además, para las explicaciones ya estás tú :)), pero hay radios en Internet con calidad casi FM que digitalizan a 32 Khz y cuatro bits por muestra, o casi AM (16 KHz).

[ Padre ]


Ases (3.00 / 2) (#10)
por ridiculum a las Tue Jan 6th, 2004 at 05:28:41 PM CET
(Información Usuario)

Al menos 2 tenias guardados. No has contado toda la informacion en la primera parte para que entrase al trapo. Cacho perro ;). Lo del ADPCM era un dato importante ;)

4 bits por muestra en ADPCM "equivalen" a 12 bits por muestra en PCM, que aunque no son suficientes para musica clasica, si sirven para otros tipos de musicas y por supuesto, para voz.

Sobre lo del mp3, pues tambien deberias haberlo dicho, asi que no hubiera caido enterito ;).

[ Padre ]


Al hilo de todo lo dicho (3.00 / 1) (#11)
por Envite a las Tue Jan 6th, 2004 at 08:30:30 PM CET
(Información Usuario)

El archivo que tengo es el que me pasó un compañero del G.U.Li.C. que trabaja en la SER. Por eso, él tiene (o tenía, supongo que ya estará borrado) acceso a la señal original del micrófono (bueno, de la mesa, que yo iba por teléfono), muestreada con calidad CD-Audio (44.1KHz stéreo con 16 bits por muestra).

Él me iba a pasar el MP3 así, pero yo le pedí, para beneficio de todos quienes se lo fueran a descargar, que lo pasara a mono (si no, hubieran sido alrededor de 14Mb).

En un futuro no demasiado lejano me pasarán (eso han dicho) el CD-Audio con las grabaciones. A partir de ahí ya podré hacer las compresiones yo, y mi intención es hacerlas en Vorbis además de en MP3, a varios bitrates, con varias ratios de sompresión, stéreo y mono. Todo desde los datos de audio originales, que es como queda bien. Y ya puestos, utilizaré también Speex, si lo encuentro e instalo. Mientras tanto, lo que veis es lo que hay :)

Y para que jorginius pueda jugar a gusto, le haré disponible también el .wav.bz2 ;)

Eso sí, haré mención en la página del tamaño del(os) archivo(s).

A mandar

No estoy de acuerdo con lo que dices, pero defenderé con mi vida tu derecho a decirlo.
Voltaire

[ Padre ]


 
kilobaudios (none / 0) (#12)
por Envite a las Tue Jan 6th, 2004 at 08:38:56 PM CET
(Información Usuario)

Me traicionó el subconsciente... cuando yo empecé en Internet, fue con un módem de 2400 baudios, que eran 2400 bits por segundo.

jorginius tiene razón: los módems llegan a 56000bps no por ir a 56000 baudios, sino gracias al multiplexado de la señal. Para una explicación un poco mejor, ver al pie. Para una explicación simplemente mejor, preguntenle a jorginius (o a algún informático puesto en el tema).

Me enmendaré a mi mismo en el próximo programa. Gracias por hacérmelo notar, jorginius.

A mandar


NOTA: los baudios son el número de veces por segundo que un módem envía información, independientemente de cuantos bits envíe de una vez. Y se pueden enviar varios de una vez haciéndolo en distintas frecuencias.

No estoy de acuerdo con lo que dices, pero defenderé con mi vida tu derecho a decirlo.
Voltaire

[ Padre ]


A riesgo de sufrir las consecuencias... (4.00 / 2) (#14)
por iarenaza a las Tue Jan 6th, 2004 at 10:34:21 PM CET
(Información Usuario) http://www.escomposlinux.org/

y no siendo teleco como ridiculum y jorginius, me permito terciar en el asunto (/me se pone el caso por lo que le va a caer encima :)

Cuando de baudios se trata, es mucho mejor preguntar a un teleco que a un informático. No digo que no haya informáticos puestos en los (sucios) detalles del nivel físico (que los hay), pero en general los telecos están mucho más al tanto de lo que allí se cuece y maquina.

En cuanto a la definición de baudio, habría que ir un poco más allá de lo que mencionas y previamente definir lo que es un elemento de señal (o «momentos», o «símbolos», según la bibliografía), que no es más que el trozo de señal (de duración fija) durante el cual las caracterísiticas de la magnitud física que codifica la información (amplitud, fase, etc) se mantienen constantes.

La velocidad con la que varían los elementos de señal se llama cadencia de emisión de señales (signal rate en inglés) o de símbolos, o tambienén velocidad de modulación según otros autores. Y ésto es lo que se mide en Baudios (que es en realidad el número de elementos de señal emitidos por unidad de tiempo).

Se hace así por distinguirla de la velocidad de emisión de información (bit rate en inglés) que nos indica cuánta cantidad de información (medida en bits) se transmite por unidad de tiempo, ya que ambas magnitudes no tiene por que coincidir. Y de hecho, en la inmensa mayoría de los sistemas de comunicaciones modernos, no lo hacen, al utilizarse sistemas de codificación multisímbolo (también llamados a veces multinivel), que nos permiten codificar varios bits de información en cada elemento de señal.

Las correcciones y los detalles adicionales se los dejo a los telecos. Yo sólo soy un humilde informático :)

Saludos. Iñaki.

[ Padre ]


Genial explicación (none / 0) (#15)
por Envite a las Wed Jan 7th, 2004 at 03:09:12 AM CET
(Información Usuario)

Yo, como oyeron en el programa, no soy ni teleco ni informático, sino astrofísico.

Por lo que a mí respecta, puedes quitarte el casco.

A mandar

P.S. Ya puse en la web el tamaño del archivo.
No estoy de acuerdo con lo que dices, pero defenderé con mi vida tu derecho a decirlo.
Voltaire

[ Padre ]


 

Programas de radio | 21 comentarios (21 temáticos, editoriales, 0 ocultos)
Ver: Modo: Orden:
Menu
· crear cuenta
· FAQ
· búsqueda
· Fuentes de Noticias

Login
Nueva cuenta
Usuario:
Contraseña:

ecol Logo Powered by Scoop
Todas las Marcas Registradas y copyrights de esta página son propiedad de sus respectivos dueños.
Los comentarios son propiedad del que los escribe.
Los iconos de las noticias y el logotipo son propiedad de Javier Malonda.
El Resto © 2002 Escomposlinux.org y aledaños.

Puedes sindicar los contenidos de libertonia en formato RSS 1.0 y RDF 0.9. También se puede sindicar la cola de envíos pendientes de moderación.

El proyecto escomposlinux.org está dedicado a la memoria de tas

crear cuenta | faq | búsqueda