Libertonia
Portada · Todo · Software Libre · Desarrolladores · Comunidad · Internet · Tecnología · Meta · Diarios
Ver: Modo: Orden:
Habla Monstruo! | 3 comentarios (3 temáticos, editoriales, 0 ocultos)
Síntesis y reconocimiento (4.50 / 2) (#3)
por jorginius ("jorginius" en Google Mail) a las Sat Oct 18th, 2003 at 12:00:51 PM CET
(Información Usuario) http://www.rodriguezmoreno.com

... se basa en Festival, un programa de reconocimiento del habla.

Festival sólo es un motor de síntesis de voz, significativamente más sencillo que cualquier motor de reconocimiento del habla.

Motores de reconocimiento del habla habituales son Dragon NaturallySpeaking de Dragon Systems o ViaVoice de IBM: herramientas que "entienden" el lenguaje natural y sirven por ejemplo para escribir documentos al dictado o manejar la computadora por medio de la voz (útil por ejemplo para personas de movilidad restringida).

Un sintetizadores de voz únicamente lee texto, ya sea un documento en texto plano, la salida de un ocr o el contenido de una ventana. Esto exige mucho menos "músculo" (matemáticas y tiempo de proceso) que el reconocimiento del habla y hay muchos programas asequibles que lo hacen. Está Festival, como apunta la noticia, o MBROLA, o Festival Lite (Festival adaptado a empotrados: con versiones para iPAQ/StrongArm y compatible con SAPI y Windows CE) o el propio motor de síntesis del ViaVoice (ViaVoice Text-To-Speech o ViaVoice-TTS) que IBM distribuye junto al sdk gratuitamente y libre de royalties. Aunque la versión para Linux del mismo parece encontrarse discontinuada, los paquetes rpm de la versión aún podéis encontrarlos en el ftp de LILO: mirror de ViaVoice-TTS for Linux.

Por otra parte, y ya más al hilo de la entrada del diario, sabe a poco usar el sintetizador sólo para el Xchat o el Gaim :-). Los usuarios de Emacs disponemos de Emacspeak: un añadido que provee de síntesis de voz al (X)Emacs de siempre. Emacspeak puede usar distintos tipos de sintetizadores de voz por debajo: desde los (caros) sintetizadores hardware (la O.N.C.E. desarrolla drivers adaptados para alguno de ellos. Consultad el Area de Linux en el ftp de O.N.C.E. para más detalles) hasta sintetizadores por software como Festival/Emacspeak (sólo CVS), Flite/Emacspeak o ViaVoice/Emacspeak.

Puesto que desde Emacs se puede no sólo editar documentos, sino además reproducir cds de audio, controlar los parámetros del mezclador, navegar por la web (con soporte para CSS aurales), correo, news, ftp, ssh, irc, manejar rpm, abrir una consola de órdenes, etc. (Una lista más amplia: Aplicaciones de Emacspeak), al darle soporte para síntesis de voz, permite que una persona impedida visualmente lo tenga más fácil para manejar Linux.



 

Habla Monstruo! | 3 comentarios (3 temáticos, editoriales, 0 ocultos)
Ver: Modo: Orden:
Menu
· crear cuenta
· FAQ
· búsqueda
· Fuentes de Noticias

Login
Nueva cuenta
Usuario:
Contraseña:

ecol Logo Powered by Scoop
Todas las Marcas Registradas y copyrights de esta página son propiedad de sus respectivos dueños.
Los comentarios son propiedad del que los escribe.
Los iconos de las noticias y el logotipo son propiedad de Javier Malonda.
El Resto © 2002 Escomposlinux.org y aledaños.

Puedes sindicar los contenidos de libertonia en formato RSS 1.0 y RDF 0.9. También se puede sindicar la cola de envíos pendientes de moderación.

El proyecto escomposlinux.org está dedicado a la memoria de tas

crear cuenta | faq | búsqueda