... se basa en Festival, un programa de reconocimiento del habla.
Festival sólo es un motor de síntesis de voz, significativamente más sencillo que cualquier motor de reconocimiento del habla.
Motores de reconocimiento del habla habituales son Dragon NaturallySpeaking de Dragon Systems o ViaVoice de IBM: herramientas que "entienden" el lenguaje natural y sirven por ejemplo para escribir documentos al dictado o manejar la computadora por medio de la voz (útil por ejemplo para personas de movilidad restringida).
Un sintetizadores de voz únicamente lee texto, ya sea un documento en texto plano, la salida de un ocr o el contenido de una ventana. Esto exige mucho menos "músculo" (matemáticas y tiempo de proceso) que el reconocimiento del habla y hay muchos programas asequibles que lo hacen. Está Festival, como apunta la noticia, o MBROLA, o Festival Lite (Festival adaptado a empotrados: con versiones para iPAQ/StrongArm y compatible con SAPI y Windows CE) o el propio motor de síntesis del ViaVoice (ViaVoice Text-To-Speech o ViaVoice-TTS) que IBM distribuye junto al sdk gratuitamente y libre de royalties. Aunque la versión para Linux del mismo parece encontrarse discontinuada, los paquetes rpm de la versión aún podéis encontrarlos en el ftp de LILO: mirror de ViaVoice-TTS for Linux.
Por otra parte, y ya más al hilo de la entrada del diario, sabe a poco usar el sintetizador sólo para el Xchat o el Gaim :-). Los usuarios de Emacs disponemos de Emacspeak: un añadido que provee de síntesis de voz al (X)Emacs de siempre. Emacspeak puede usar distintos tipos de sintetizadores de voz por debajo: desde los (caros) sintetizadores hardware (la O.N.C.E. desarrolla drivers adaptados para alguno de ellos. Consultad el Area de Linux en el ftp de O.N.C.E. para más detalles) hasta sintetizadores por software como Festival/Emacspeak (sólo CVS), Flite/Emacspeak o ViaVoice/Emacspeak.
Puesto que desde Emacs se puede no sólo editar documentos, sino además reproducir cds de audio, controlar los parámetros del mezclador, navegar por la web (con soporte para CSS aurales), correo, news, ftp, ssh, irc, manejar rpm, abrir una consola de órdenes, etc. (Una lista más amplia: Aplicaciones de Emacspeak), al darle soporte para síntesis de voz, permite que una persona impedida visualmente lo tenga más fácil para manejar Linux.
|