Síntesis de voz en Linux
Un sintetizador de voz o TTS (Text-To-Speech) es un programa que convierte texto en voz, es decir, que produce voz humana de forma artificial. En Linux este tema funciona al estilo UNIX, varios programas trabajando en cadena:
- el trabajo duro lo hace el back-end, el engine o motor de síntesis (Festival, Flite o eSpeak).
- los frontales (Kmouth, KSayIt, Fala, Orca, Yasr) actúan como interfaz para utilizar los back-end.
- en algunos casos interviene una capa intermedia entre los frontales y los back-end para facilitar el trabajo de los desarrolladores (KTTSd, Speech Dispatcher o Gnome Speech).
Veamos qué programas tenemos para síntesis de voz en Linux:
Equivalencias en Windows: MS-Narrator, JAWS.
Back-end sintetizador de voz
- Festival (cstr.ed.ac.uk/projects/festival/, paquete festival).
- Flite (Festival lite, speech.cs.cmu.edu/flite/, paquete flite).
- eSpeak (espeak.sourceforge.net, paquete espeak).
Capa intermedia
- KTTSd (KDE Text-To-Speech System daemon, accessibility.kde.org/developer/kttsd, paquete kttsd): demonio del sistema sintetizador de voz de KDE, es una capa intermedia entre los frontales y los back-end.
- Speech Dispatcher (krecipes.sourceforge.net, paquete speech-dispatcher): capa intermedia entre las aplicaciones finales y los motores de síntesis.
- Gnome Speech (krecipes.sourceforge.net, paquete libgnome-speech): capa intermedia de GNOME entre los frontales y los back-end.
Frontales
- Kmouth (schmi-dt.de/kmouth/, paquete kmouth): sintetizador de voz sencillo (text reader) de KDE, frontal de KTTSd.
- KSayIt (paquete ksayit): sintetizador de voz sencillo (text reader) de KDE, frontal de KTTSd.
- Fala (sourceforge.net/projects/fala/, paquete fala): sintetizador de voz sencillo (text reader) para GNOME, frontal de Festival.
- Orca (live.gnome.org/Orca, paquete gnome-orca): screen reader (lector de pantalla) de GNOME (reemplaza a Gnopernicus).
- Yasr
(Yet Another Screen Reader,
yasr.sourceforge.net, paquete yasr):
screen reader (lector de pantalla) para consola. Si lanzamos el proceso en una terminal,
por ejemplo con el comando:
$ yasr -s festival -p '|festival --pipe'
creará un sub-shell y leerá todo lo que salga por pantalla en esa terminal.
2 Comentarios en “Síntesis de voz en Linux”
Deja un comentario
Gracias por tu sabiduría. Cliquee en varios link, en agradecimiento.
¿alguna idea de como poner el idioma español para la lectura usando festival?