Síntesis de voz en Linux

Un sintetizador de voz o TTS (Text-To-Speech) es un programa que convierte texto en voz, es decir, que produce voz humana de forma artificial. En Linux este tema funciona al estilo UNIX, varios programas trabajando en cadena:

el trabajo duro lo hace el back-end, el engine o motor de síntesis (Festival, Flite o eSpeak).
los frontales (Kmouth, KSayIt, Fala, Orca, Yasr) actúan como interfaz para utilizar los back-end.
en algunos casos interviene una capa intermedia entre los frontales y los back-end para facilitar el trabajo de los desarrolladores (KTTSd, Speech Dispatcher o Gnome Speech).

Veamos qué programas tenemos para síntesis de voz en Linux:

Equivalencias en Windows: MS-Narrator, JAWS.

Back-end sintetizador de voz

Festival (cstr.ed.ac.uk/projects/festival/, paquete festival).
Flite (Festival lite, speech.cs.cmu.edu/flite/, paquete flite).
eSpeak (espeak.sourceforge.net, paquete espeak).

Capa intermedia

KTTSd (KDE Text-To-Speech System daemon, accessibility.kde.org/developer/kttsd, paquete kttsd): demonio del sistema sintetizador de voz de KDE, es una capa intermedia entre los frontales y los back-end.
Speech Dispatcher (krecipes.sourceforge.net, paquete speech-dispatcher): capa intermedia entre las aplicaciones finales y los motores de síntesis.
Gnome Speech (krecipes.sourceforge.net, paquete libgnome-speech): capa intermedia de GNOME entre los frontales y los back-end.

Frontales

Kmouth (schmi-dt.de/kmouth/, paquete kmouth): sintetizador de voz sencillo (text reader) de KDE, frontal de KTTSd.
KSayIt (paquete ksayit): sintetizador de voz sencillo (text reader) de KDE, frontal de KTTSd.
Fala (sourceforge.net/projects/fala/, paquete fala): sintetizador de voz sencillo (text reader) para GNOME, frontal de Festival.
Orca (live.gnome.org/Orca, paquete gnome-orca): screen reader (lector de pantalla) de GNOME (reemplaza a Gnopernicus).
Yasr (Yet Another Screen Reader, yasr.sourceforge.net, paquete yasr): screen reader (lector de pantalla) para consola. Si lanzamos el proceso en una terminal, por ejemplo con el comando:
```
$ yasr -s festival -p '|festival --pipe'
```
creará un sub-shell y leerá todo lo que salga por pantalla en esa terminal.

2 Comentarios en “Síntesis de voz en Linux”

wicope dice:

07-Jul-2008 20:30:35

Gracias por tu sabiduría. Cliquee en varios link, en agradecimiento.
gatsu dice:

12-Nov-2008 07:26:23

¿alguna idea de como poner el idioma español para la lectura usando festival?

Deja un comentario