Imprimir

Síntesis de voz en Linux

Un sintetizador de voz o TTS (Text-To-Speech) es un programa que convierte texto en voz, es decir, que produce voz humana de forma artificial. En Linux este tema funciona al estilo UNIX, varios programas trabajando en cadena:

  1. el trabajo duro lo hace el back-end, el engine o motor de síntesis (Festival, Flite o eSpeak).
  2. los frontales (Kmouth, KSayIt, Fala, Orca, Yasr) actúan como interfaz para utilizar los back-end.
  3. en algunos casos interviene una capa intermedia entre los frontales y los back-end para facilitar el trabajo de los desarrolladores (KTTSd, Speech Dispatcher o Gnome Speech).

Veamos qué programas tenemos para síntesis de voz en Linux:

Equivalencias en Windows: MS-Narrator, JAWS.

Back-end sintetizador de voz

Capa intermedia

Frontales

  • Kmouth (schmi-dt.de/kmouth/, paquete kmouth): sintetizador de voz sencillo (text reader) de KDE, frontal de KTTSd.

    Kmouth

  • KSayIt (paquete ksayit): sintetizador de voz sencillo (text reader) de KDE, frontal de KTTSd.

    KSayIt

  • Fala (sourceforge.net/projects/fala/, paquete fala): sintetizador de voz sencillo (text reader) para GNOME, frontal de Festival.

    Fala

  • Orca (live.gnome.org/Orca, paquete gnome-orca): screen reader (lector de pantalla) de GNOME (reemplaza a Gnopernicus).
  • Yasr (Yet Another Screen Reader, yasr.sourceforge.net, paquete yasr): screen reader (lector de pantalla) para consola. Si lanzamos el proceso en una terminal, por ejemplo con el comando:
    $ yasr -s festival -p '|festival --pipe'

    creará un sub-shell y leerá todo lo que salga por pantalla en esa terminal.

2 Comentarios en “Síntesis de voz en Linux”

  • wicope dice:

    Gracias por tu sabiduría. Cliquee en varios link, en agradecimiento.

  • gatsu dice:

    ¿alguna idea de como poner el idioma español para la lectura usando festival?

Deja un comentario