Text to speech

Solo disponible en BuenasTareas
  • Páginas : 17 (4074 palabras )
  • Descarga(s) : 0
  • Publicado : 25 de septiembre de 2010
Leer documento completo
Vista previa del texto
Conversor de Texto a Voz

Abraham Santos Ramos Christian Concha Zúñiga

Ray Montes Rivera Manuel Arróspide Chirinos

Resumen

Un conversor de texto a voz puede definirse como un sistema que transforma cualquier texto escrito siguiendo las convenciones ortográficas de una determinada lengua en su equivalente hablado.

Entre las ventajas más resaltantes de lasalida vocal en computadores podemos citar:

✓ Libertad para la realización de otras tareas, ya que una salida sonora es omnidireccional y permite una mayor movilidad en el trabajo.

✓ Ahorro de tiempo, la cantidad de información que puede ofrecerse mediante el habla supera en mucho a la que se consigue leyendo un texto en la pantalla de un computador.

✓ El habla es el modo decomunicación más natural y universal de la especie humana. No hay que olvidar que así se facilita la utilización de los equipos informáticos por los invidentes.

El alcance de nuestro trabajo es realizar un conversor e texto a voz sólo para el idioma Español y que transforme el texto de de entrada a su equivalente hablado.

Palabras clave: Convertidor Texto a Voz (TTS:Text to Speech), Fonema,Difonema, Alófonos, Sintetizadores Concatenativos, MBROLA (MultiBand Resynthesis OverLapp Add).

1. Introducción

La exploración de las posibilidades de interacción con los computadores mediante la voz es tal vez uno de los temas privilegiados dentro de la investigación actual en el campo de la comunicación hombre-máquina. Si bien una parte considerable de los trabajos se orienta hacia lacomprensión del habla por el computador, otra se encamina a la generación automática de un texto oral a partir de una representación escrita, síntesis del habla.

Entre las ventajas que se pueden encontrar en la comunicación oral con las máquinas frente al uso de los métodos tradicionales, se pueden citar que, además de ser más cómodo y natural para los usuarios, posibilita la realizaciónde otras tareas simultáneamente, facilita el acceso telefónico a un terminal y, adicionalmente, que las salidas vocales tienen un coste muy bajo y permiten acceder a una gran cantidad de información en poco tiempo. Por supuesto, también existen inconvenientes (facilidad de interferencias y de intercepción por terceros, entre otras), sin embargo, en la mayoría de los casos, las ventajas los superancon creces.

La comunicación bidireccional con las máquinas exige la presencia, por un lado, de un módulo capaz de recoger y descodificar los mensajes orales que llegan a la máquina y por otro lado, de un módulo capaz de codificar y emitir mensajes comprendidos por los seres humanos. A lo largo del tiempo han ido apareciendo diversas técnicas de reconocimiento (descodificación) y síntesis(codificación) de voz, cuyo objetivo es hacer posible esta bidireccionalidad.

Dentro de la parte relativa a la síntesis de voz hablaremos acerca de los Conversores Texto-Voz, los cuales, primero realizan una traducción completa de los textos escritos a una representación lingüística del mensaje (llamado procesamiento lingüístico prosódico) y, posteriormente, de esta representación a unaonda acústica (procesado acústico), siendo esta fase el proceso de síntesis propiamente dicho.

Entre las aplicaciones desarrolladas actualmente podemos figuran, entre otras, las máquinas lectoras para ciegos, ayudas para disminuidos físicos, enseñanza asistida por ordenador o terminales hablantes. Cada una de estas aplicaciones requiere una técnica de síntesis específica, pero laselección de ésta depende básicamente de los siguientes factores:

✓ La calidad del habla que debe producir el sistema, es decir, la naturalidad y la inteligibilidad, podemos resaltar a la emotividad, claro que también podemos considerar a esta dentro de la naturalidad.
✓ Flexibilidad, la capacidad que debe tener el sistema para generar diversos mensajes a partir de un conjunto finito de...
tracking img