144289 257340 1 PB

Páginas: 11 (2704 palabras) Publicado: 15 de marzo de 2015
RECONOCIMIENTO AUTOMATICO DEL HABLA

FRANCISCO CASACUBERTA NOLLA
ENRIQUE VIDAL RUIZ
Oto.de Sistemas Informáticos y Computación
Universidad Politécnica de Valencia

Reconocimiento automático del habla

169

l. INTRODUCCION.

El habla ha venido siendo tradicionalmente el
medio preferente de comunicación entre seres'humanos. Esta constituye un proceso altamente codificado, cuyo vehículo, la voz,transporta no sólo
información semántica, sino también información
fisiológica y sociológica del locutor.
Desde los comienzos de la Informática, y más
concretamente de la Inteligencia artificial, se ha
intentado dotar a los computadores de este medio
de comunicación, aunque separando el aspecto de
producción (Síntesis) del de percepción (reconocimiento). Treinta años después, los logros obtenidosestán muy lejanos de conseguir una verdadera
comunicación hablada entre humanos y computadores.
Mientras que en la síntesis, existen productos
acabados bastante aceptables, en el Reconocimiento, éstos son muy limitados y de muy restringida
utilidad práctica, a pesar de las informaciones
optimistas que suelen aparecer en los medios de
comunicación social no especializados.

170

Casacuberta & VidalLas causas de la relativamente poco alentadora situación actual son varias y están muy relacionadas con las características intrínsecas del
habla. En primer lugar cabe destacar la continuidad, ni los fonemas, ni las sílabas, ni siquiera
las palabras constituyen elementos discretos que
se puedan separar fácilmente de forma automática.
Además, y debido a inercias del aparato fonador
humano, éstosse influyen unos a otros, dando lugar a complejos efectos de coarticulación. En segundo lugar está la variabilidad, un mismo locutor
no pronuncia dos veces una misma palabra de forma
idéntica, y menos aún dos locutores distintos
(Vaissiere, 1985) (Casacuberta, 1987a). En tercer
lugar tenemos el ruido y la distorsión, en la señal vocal, parte de la información irrelevante
para la comprensión delmensaje hablado. Finalmente, la imprecisión de los conocimientos multidisciplinarios disponibles de tipo acústico, fonético, etc. es lo suficientemente alta como para que
no se pueda basar en ellas el diseño de modelos
exactos útiles para la interpretación de la señal
vocal.
Asumiendo estos inconvenientes, se han propuesto y estudiado diversas metodologías y arquitecturas en las que se han impuestouna serie de
restricciones con el objeto de simplificar el problema general del Habla, para que éste sea abordable. Las simplificaciones que se asumen afectan
fundamentalmente a la talla del léxico, al tipo
del lenguaje y a la variabilidad aceptable en la
señal vocal. Según la naturaleza de las simplificaciones, el Reconocimiento del Habla se convierte
en: Reconocimiento de Palabras Aisladas: elléxico
es reducido (hasta unas 500 palabras), y las palabras deben pronunciarse con pausas entre ellas. En
el caso más simple, el reconocimiento es monolocutor (el aprendizaje del sistema se realiza con el
mismo locutor que lo va a utilizar), y en otro caso es multilocutor (en el que intervienen varios
locutores) lo que suele reducir significativamente
la talla del vocabulario utilizable.Reconocimiento de Palabras Conectadas: es similar al anterior
aunque, a cambio de restringir el vocabulario, no
se exigen pausas entre palabras. La sintaxis suele
ser muy elemental o inexistente. Reconocimiento de
Palabras Aisladas y Conectadas con Diccionarios

Reconocimiento automático del habla

171

Difíciles: en este caso, las palabras pertenecen
a pequeños vocabularios, pero suelen ser muy cortas(letras y dígitos, por ejemplo) y/o muy parecidas. Reconocimiento de Palabras Aisladas de
Grandes Diccionarios: es similar al primer caso,
aunque la talla del diccionario puede alcanzar las
50.000 palabras, lo que impide la creación y uso
de prototipos como modelos de las palabras a reconocer, exigiendo por tanto una aproximación analítica al reconocimiento. Reconocimiento del Discurso continuo:...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • 9655 27837 1 PB
  • 7495 21627 1 PB
  • 15146 41362 1 PB
  • 204 590 1 PB 1
  • 702 1242 1 PB
  • 49 179 1 PB
  • 15032 49969 1 PB
  • 64473 88417 1 PB

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS