algoritmo de reconocimiento de voz

Páginas: 30 (7382 palabras) Publicado: 6 de abril de 2013
Computación y Sistemas Vol. 9 Núm. 3, pp. 270-286
© 2006, CIC-IPN, ISSN 1405-5546, Impreso en México

Algoritmos y Métodos para el Reconocimiento de Voz en Español Mediante
Sílabas
Algorithms and Methods for the Automatic Speech Recognition in Spanish Language using
Syllables
Graduated: José Luis Oropeza Rodríguez
Centro de Investigación en Computación-IPN
Av. Juan de Dios Bátiz s/n esq.Miguel Othón Mendizábal C. P. 07738 México D. F.
j_orope@yahoo.com.mx
Graduado en diciembre 15, 2006
Advisor: Sergio Suárez Guerra
Centro de Investigación en Computación-IPN
Av. Juan de Dios Bátiz s/n esq. Miguel Othón Mendizábal C. P. 07738 México D. F.
ssuare@cic,ipn,mx
Resumen
Actualmente el uso de los fonemas tiene implícita varias dificultades debido a que la identificación de lasfronteras
entre ellos por lo regular es difícil de encontrar en representaciones acústicas de voz. El presente trabajo plantea una
alternativa a la forma en la que el reconocimiento de voz se ha estado implementando desde hace ya bastante tiempo,
analizando la forma en la cual el paradigma de la sílaba responde a tal labor dentro del español. Durante los
experimentos realizados fueron examinadospara la tarea de segmentación tres elementos esenciales: a) la Función de
Energía Total en Corto Tiempo, b) la Función de Energía de altas frecuencias Cepstrales (conocida como Energía del
parámetro RO), y c) un Sistema Basado en Conocimiento. Tanto el Sistema Basado en Conocimiento y la Función de
Energía Total en Corto Tiempo fueron usados en un corpus de dígitos en donde los resultadosalcanzados usando
sólo la Función de Energía Total en Corto Tiempo, fueron de 90.58%. Cuando se utilizaron los parámetros Función
de Energía Total en Corto Tiempo y la Energía del parámetro RO se obtuvo un 94.70% de razón de reconocimiento.
Lo cual causa un incremento del 5% con relación al uso de palabras completas en un corpus de voz dependiente de
contexto. Por otro lado, cuando se utilizó uncorpus de laboratorio del habla continua al usar la Función de Energía
Total en Corto Tiempo y el Sistema Basado en Conocimiento, se alcanzó un 78.5% de razón de reconocimiento y un
80.5% de reconocimiento al usar los tres parámetros anteriores. El modelo del lenguaje utilizado para este caso fue el
bigram y se utilizaron Cadenas Ocultas de Markov de densidad continua con tres y cinco estados,con 3 mixturas
Gaussianas por estado.
Palabras clave: Reconocimiento de voz, reconocimiento de sílabas, sistemas expertos, procesamiento de voz.
Abstract
This work examines the results of incorporating into Automatic Speech Recognition the syllable units for the
Spanish language. Because of the boundaries between phonemes-like units its often difficult to elicit them; the use of
these has notreached a good performance in Automatic Speech Recognition. In the course of the developing the
experiments three approaches for the segmentation task were examined: a) the using of the Short Term Total Energy
Function, b) the Energy Function of the Cepstral High Frequency (named ERO parameter), and c) a Knowledge
Based System. They represent the most important contributions of this work; theyshowed good results for the
Continuous and Discontinuous speech corpus developed in laboratory.
The Knowledge Based System and Short Term Total Energy Function were used in a digit corpus where the results
achieved using Short Term Total Energy Function alone reached 90.58% recognition rate. When Short Term Total
Energy Function and RO parameters were used a 94.70% recognition rate wasachieved. Otherwise, in the
continuous speech corpus created in the laboratory the results achieved a 78.5% recognition rate using Short Term
Total Energy Function and Knowledge Based System, and 80.5% recognition rate using the three approaches
mentioned above. The bigram model language and Continuous Density Hidden Markov Models with three and five
states incorporating three Gaussian Mixtures...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Reconocimiento de voz
  • Reconocimiento de Voz
  • Reconocimiento De Voz
  • Reconocimiento De Voz
  • reconocimiento de voz
  • Reconocimiento De Voz
  • Reconocimiento De Comandos De Voz Por Matlab
  • Reconocimiento de personas por voz

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS