Generalidades del habla
|Hablar... con ton y| |
|son ||
| | |
El habla, medio de comunicación por excelencia entre los seres humanos, está siendo velozmente implantado en la interacción cotidiana entre el hombre y la máquina. Las encuestas de usuarios realizadas por la revista electrónicaTidBits a finales del año 2000 situaban el reconocimiento del habla como la "manzana más deseada" de la tecnología informática del nuevo siglo. Además, la domótica ha empezado a hacer sus primeras piruetas para la creación de las 'casas inteligentes' en las que habitaremos y con las que hablaremos en el futuro. Se acerca el momento de realizar lo que numerosas páginas de ciencia-ficción ya habíanplasmado, el gran sueño del hombre de comunicarse con sus máquinas de la forma más natural: conversando.
La afirmación del historiador griego Plutarco de que "Para saber hablar es necesario saber escuchar" también puede aplicarse al desarrollo de las tecnologías del habla. La comunicación oral del hombre con la máquina empieza pr el reconocimiento automático del habla, que tiene como finalidadextraer el mensaje transportado por una señal de voz. Es decir, la máquina debe escuchar e interpretar los sonidos para extraer de ellos las palabras del emisor.
Para Pedro García Teodoro, miembro del Grupo de Investigación en Procesamiento de Señales y Comunicaciones de la Universidad de Granada, el desarrollo de los sistemas de reconocimiento automático de voz debe enfrentarse a dos problemasfundamentales. El primero es la propia naturaleza de la señal de voz. "Caracterizada por presentar una alta variabilidad (edad, sexo, estado de salud, localización geográfica, ritmo de pronunciación, etc.) no resulta fácil determinar unas características o parámetros que representen unívocamente los distintos sonidos, y menos aún su concatenación y delimitación en una frase", afirma el investigador.Las unidades fundamentales del discurso hablado son los fonemas, una serie de sonidos que el sistema debe distinguir basándose en sus diferentes frecuencias. La cosa se complica si consideramos que en la comunicación normal los fonemas no son un número limitado de entidades separadas e independientes, sino que su pronunciación varía en función de los sonidos que van delante y detrás. Por lotanto, cualquier sistema de reconocimiento de voz debe tener en cuenta todas las posibles combinaciones de fonemas. Otra dificultad añadida radica en que la onda acústica -el sonido- es absolutamente continua: normalmente el hablante no se para a hacer pausas, por lo que su 'interlocutor mecánico' debe ser capaz de segmentar los sonidos en palabras.
Dejando a un lado los matices de la voz, el segundoproblema de la comunicación oral humana es la intervención de otros niveles no acústicos como la gramática y la semántica. La máquina no sólo debe reconocer una palabra tras otra, sino que además debe ser capaz de ver el conjunto y sus distintos bloques gramaticales: sujeto, predicado y complementos de la oración. Más difícil es el aspecto semántico, ya que "aún no se ha definido un modelocerebral contrastado" para la comprensión, como apunta el doctor García Teodoro. En el ser humano es muchas veces el sentido común lo único que permite captar el verdadero significado en situaciones de ambigüedad en la gramática o en el vocabulario. Y si las máquinas pueden tener o no sentido común es ya otra historia....
Dime cómo hablas...
Por el momento, el reconocimiento del habla continua ha...
Regístrate para leer el documento completo.