Fonologia

Solo disponible en BuenasTareas
  • Páginas : 32 (7840 palabras )
  • Descarga(s) : 0
  • Publicado : 28 de noviembre de 2010
Leer documento completo
Vista previa del texto
Historia del reconocimiento de voz
Los inicios: años 50
•Bell Labs .... Reconocimiento de dígitos aislados monolocutor
•RCA Labs .... Reconocimiento de 10 sílabas monolocutor
•University College in England .... Reconocedor fonético
•MIT Lincoln Lab .... Reconocedor de vocales independiente del hablante
Los fundamentos: años 60
•Comienzo en Japón (NEC labs)
•Dynamic time warping ....Vintsyuk (Soviet Union)
•CMU ... Reconocimiento del Habla Continua .... HAL 9000
Las primeras soluciones: años 70, el mundo probabilístico
•Reconocimiento de palabras aisladas
•LPC, programación dinámica
•IBM: inicio proyecto reconocimiento de grandes vocabularios
•Gran inversión en los USA: proyectos DARPA
•Sistema HARPY (CMU) primer sistema con éxito
Reconocimiento del Habla Continua: años80, expansión
•Algoritmos para el habla continua y grandes vocabularios
•Explosión de los métodos estadísticos: Modelos Ocultos de Markov
utilizados inicialmente por IBM y Dragon Systems
popularizados por Bell Labs
•Introducción de las Redes Neuronales en el reconocimiento de voz
Sistema SPHINX
Empieza el negocio: años 90, primeras aplicaciones
•Ordenadores y procesadores baratos yrápidos
•Sistemas de dictado
•Integración entre reconocimiento de voz y procesado del lenguaje natural
Actualidad, integración en el S.O.
•Integración teléfono y Voice Web browsers
•VoiceXML estandard
•Sistema V2C (interacción voz-radio, voz-teléfono, voz-navegador)

Historia de la síntesis
Mucho antes del desarrollo del procesado de señal moderno, los investigadores de la voz intentaron crearmáquinas que produjesen habla humana. El Papa Silvestre II (1003), Alberto Magno (1198-1280) y Roger Bacon (1214-1294) crearon ejemplos tempranos de 'cabezas parlantes'.
En 1779, el científico danés Christian Gottlieb Kratzenstein, que trabajaba en esa época en la Academia Rusa de las Ciencias, construyó modelos del tracto vocal que podían producir las cinco vocales largas (a, e, i, o, u).Wolfgang von Kempelen de Vienna, Austria, describió en su obra Mechanismus der menschlichen Sprache nebst der Beschreibung seiner sprechenden Maschine ("mecanismo del habla humana con descripción de su máquina parlante", J.B. Degen, Wien) una máquina accionada con un fuelle. Esta máquina tenía, además, modelos de la lengua y los labios, para producir consonantes, así como vocales. En 1837 CharlesWheatstone produjo una 'máquina parlante' basada en el diseño de von Kempelen, y en 1857 M. Faber construyó la máquina 'Euphonia'. El diseño de Wheatstone fue resucitado en 1923 por Paget.
En los años 30, los laboratorios Bell Labs desarrollaron el VOCODER, un analizador y sintetizador del habla operado por teclado que era claramente intelegible. Homer Dudley refinó este dispositivo y creó VODER, queexhibió en la Exposición Universal de Nueva York de 1939.
Los primeros sintetizadores de voz sonaban muy robóticos y eran a menudo intelegibles a duras penas. Sin embargo, la calidad del habla sintetizada ha mejorado en gran medida, y el resultado de los sistemas de síntesis contemporáneos es, en ocasiones, indistinguible del habla humana real.
A pesar del éxito de los sintetizadores puramenteelectrónicos, sigue investigándose en sintetizadores mecánicos para su uso en robots humanoides. Incluso el mejor sintetizador electrónico está limitado por la calidad del transductor que produce el sonido, así que en un robot un sintetizador mecánico podría ser capaz de producir un sonido más natural que un altavoz pequeño.
El primer sistema de síntesis computerizado fue creado a final de ladécada de 1950 y el primer sistema completo texto a voz se finalizó en 1968. Desde entonces se han producido muchos avances en las tecnologías usadas para sintetizar voz

Procesamiento digital de señales. Digitalización de voz
El procesamiento digital de señal mediante un DSP, ordenador, etc., requiere previamente la conversión de la señal acústica a eléctrica mediante un micrófono, y la...
tracking img