Vocoders
Páginas: 17 (4113 palabras)
Publicado: 5 de abril de 2013
La voz humana consiste en sonidos generados por la apertura y cierre de la glotis (cuerdas vocales), lo que produce una onda periódica con muchos sonidos armónicos. Este sonido básico es entonces filtrado por la nariz y la garganta (un complicado sistema resonante conocido como el tracto vocal) de forma controlada, creando la amplia variedad de sonidos de habla. Hay otroconjunto de sonidos, conocidos como sordos, que no son generados por la vibración de las cuerdas vocales.
El vocoder examina el habla encontrando su onda básica, que es la "Frecuencia Fundamental", y midiendo cómo cambian las características espectrales en el tiempo con respecto a la voz emitida. Es decir tenemos como resultado una serie de números, representando esas frecuencias modificadas en untiempo particular a medida que el usuario habla. Al hacer esto, el vocoder reduce en gran medida la cantidad de información necesaria para almacenar el habla. Para recrear el habla, el vocoder simplemente revierte el proceso, creando la frecuencia fundamental en un oscilador electrónico y pasando su resultado por una serie de filtros basado en la secuencia original de símbolos.
Implementacionesmodernas del vocoder Incluso con la necesidad de grabar muchas frecuencias y los sonidos sordos, la compresión del vocoder es impresionante. Los sistemas estándar de grabación de habla registran un rango de frecuencias entre 500Hz y 3.400Hz (ancho de banda habitual en telefonía), requieren 64 kbits/s de ancho de banda, según el Teorema de muestreo de Nyquist-Shannon. Sin embargo, un vocoder puedeproporcionar una simulación razonablemente buena con menos de 2.400 bits/s de ancho de banda.
2. Tecnologías:
En la actualidad existen diferentes estándares y algoritmos en los cuales se basan los Vocoders y entre los más importantes podemos citar:
I. LPC (Linear Prediction Code)
II. CELP (Code Excited Linear Prediction)
III. CVSD (ContinuouslyVariable Slope Delta-modulation)
IV. MELP (Mixed Excitation Linear Prediction)
V. RELP (Residual Excited Linear Prediction)
VI. VSELP (Vector Sum Excited Linear Prediction)
VII. RPE-LTP (Regular Pulse Excitation - Long Term Prediction)
3. Desarrollo Teorico de las diferentes Tecnologias:
I. LPC (Linear Prediction Code)
La tecnología conocida como “LPC” (Linear PredictionCoding), fue desarrollada sobre fines de los años 1960. En 1973 fue desarrollado el primer sistema práctico que utilizó técnicas del tipo LPC.
Sobre la década de 1980, una nueva idea es introducida en la codificación de la voz. Esta idea consiste en generar “voz sintética”, simulando la manera en que se produce la voz humana en el tracto vocal. La siguiente figura muestra la anatomía del aparatofonador, desde los pulmones hasta los labios.
Es posible realizar un modelo del tracto vocal basado en un generador de impulsos de aire y un conjunto de tubos, de diámetros variables, como se muestra en la siguiente figura Los tubos en su conjunto, se comportan como un filtro que varía lentamente con el tiempo, pero con propiedades estables (cuasiestacionarias) en intervalos cortos (de algunadecena de milisegundos).
Un generador de impulsos puede modelar la señal que excita el tracto vocal. En el caso de ser una señal “sonora” (por ejemplo las vocales), el modelo es un generador de impulsos periódicos, simulando la apertura y cierre periódicos de las cuerdas vocales, a una frecuencia dada por el tono (o “pitch”) de la voz. De tratarse de un sonido sordo (por ejemplo la “m” ola “s”), el modelo es más parecido a un generador de "ruido blanco", simulando la señal luego de pasar por un estrechamiento del conducto vocal (la turbulencia del aire luego de pasar por dicho estrechamiento tiene un comportamiento muy aperiódico). El conducto vocal en su conjunto puede ser modelado como un filtro de respuesta variable en el tiempo (pero estacionario en periodos cortos), cuya...
Leer documento completo
Regístrate para leer el documento completo.