Técnicas Básicas De Análisis Localizado En Frecuencia
Asignatura:
Laboratorio de Tratamiento Digital de la Voz
PRÁCTICA 3
TÍTULO: TÉCNICAS BÁSICAS DE ANÁLISIS LOCALIZADO EN FRECUENCIA
REQUISITOS/ CONOCIMIENTOS PREVIOS
Transformada de Fourier de la voz. Características acústicas en el dominio de la frecuencia de los diferentes sonidos que componen el habla.
2. TransformadaLocalizada de Fourier. Cálculo e interpretación de espectrogramas.
3. Predicción Lineal. Envolvente espectral. Estimas de posición de Formantes.
INSTRUCCIONES GENERALES
En esta práctica se continuará utilizando la función MATLAB de análisis localizado (ALOC), desarrollada en la práctica anterior, pero ahora aplicada al análisis de Fourier de la voz. La evolución tiempo-frecuencia de la voz seconsiderará haciendo uso de la función MATLAB SPECGRAM. También en esta práctica se planteará la resolución del análisis de Predicción Lineal partiendo de la autocorrelación de un segmento de voz. A partir de los coeficientes de Predicción Lineal utilizaremos la función FREQZ para representar la envolvente espectral de los diferentes sonidos, y las funciones ROOTS y ANGLE para estimar laposición de los formantes de la voz.
OBJETIVOS GENERALES
Los objetivos de esta práctica son:
Obtener, analizar e interpretar medidas de análisis localizado en frecuencia: tanto medidas locales de espectros de diferentes sonidos, como medidas de evolución tiempo-frecuencia (espectrogramas) de los mismos.
Experimentar la aplicación de la Predicción Lineal sobre señales correspondientes a diferentessonidos. Analizando tanto la envolvente espectral obtenida como la estima de los formantes de la voz.
Aplicar las medidas anteriores a la problemática del cálculo de trayectorias de formantes y reconocimiento automático de vocales y de dígitos.
ACTIVIDADES
1. Cálculo de la Transformada de Fourier de diferentes segmentos de voz.
La medida de la Transformada de Fourier de una ventana deseñal de voz nos da información tanto de la articulación del sonido (envolvente espectral) como de la vibración o no de las cuerdas vocales (estructura armónica o fina del espectro).
Una forma simple de obtención y representación del espectro del segmento de voz "x" en MATLAB sería:
>>DFTx=fft(x);
>>plot(20*log(abs(DFTx(1:length(x)/2))));
Nota: Representamos sólo el módulo endB. Podríamos haber utilizado SEMILOGY para evitar el cálculo de 20*log( … ). Es importante saber interpretar los valores que figuran en el eje X de la gráfica.
Una vez resueltos los problemas de interpretación básica del cálculo anterior, debemos concentrarnos en la interpretación de la información espectral, asociándola a características articulatorias de los diferentes sonidos de la voz.Nos fijaremos, principalmente, en los segmentos correspondientes a vocales y fricativas.
Es muy importante tener presente cómo afectará a nuestra medida los parámetros siguientes:
- Tipo de ventana de análisis.
- Tamaño de la ventana de análisis.
- Número de puntos de la FFT.
Por ejemplo:
- Un análisis realizado con una ventana pequeña no nos permitirá ver laestructura fina del espectro de una vocal, sólo nos permitirá ver la envolvente del sonido.
- Si sobre la Transformada de Fourier medimos la frecuencia fundamental ¿qué resolución tendremos?
2. Cálculo e interpretación de espectrogramas.
La medida de la Transformada de Fourier de una ventana de señal de voz sólo nos da información de un sonido aislado en la cadena hablada. Sin embargola información principal de la voz se manifiesta cuando realizamos un análisis tiempo-frecuencia.
Como segundo grupo de actividades de esta práctica haremos uso de la función SPECGRAM que proporciona MATLAB para calcular y representar espectrogramas de diferentes palabras o frases cortas.
Es importante, en primer lugar, analizar las posibilidades que ofrece la función SPECGRAM, ya que...
Regístrate para leer el documento completo.