Procesado De Voz
Practica 3: Procesamiento de Voz
2012/2013
Ing. Telecomunicación + ITIS
Ejercicio 1:
- Pruebea cargar el archivo ‘frase1.wav’ y reproducirlo con su frecuencia original (8KHz). Reproduzca la señal al doble y a la mitad de la frecuencia y comente los resultados de la escucha.
Vemos que sireproducimos la señal al doble de la frecuencia, la señal se reproduce el doble de rápido y más aguda de lo normal, mientras que si la reproducimos a la mitad pasa lo contrario, que la señal se oye máslento y grave de lo habitual.
Ejercicio 2:
- Represente las dos ventanas en el dominio temporal y observe sus perfiles. ¿Qué tipo de ventana introduce menor distorsión en este dominio?
[pic] [pic]Vemos como la ventana rectangular introduce menos distorsión, ya que cogemos la parte de la señal que nos interesa y el resto la eliminamos por completo, mientras que la ventana de hamming solo loatenúa.
- Represente ahora las ventanas en el dominio de la frecuencia. Comente los resultados obtenidos y los efectos de variar:
La longitud de las ventanas.
Puesto que estamos haciendo la DFT,la longitud de las ventanas en frecuencias es 2*Pi
La relación entre la longitud de las ventanas y el número de muestras de la FFT.
El número de muestras nos afecta a la resolución a la hora deobtener la TF.
¿Cuál es el inconveniente de la ventana rectangular en este dominio?
Que tiene una menor atenuación en las frecuencias que no son del lóbulo principal.
Ejercicio 3:
- Determinela energía de la señal y en el tramo de muestras 20000:25000 utilizando ventanas de Hamming de distinta longitud mediante la función energía.
Comente los resultados obtenidos
Vemos como se distribuyela energía a lo largo de las muestras
¿Qué ocurre si la ventana es demasiado grande o demasiado pequeña?
Si la ventana es demasiado pequeña vemos muchas pequeñas variaciones y la energía se...
Regístrate para leer el documento completo.