Trabajo sobre el codec ilbc para voz ip
3. CODIFICADOR
+-----------+ +---------+ +---------+
speech -> | 1. Pre P | -> | 2. LPC | -> | 3. Ana | ->
+-----------++---------+ +---------+
+---------------+ +--------------+
-> | 4. Start Sel | ->| 5. Scalar Qu | ->
+---------------+ +--------------+
+--------------+ +---------------+
-> |6. CB Search | ->| 7. Packetize | -> payload
| +--------------+ | +---------------+
----<---------<------
sub-frame 0..2/4 (20 ms/30 ms)
1. Pre-proceso con un filtro paso alto HP, si es necesario (sección 3.1).
2. Calculo de los parámetros LPC, cuantificación, e interpolación (sección 3.2).
3. Utilización defiltros de análisis en el discurso para calculos residuales (artículo 3.3).
4. Selección de la posición de la muestra 57/58 para comienzo de (sección 3.5).
5. Cuantificación de la muestra 57/58 del estado inicial con cuantización escalar
(sección 3.5).
6. Búsqueda en el libro de códigos para cada sub-trama. Comience con la muestra 23/22 del bloque, entonces la codificación decada subbloque sigue hacia adelante en el tiempo, y a continuación la codificación de los subbloques va hacia atrás en el tiempo. Para cada bloque los pasos que se llevan a cabo son los de la figura 3.4, sección 3.6.
7. El empaquetado de los bits en la carga útil se especifica en la Tabla 3.2.
Las tramas de entrada al codificador deben ser de 16 bits con codificación PCM uniformemuestreadas 8 KHz. También debe ser dividida en bloques de 160/240
muestras. Cada entrada de este bloque con el codificador está dividido en 4/6 sub-bloques consecutivos 40 muestras cada uno.
0 39 79 119 159
+---------------------------------------+
| 1 |2 | 3 | 4 |
+---------------------------------------+
20 ms frame
0 39 79 119 159 199 239
+-----------------------------------------------------------+
| 1 | 2 | 3 | 4 |5 | 6 |
+-----------------------------------------------------------+
30 ms frame
Figura 3.2. Una entrada de bloque para el codificador de 20 ms (con cuatro sub-
tramas) y 30 ms (con seis sub-tramas).
3.1. Pre-procesamiento
En algunas aplicaciones, la señal de voz grabada contiene un ruido. Si estoscomponentes no se han eliminado antes de la llamada al codificador, se debe aplicar un filtro paso alto
3.2. LPC Analysis and Quantization
La entrada al módulo de análisis de LPC es, contiene de 240 / 300 muestras de habla, donde las muestras 0 hasta 79/59 son del bloque anterior y las muestras 80/60 hasta 239/299 son del bloque actual. Estas muestras no se anticipan a lasdel siguiente bloque. Para el 1º bloque de procesado se asume que las muestras son cero.
Para cada bloque de entrada, el análisis LPC calcula uno o dos conjuntos de los
10 coeficientes del filtro LPC utilizando el método de la autocorrelación (aplicando ventanas Hamming) y el algoritmo de Levinson-Durbin. Estos coeficientes llamados LSF son la representación de línea del espectro de...
Regístrate para leer el documento completo.