Trx Datos
Universidad Autónoma de Madrid
Transmisión de Datos Codificación de Fuente
José M. Martínez
Grupo de Tratamiento de Imágenes Escuela Politécnica Superior Universidad Autónoma de Madrid, SPAIN JoseM.Martinez@uam.es tel:+34.91.497.22.58 2011-2012
Escuela Politécnica Superior
Universidad Autónoma de Madrid
Índice
Introducción FundamentosAlgoritmos de codificación de fuente sin pérdidas Teoría Tasa-Distorsión Cuantificación Codificadores
Transmisión de Datos (JoseM.Martinez@uam.es, 2011-2012)
Codificación de fuente (2)
1
Escuela Politécnica Superior
Universidad Autónoma de Madrid
Índice
Introducción Fundamentos Algoritmos de codificación de fuente sin pérdidas Teoría Tasa-Distorsión CuantificaciónCodificadores
Transmisión de Datos (JoseM.Martinez@uam.es, 2011-2012)
Codificación de fuente (3)
Escuela Politécnica Superior
Universidad Autónoma de Madrid
Introducción
Información: nuevo conocimiento que se obtiene acerca de algo
La información se obtiene oyendo, viendo, oliendo, tocando, …
Fuente de información: algo de interés para el receptor que no sabe la salida poradelantado En Sistemas de (tele)comunicación la información se obtiene observando una fuente aleatoria transmitida por un canal, esto es, una variable aleatoria Objetivo: diseñar sistema de comunicación para transmitir fiablemente (o con la mínima distorsión) un proceso aleatorio (la información)
Reducir (sin/con pérdidas) la cantidad de información [codificación de fuente] Diseñar sistemastransmisión con la menor probabilidad de error de bit [teoría de la comunicación] Diseñar códigos/sistemas de protección (detección/corrección) frente a errores [codificación de canal]
Transmisión de Datos (JoseM.Martinez@uam.es, 2011-2012)
Codificación de fuente (4)
2
Escuela Politécnica Superior
Universidad Autónoma de Madrid
Introducción Código fuente: Mapeo del rango de unafuente a un conjunto finito de símbolos de un alfabeto D-ario
Binario: {0,1}, {punto, raya}, … Ternario: {A, B, C} … Ejemplo: fuente:{Red, Blue}, alfabeto={0,1}, código={00,11}. No es óptimo pero es código
Códigos:
Palabras código de longitud fija (asignación “ciega”) Palabras código de longitud variable (basados en estadísticos) Palabras código de longitud fija con longitud deentrada variable (no requieren conocer estadísticos) …
Compresión (límite H): Codificación sin pérdidas vs con pérdidas
Transmisión de Datos (JoseM.Martinez@uam.es, 2011-2012) Codificación de fuente (5)
Escuela Politécnica Superior
Universidad Autónoma de Madrid
Ejemplos de codificación de fuente (I)
Código Braille:
3x2 puntos llano/marcado (on/off) => binario 6 puntos binarios=> 6 bits => 64 símbolos (2 6) Letras, dígitos y símbolos de puntuación son menos de 64 El resto se utiliza para palabras, prefijos y sufijos comunes (como en taquigrafía) No comprime mucho, pero es fácilmente (y rápidamente) decodificable
Compresión de texto irreversible
En general texto se basa en código ASCII (8bits/símbolo): caracteres imprimibles 32-255
o Código Unicode(16bits/símbolo): caracteres imprimibles 0x0020-0xFFFC (3265.532)
Quitar caracteres de formato, acentos, puntuación, pasar todo a mayúsculas/minúsculas (26 + ñ = 27) => 5 bits (2 5=32) y quedan 5 para blanco, puntuación, palabras comunes, … Ciertas pérdidas, pero …
Transmisión de Datos (JoseM.Martinez@uam.es, 2011-2012) Codificación de fuente (6)
3
Escuela Politécnica Superior
UniversidadAutónoma de Madrid
Ejemplos de codificación de fuente (II)
Compresión ad-hoc (reversible) de texto
Quitar blancos y sustituir por cadena binaria de 100000100001…
o 1: indica blanco, 0: carácter
Quitar blancos de formato y sustituir por digito de número de blancos (extensión de fuente-codificación por carreras…)
o Hace falta código de escape …
Usar 7 bits para los caracteres...
Regístrate para leer el documento completo.