PROCESAMIENTO DE DATOS

Páginas: 10 (2442 palabras) Publicado: 1 de abril de 2014

FUNDAMENTOS DE LA TEORÍA DE LA INFORMACIÓN
Información e incertidumbre son términos técnicos para describir algún proceso que selecciona uno o más elementos de un conjunto.
Por ejemplo, supongamos que tenemos una fuente que nos puede generar tres (3) símbolos, A, B o C. Cuando la fuente genere un símbolo X des conecemos (incertidumbre) cual será el próximo símbolo generado; una vez queobservamos un símbolo generado nuestra incertidumbre comienza a disminuir (conocemos al menos el símbolo anterior), y podemos recalcar que hemos recibido alguna información, entonces la información y la incertidumbre están estrechamente relacionadas. La información se puede definir como una disminución de la incertidumbre.
¿CÓMO PODEMOS MEDIR LA INCERTIDUMBRE?
Una forma simple es relacionarladirectamente con el número de símbolos de la fuente, es decir con nuestra fuente de tres símbolos tendríamos una "incertidumbre de 3 símbolos" ; este planteamiento funciona bastante bien con una sola fuente, pero si adicionamos una segunda fuente que por ejemplo genere dos caracteres D y E, con un incertidumbre propia de 2 símbolos, al analizar simultáneamente las fuentes se generaran 6 símbolos porcombinación (AD, AE, BD, BE, CD, CE) obteniendo una incertidumbre de 6 símbolos para el sistema.
Pero usualmente la información no la manipulamos de esta manera, por ejemplo si recibimos dos libros (Fuentes) los analizamos por separado y luego los comparamos, es decir extraemos la información de cada libro de manera independiente y luego podemos "Sumarlas" para encontrar la información totalrecibida.
CARACTER ADITIVO DE LA INCERTIDUMBRE
Esto es bastante simple, lo primero que debemos hacer el tomar el logarítmo del número posible de símbolos para de esta manera poder sumar los logarítmos en lugar el multiplicar los símbolos. Por ejemplo si observemos nuestras dos fuentes:
FUENTE
SÍMBOLOS
INCERTIDUMBRE
1
A, B, C
LOG (3)
2
D, E
LOG (2)
CONJUNTA
AD,AE,BD,BE,CD,CE
LOG (3) +LOG (2)
Tabla 1
Es de notar que la incertidumbre de la fuente conjunta LOG (3) + LOG (2) es lo mismo que LOG (6).
Por último, la base de el logarítmo determina las unidades a utilizar (Tabla 2)
BASE
UNIDADES
2
bits
3
trits
e
Natural
10
Hartlyes
Tabla 2
De esta manera si nuestra fuente produce un sólo símbolo entonces tenemos una incertidumbre dada por el LOG2 (1) = 0, es decirtenemos total certidumbre sobre el próximo símbolo que generara la fuente. Ahora tomemos el caso en el que nuestra fuente genera más de un símbolo y con diferentes probabilidades, por ejemplo si nuestra fuente 1 genera solo dos (2) símbolos de los tres (3) posibles, tenemos que considerar una incertidumbre dada por el logarítmo de dos (2) en el lugar del logarítmo de tres (3) es decir la incertidumbrede esta fuente es de un (1) bit; más aún si ahora el tercer símbolo aparece aunque sea en muy pocas ocaciones tendremos que manejar un incertidumbre mayor a uno (1) (Superior al Log2 (2)) pero tan alta como la dada por el log2 (3).
Ahora podemos plantear la siguiente ecuación para la incertidumbre:

Pero como las probabilidades de aparición de los símbolos pueden ser diferentes tenemos:Ahora calculemos la incertidumbre de la observación del simbolo i denotada Ui:
Ui = -LOG2 (Pi)
Si Pi tiende a 0, Sería muy sorprendente observar el símbolo i.y Ui tiende a infinito.
Si Pi tiende a 1, Es natural bservar el símbolo i.y Ui tiende a cero (0). Es decir no existe incerdiumbre ya que este símbolo siempre apareceria.
La incertidumbre es el promedio de los Ui para una cadena quecontenga infinitos símbolos, por ahora tomemos una cadena que contenga N símbolos, entonces:

El promedio de los Ui para N símbolos es:

Si nuestra cadena es lo suficientemente larga , entonces la frecuencia (Ni/N) se puede tomar como la probabilidad de aparición del símbolo i (Pi); realizando este reemplazo en la ecuación anterior obtenemos:

Como:

Si nuestros símbolos se generan con igual...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Base de datos(procesamiento de datos
  • Procesamiento de datos
  • Procesamiento De Datos
  • proceso de datos
  • Procesamiento De Datos
  • Procesamiento De Datos
  • Procesamiento De Datos
  • procesamiento de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS