Teoría de la Información
Por Ángel Fernando Kuri Morales
La teoría de la información es una disciplina que se centra en el enfoque matemático
al estudio de la recopilación y manipulación de información. La información puede estar
contenida, básicamente, en cualquier tipo de objeto que sea representable en la computadora, por
ejemplo en un texto, una pintura, un sonido, unapelícula, etc. El concepto de información por sí
mismo es interesante y hay que recalcar que, en el presente capítulo, se dan dos definiciones
precisas de tal forma que podamos hablar de información independientemente del contexto
personal o cultural en el que el objeto de nuestro estudio se encuentre enclavado.
1.1. Información y significado.
Una de las preguntas que surgen de manera naturalcuando se lee un texto es “¿Qué
tan útil es lo que estoy leyendo?”. Es una pregunta lógica cuando se desea determinar si el
esfuerzo implicado en la lectura nos dará algún beneficio. La misma pregunta podría hacerse al
observar una pintura o una película, o al escuchar una pieza musical. Esta pregunta, sin embargo,
es muy difícil de responder en primera instancia. Por ejemplo, podríamospreguntarnos el
impacto que el conocimiento derivado de la lectura del texto tendrá en nuestra vida diaria. En ese
caso habría que cuantificar en primer lugar el conocimiento y en segundo lugar el beneficio
obtenido. Ambas cosas (el conocimiento y el beneficio) son eminentemente subjetivas.
Podríamos, entonces, tratar de ser más objetivos y determinar la información contenida en el
objeto de nuestroanálisis para, posteriormente, determinar el valor intrínseco de la información
en él contenida. Por ello es que analizar la información para saber qué es y cómo se mide tiene
una importancia fundamental en la sociedad actual, que utiliza tantos instrumentos que
almacenan y transmiten toda suerte de datos.
El tratamiento actual de la teoría de la información tiene dos vertientes, la teoríaestadística de la información y la teoría algorítmica de la información. Ambas miden lo mismo,
pero la definen de diferentes maneras. Aquí haremos una breve descripción de ellas y las
contrastaremos. Sin embargo, antes de pasar a su estudio y al de sus posibles aplicaciones, vale la
pena hacer una breve digresión para tratar de hacer más intuitivo su objeto.
Supongamos que a un lector que semantiene más o menos al tanto de los resultados
en el deporte más popular del mundo y que no es un experto en computación se le presentan los
siguientes dos oraciones:
a) El gol que anotó el centro delantero definió el resultado de la copa mundial.
b) Un algoritmo genético canónico se puede modelar como una cadena de Markov
ergódica.
Si a este lector típico le preguntamos cuál de las dosfrases tiene mayor información,
lo más probable es que indique que es la primera, pues le da más información que la segunda.
Más aún, posiblemente indicará que la segunda oración no conlleva ninguna información, ya que
no es capaz de encontrarle sentido. Esta es una actitud típica y explicable. Supongamos ahora que
el lector es, además, hispano parlante y no bilingüe. A nuestro atribulado lectorle daría lo mismo
que le hubiéramos entregado, en vez de la segunda oración mostrada arriba, la siguiente oración:
c) The goal scored by the center forward defined the outcome of the World Cup.
Aquí se manifiesta el hecho de que ni la oración (b) ni la (c) tienen significado para
un lector con las características indicadas. Y es aquí en donde tenemos que enfatizar la diferencia
que existeentre significado e información. Si el lector de este libro no habla inglés, debe saber
que la oración (c) dice exactamente lo mismo que la (a), solamente que en inglés. Aunque, al no
ser anglo parlantes, seamos incapaces de extraer significado de (c), debe resultar evidente (ahora
que se nos ha dicho que significan lo mismo) que tanto (a) como (c) contienen la misma
información. La moraleja...
Regístrate para leer el documento completo.