Redes bayecianas
Una red bayesiana es un grafo a cíclico dirigido en el que cada nodo representa una variable y cada arco una dependencia probabilística, debido a esto el razonamiento probabilístico consiste en propagar los efectos a través de la red bayesiana o de creencia, lo cual crea conjuntos de variables y relaciones de dependencia entre ellas, para así conocer a posteriori la probabilidadde una o más variables no conocidas en base a las variables conocidas, estas redes se representan en modelos los cuales pueden tener diversas aplicaciones, para clasificación, predicción, diagnostico, etc. Además, pueden dar información interesante en cuanto a como se relacionan las variables del dominio, las cuales pueden ser interpretadas en ocasiones como relaciones de causa-efecto.
Estosmodelos tienen dependencia según el tipo de aprendizaje el cual puede ser estructurado o paramétrico; En el primero se obtiene la estructura de dependencia entre las variables el cual esta dividido en aprendizaje de árbol y aprendizaje poli - árbol, y en el segundo obtiene las probabilidades a priori y condicionales requeridas.
El proceso de estimación de una red Bayesiana consiste de unaetapa de aprendizaje estructural y una etapa de aprendizaje paramétrico. La primera etapa consiste en obtener la estructura de la red y la segunda tiene por finalidad estimar los parámetros de las funciones de probabilidad condicional. La estructura puede especificarse por alguien con cierto conocimiento, de ahí que un nombre para las redes Bayesianas es también el de sistemas probabilísticosexpertos; un sistema experto por que la red codifica en su estructura el conocimiento experto de un problema y probabilístico por que las dependencias entre las variables así lo son.
TEOREMA DE BAYES
En su forma básica, el teorema de Bayes es un simple resultado de probabilidades condicionales. Sean A y B dos eventos con p (A) > 0. Entonces:
[pic]
El uso principal de este teorema, enaplicaciones de probabilidad, es revertir el condicionamiento de los eventos, esto es, mostrar cómo la probabilidad de B A está relacionada con la de A B, es decir que se parte de una situación en la que es posible conocer las probabilidades de que ocurran una serie de sucesos.
LA REGLA DE LA CADENA
La función de probabilidad conjunta para las variables aleatorias [pic]puede expresarse como elproducto de funciones condicionadas de probabilidad
[pic]
INDEPENDENCIA CONDICIONAL
Dos variables aleatorias discretas X e Y se dice que son independientes si
p (X)=p(X Y). Esto puede expresarse como p (X ,Y)=p(X )p(Y ) . En el caso de tres variables aleatorias discretas X, Y y Z se dice que X e Y son condicionalmente independientes del valor de Z si la distribución de probabilidad de X esindependiente del valor de Y dado el valor de Z, esto es p (X Y, Z) = p (X Z). Extendiendo esta definición para un conjunto de variables puede expresarse que [pic]es condicionalmente independiente de [pic]dado el conjunto de variables [pic]si
[pic]
GRAFOS
Un modelo probabilístico puede definirse usando un grafo que describa las relaciones existentes entre las variables. Supóngase unconjunto de variables [pic] que pueden relacionarse entre sí. El conjunto anterior puede representarse gráficamente por una colección de nodos o vértices, asociando un nodo a cada elemento de X. Estos nodos pueden conectarse por arcos, indicando las relaciones existentes entre los mismos. Un arco entre los nodos X i y X j se denotará mediante Lij . Así mismo, el conjunto de todos los arcos se denotarápor [pic]. Por tanto, un grafo puede definirse mediante el conjunto de nodos, X , y las relaciones entre los mismos, L.
El concepto de grafo puede definirse de forma más general. Por ejemplo, puede permitirse que dos nodos estén conectados por más de un arco o, incluso, que un nodo esté conectado consigo mismo. Sin embargo, al utilizar los grafos para representar un conjunto de variables...
Regístrate para leer el documento completo.