Clusters En Medicina
Hidden Markov Models; Teoría y Algoritmos
HMM
Un Modelo Oculto de Markov es un modelo estadístico en donde se relacionan dos procesos estocásticos que cumplen con las propiedades markovianas. Existe un proceso estocástico que es observable y se rige por una cadena de Markov, este proceso genera una secuencia de observaciones con las cuales se pretende, por medio del otroproceso estocástico, determinar una secuencia de variables que no es posible observar pero que comparten una relación probabilística con las observables.
Este modelo puede ser foralmente definido mediante la siguiente información:
Conjunto de posible estados S=s1, s2, …,sn
Conjunto de posible valores observables V=v1, v2, …,vm
Conjunto de probabilidades A=aij que se puede expresar comouna matriz de probabilidad donde aij=Pst=j st-1=i)
Conjunto de probabilidades B=bj(vk) que se puede expresar como una matriz de probabilidad donde bj(vk)=Pot=vk st=j) la probabilidad de observar vk en el instante t, dado que en el mismo instante se esta en el estado j
Probabilidades iniciales π donde πi=P("estado inicial" = si)
Un ejemplo muy conocido de un modelo de oculto de Markov es elmodelo que consiste en tener m Bolas en n Urnas, en donde en cada una de las urnas están las m bolas (cuya diferencia se representa por colores). Entonces el experimento consiste en que las urnas son escogidas probabilísticamente de acuerdo con un proceso estocástico, y de cada urna se saca una bola de acuerdo a otro proceso estocástico. Estas urnas representaran los estados ocultos, y lasecuencia de bolas obtenidas representa las observaciones. Entonces la idea es, a partir de estas observaciones y con los parámetros del modelo (los conjuntos de probabilidades anteriormente mencionados), poder determinar la secuencia de estados (que se supone desconocida) de donde pudieron haber sido generadas estas observaciones, que maximice la probabilidad P(“secuencia de estados” |”secuencia deobservaciones”).
También podría ser interesante determinar la secuencia de observaciones más probable dado los parámetros del modelo y un estado inicial. Esto es, por así decirlo, predecir la salida del modelo según sus parámetros de probabilidades.
Esto nos lleva a definir los tres problemas básicos que se presentan en las aplicaciones de las HMM.
Problema 1
Dada una secuencia de observacionesO = <o1,o2,…,oT> y un modelo θ=(A,B, π) determinar la probabilidad de la secuencia observada dado el modelo POθ.
Problema 2
Dada una secuencia de observaciones O = <o1,o2,…,oT> y un modelo θ=(S,V,A,B, π) determinar una secuencia correspondiente = <q1,q2,…,qT> que mejor (óptimamente) explique la secuencia O (generalmente se maximiza la probabilidad condicional de la secuenciaQ dado el modelo y las observaciones O PQθ, O).
Problema 3
Este problema se refiere a la etapa de entrenamiento en donde los parámetros del modelo son estimados con la información proveniente de un conjunto de series de observaciones y sus respectivas series de estados ocultos que en este caso se conocen, es decir, se pretende obtener las estimaciones de A y B dado un conjunto de datos deentrenamiento, todo esto maximizando POθ, Q.
Por lo general, en la mayoría de aplicaciones estos tres problemas son resueltos secuencialmente y es necesaria la solución de cada uno de ellos, pues para poder resolver los problemas 1 y 2 es necesario haber resuelto el problema 3 y para poder resolver el problema 1 es conveniente haber resuelto el problema 2. Más adelante será más claro cuando seexpliquen los algoritmos de solución de los problemas.
Solución Problema 1
Para resolver este problema, es decir, para poder calcular POθ se pueden agrupar todas las secuencias posibles Q en un conjunto, llamémoslo Ω, entonces así POθ= ΩPOQ,θP(Q|θ). Ahora para algún Q en donde q1 sea el estado inicial PQθ= πq1aq1q2aq2q3…aqT-1qT. Por otro lado POQ,θ=bq1(o1)bq2(o2)…bqT(oT). Ahora bien pensar que...
Regístrate para leer el documento completo.