REGRESION LOGISTICA UdeA
•FACULTAD NACIONAL DE SALUD PÚBLICA
•“Héctor Abad Gómez”
ldbello@saludpublica.udea.edu.co
•Facultad Nacional de Salud Pública “Héctor Abad Gómez”
www.leondariobello.com
www.ciemonline.info/moodle
www.ciemonline.info/blog
Técnica multivariante, en la que la variable
dependiente es categórica y las variables
independientes son de cualquier naturaleza, es
decir,cuantitativas o cualitativas (dummy). El
interés es por medio de probabilidades, predecir
a cual grupo de la variable respuesta pertenece
un sujeto, dado otras características del mismo.
Tiene su gran aplicabilidad en investigación
clínica y epidemiología, no obstante, cada vez
más se aplica en otras áreas del conocimiento.
•www.leondariobello.com
•www.ciemonline.info/blog
Regresión logística
Engeneral, con k variables independientes:.
Para el caso del ataque al corazón, se puede expresar
una ecuación lineal así:
ln
p
a b1 presiónsanguinea b2 nivelcoles terol b3 ingestacal orias b4 sexo
1 p
La cual se puede expresar de forma logística de la
siguiente manera:
Pr( Acorazón)
1
1 e
( a
b1 presiónsanguineab2 nivelcolesterolb3ingestacaloriasb4 sexo)
P es la probabilidadde que se prediga que una persona puede
tener un ataque al corazón teniendo en cuenta las variables
independientes Xi.
•www.leondariobello.com
•www.ciemonline.info/blog
Planteamiento:
•Una variable dependiente que tiene únicamente dos
opciones.
(dicotómica)
• Se quiere calcular la probabilidad de que ocurra una u otra
a partir de una serie de informaciones (variables
independientes).
Ejemplos:• “Vota o no vota en unas elecciones”
• “Cumple la dieta o no la cumple”
• “Diagnóstico positivo o negativo en una prueba médica”
Regresión logística
Un investigador médico está interesado en
determinar si la probabilidad de un ataque
al corazón puede predecirse conociendo la
presión de la sangre del paciente, el nivel
de colesterol, la ingesta de calorías, el
sexo y algunos indicadores delestilo de
vida.
Regresión logística
La ecuación anterior modeliza el logaritmo neperiano
de las odds como una función lineal de las variables
independientes y es equivalente a una ecuación de
regresión múltiple con el ln de las odds como
variable dependiente.
Las variables independientes pueden ser continuas y
categóricas.
El ln (log) de las odds se conoce como logit. De ahí
viene el nombrede regresión logística múltiple.
Regresión logística
Si sólo hay una variable independiente:.
p
ln[
] 0 1 X1
1p
p
1
1 e
( 0 1 X1 )
Probabilidad del éxito (sí vota, sí tiene la enfermedad...)
El objetivo primordial que resuelve esta técnica es el de modelar cómo
influye en la probabilidad de aparición de un suceso, habitualmente
dicotómico, la presencia o no dediversos factores y el valor o nivel de los
mismos. También puede ser usada para estimar la probabilidad de
aparición de cada una de las posibilidades de un suceso con más de dos
categorías (politómico).
•http://www.seh-lelha.org/rlogis1.htm
•www.leondariobello.com
•www.ciemonline.info/blog
•La regresión logística resulta útil para los casos en los que se
desea predecir la presencia o ausencia deuna característica
según los valores de un conjunto de variables predictoras. la
variable dependiente es dicotómica. Los coeficientes de
regresión logística pueden utilizarse para estimar la razón de
las ventajas (odds ratio) de cada variable independiente del
modelo.
Cociente de dos ODDS
•www.leondariobello.com
•www.ciemonline.info/blog
Calcular el odds de presencia de hipertensión
cuando elconsumo de sal es inferior a esa
cantidad.
Si dividimos el primer odds entre el segundo, hemos
calculado un cociente de odds, esto es un odds ratio, que de
alguna manera cuantifica cuánto más probable es la
aparición de hipertensión cuando se consume mucha sal
(primer odds) respecto a cuando se consume poca.
•www.leondariobello.com
•www.ciemonline.info/blog
¿Qué características del estilo de...
Regístrate para leer el documento completo.