Regresión logística (resumen)

Solo disponible en BuenasTareas
  • Páginas : 5 (1191 palabras )
  • Descarga(s) : 0
  • Publicado : 4 de noviembre de 2010
Leer documento completo
Vista previa del texto
REGRESIÓN LOGÍSTICA Y ANÁLISIS DISCRIMINANTE
RESUMEN
Tanto la regresión logística como el análisis discriminante son técnicas multivariantes de dependencia como la regresión lineal múltiple, cuya diferencia principal consiste en que la variable dependiente es una variable categórica. (Molinero, 2006).
Para el caso de la regresión logística, el objetivo fundamental consiste en establecerun modelo que permita estimar cómo influye la presencia o ausencia de diversos factores así como su valor o nivel, en la probabilidad de aparición de un evento. Asimismo, se puede utilizar para estimar la probabilidad de aparición de cada posibilidad de un caso o evento de carácter politómico (más de dos categorías). (Molinero, 2006)
Alderete (2006) señala que este modelo proporciona la ventajade no requerir supuestos como el de normalidad multivariable y homocedasticidad, además de permitir el uso de variables independientes continuas y categóricas, similares a la regresión múltiple.
En otras palabras, cuando el objetivo es estimar la relación o asociación entre dos variables, los modelos de regresión permiten considerar que puede haber otros factores que modifiquen esa relación.(Molinero, 2006)
Una de las características que hacen tan interesante la regresión logística es la relación que éstos guardan con un parámetro de cuantificación de riesgo conocido en la literatura como "odds ratio" (término inglés).El odds asociado a un suceso es el cociente entre la probabilidad de que ocurra frente a la probabilidad de que no ocurra.
Tomando en cuenta el ejemplo citado porMolinero (2006), si queremos estudiar la posible relación, como factor de riesgo, entre el síndrome de apnea nocturna y la probabilidad de padecer hipertensión, dicha relación puede ser diferente si se tiene en cuenta otras variables como edad, el sexo o el índice de masa corporal. Por ello en un modelo de regresión logística podrían ser incluidas como variables independientes, además del dato deapnea. En la ecuación obtenida al considerar como variables independientes APNEA, EDAD, SEXO, IMC, el Exp (coeficiente de la ecuación para APNEA) nos determina el odds ratio debido a la apena, ajustado o controlado para el resto de los factores.
A las variables que, además del factor de interés (en el ejemplo EDAD, SEXO, IMC), se introducen en el modelo, se las denomina en la literatura de diferentesformas: variables control, variables extrañas, covariantes, o factores de confusión.
Si la relación entre el factor en estudio y la variable dependiente se modifica según el valor de una tercera estamos hablando de interacción. Así en nuestro ejemplo, supongamos que la probabilidad de padecer HTA cuando se tiene síndrome de apnea aumenta con la edad. En este caso decimos que existe interacciónentre las variables EDAD y APNEA.
Puesto que la metodología empleada para la estimación del modelo logístico se basa en la utilización de variables cuantitativas, al igual que en cualquier otro procedimiento de regresión, es incorrecto que en él intervengan variables cualitativas, ya sean nominales u ordinales. (Molinero, 2006)
Este problema se soluciona mediante la creación de tantas variablesdicotómicas como número de respuestas se requieran. Estas nuevas variables construidas artificialmente, reciben distintas denominaciones como pueden ser variables internas, indicadoras, o variables diseño. (Molinero, 2006)
Cómo en todo modelo de regresión, es vital corroborar el ajuste del modelo a los datos utilizados para estimarlo. En el caso de regresión logística se puede calcular laprobabilidad de aparición del suceso; si el ajuste es bueno, lo esperado es que un alto valor de probabilidad esté asociado a la variable independiente y viceversa. (Molinero, 2006). Esta idea intuitiva se lleva a cabo formalmente mediante la prueba conocida como de Hosmer−Lemeshow (1989), que básicamente consiste en dividir el recorrido de la probabilidad en deciles de riesgo y calcular la distribución...
tracking img