Regresion logistica

Solo disponible en BuenasTareas
  • Páginas : 8 (1909 palabras )
  • Descarga(s) : 0
  • Publicado : 11 de febrero de 2012
Leer documento completo
Vista previa del texto
LA REGRESION LOGISTICA (I)
Preparado por Luis M. Molinero (Alce Ingeniería) CorreoE: bioestadistica alceingenieria.net Enero 2001 • Introducción • Los coeficientes del modelo logístico como cuantificadores de riesgo • Las variables cualitativas en el modelo logístico • Consejos sobre cómo presentar los resultados de una regresión logística • Bondad del ajuste • Bibliografía seleccionada •Enlaces Regresión logística (II) Artículo en formato PDF

Introducción
No cabe ninguna duda que la regresión logística es una de las herramientas estadísticas con mejor capacidad para el análisis de datos en investigación clínica y epidemiología, de ahí su amplia utilización. El objetivo primordial que resuelve esta técnica es el de modelar cómo influye en la probabilidad de aparición de un suceso,habitualmente dicotómico, la presencia o no de diversos factores y el valor o nivel de los mismos. También puede ser usada para estimar la probabilidad de aparición de cada una de las posibilidades de un suceso con más de dos categorías (politómico). De todos es sabido que este tipo de situaciones se aborda mediante técnicas de regresión. Sin embargo, la metodología de la regresión lineal no esaplicable ya que ahora la variable respuesta sólo presenta dos valores (nos centraremos en el caso dicotómico), como puede ser presencia/ausencia de hipertensión. Si clasificamos el valor de la variable respuesta como 0 cuando no se presenta el suceso (ausencia de hipertensión) y con el valor 1 cuando sí está presente (paciente hipertenso), y buscamos cuantificar la posible relación entre lapresencia de hipertensión y, por ejemplo, la cantidad media de sal consumida al día como posible factor de riesgo, podríamos caer en la tentación de utilizar una regresión lineal:

y estimar, a partir de nuestros datos, por el procedimiento habitual de mínimos cuadrados, los coeficientes a y b de la ecuación. Sin embargo, y aunque esto es posible matemáticamente, nos conduce a la obtención de resultadosabsurdos, ya que cuando se calcule la función obtenida para diferentes valores de consumo de sal se obtendrá resultados que, en general, serán diferentes de 0 y 1, los únicos realmente posibles en este caso, ya que esa restricción no se impone en la regresión lineal, en la que la respuesta puede en principio tomar cualquier valor. Si utilizamos cómo variable dependiente la probabilidad p de queun paciente padezca hipertensión y construimos la siguiente función:

1

ahora sí tenemos una variable que puede tomar cualquier valor, por lo que podemos plantearnos el buscar para ella una ecuación de regresión tradicional:

que se puede convertir con una pequeña manipulación algebraica en

Y este es precisamente el tipo de ecuación que se conoce como modelo logístico, donde el número defactores puede ser más de uno, así en el exponente que figura en el denominador de la ecuación podríamos tener: b1.consumo_sal + b2.edad + b3.sexo + b4.fumador

Los coeficientes del modelo logístico como cuantificadores de riesgo
Una de las características que hacen tan interesante la regresión logística es la relación que éstos guardan con un parámetro de cuantificación de riesgo conocido enla literatura como "odds ratio" (aunque puede tener traducción al castellano, renunciamos a ello para evitar confusión ya que siempre se utiliza la terminología inglesa). El odds asociado a un suceso es el cociente entre la probabilidad de que ocurra frente a la probabilidad de que no ocurra:

siendo p la probabilidad del suceso. Así, por ejemplo, podemos calcular el odds de presencia dehipertensión cuando el consumo diario de sal es igual o superior a una cierta cantidad, que en realidad determina cuántas veces es más probable que haya hipertensión a que no la haya en esa situación. Igualmente podríamos calcular el odds de presencia de hipertensión cuando el consumo de sal es inferior a esa cantidad. Si dividimos el primer odds entre el segundo, hemos calculado un cociente de odds,...
tracking img