Medicina General
El objetivo de esta técnica estadística es expresar la probabilidad de que ocurra un hecho como función de ciertas variables, supongamos que son k (k ³ 1), que se consideran potencialmente influyentes. La regresión logística, al igual que otras técnicas estadísticas multivariadas, da la posibilidad de evaluar la influencia decada una de las variables independientes sobre la variable respuesta y controlar el efecto del resto. Tendremos, por tanto, una variable dependiente, llamémosla Y, que puede ser dicotómica o politómica (en este trabajo nos referiremos solamente al primer caso) y una o más variables independientes, llamémoslas X.
Al ser la variable Y dicotómica, podrá tomar el valor "O" si el hecho no ocurre y "1" siel hecho ocurre; el asignar los valores de esta manera o a la inversa es intrascendente, pero es muy importante tener en cuenta la forma en que se ha hecho llegado el momento de interpretar los resultados. Las variables independientes (también llamadas explicativas) pueden ser de cualquier naturaleza: cualitativas o cuantitativas. La probabilidad de que Y=1 se denotará por p.
La forma analíticaen que la probabilidad objeto de interés se vincula con las variables explicativas es la siguiente.3
Esta expresión es la que se conoce como función logística; donde exp denota la función exponencial y a1, b1, b2... bk son los parámetros del modelo. Al producir la función exponencial valores mayores que 0 para cualquier argumento, p tomará solo valores entre 0 y 1.
Si b es positiva (mayor que0) entonces la función es creciente y decreciente en el caso contrario. Un coeficiente positivo indica que p crece cuando lo hace la variable.
Algunas consideraciones de tipo práctico
Para una mejor interpretación de los coeficientes b1 (cualquiera de los coeficientes b1) es necesario referirnos al concepto de riesgo relativo. El riesgo relativo de un suceso se define como la razón entre laprobabilidad de que dicho suceso ocurra (p) y la probabilidad de que no ocurra (1-p). El exponencial de los bi se corresponde con el riesgo relativo, o sea, es una medida de la influencia de la variable xi sobre el riesgo de que ocurra ese hecho y suponiendo que el resto de las variables del modelo permanezcan constantes. Un intervalo de confianza para el exponencial de b que contenga al 1 indica quela variable no tiene una influencia significativa en la ocurrencia del suceso y, por el contrario, valores más alejados de este indican una mayor influencia de la variable.4,5
En el ejemplo se expone más claramente la interpretación del exponencial de los b1.
Una vez estimados los valores de a y b1, podemos determinar la probabilidad del suceso para distintos valores de los Xi. El valor de a secorresponde con la constante en la salida de la regresión logística.
Variables categóricas
Cuando algunas de las variables explicativas son de índole nominal, de más de 2 categorías (politómicas), para incluirlas en el modelo hay que darles un tratamiento especial.
Si estamos en presencia de una variable nominal con C categorías, debemos incluirla en el modelo de regresión logística comovariable categórica, de manera que a partir de ella se crean C-1 variables dicotómicas llamadas dummy o ficticias.6 Al crear las variables dummy se debe precisar con cuál de las categorías de la variable original interesa comparar el resto y esa será la llamada categoría de referencia.
En general, el exponencial del coeficiente correspondiente a una de las variables dummy, estima la magnitud en quevaría el riesgo de que ocurra el suceso, compara esa categoría con la de referencia.
Variables ordinales
En el caso de las variables ordinales se puede asumir que la escala funciona aproximadamente a un nivel cuantitativo, desde luego, tal maniobra presupone que se considere que la "distancia" entre categorías contiguas es la misma. En el caso contrario, las variables ordinales pueden manejarse...
Regístrate para leer el documento completo.