Regresion logistica
REGRESIÓN LOGÍSTICA BINARIA
Autores: Ángel Alejandro Juan Pérez (ajuanp@uoc.edu), Renatas Kizys (rkizys@uoc.edu), Luis María Manzanedo Del Hoyo (lmanzanedo@uoc.edu).
ESQUEMA DE CONTENIDOS
________________________
Modelos con variable dependiente categórica
Modelo de prob. lineal
Regresión Logística Binaria
Modelo Logit con Minitab Modelo Probit conMinitab
INTRODUCCIÓN
___________________
Una variable binaria es aquella que sólo puede adquirir dos posibles valores (Sí-No, 0-1, Verdadero-Falso, etc.). Las variables binarias constituyen un subconjunto muy importante de las llamadas variables categóricas o cualitativas, las cuales están muy presentes en la economía y las ciencias sociales. En concreto, este tipo de variables juegan un papelfundamental en áreas como la teoría de la decisión y el management. Cuando se pretende explicar, mediante un modelo de regresión, el comportamiento de una variable (llamada variable endógena o dependiente) en función de los valores que tomen otras (llamadas variables exógenas o explicativas), suele utilizarse un modelo de regresión lineal múltiple (MRLM o MRLG). Ahora bien, como veremos en estemath-block, el modelo lineal presenta ciertos problemas serios cuando la variable dependiente es binaria (y, en general, categórica), lo cual nos llevará a usar modelos de regresión no lineales -específicamente pensados para realizar regresión con variables categóricas. Los modelos que analizaremos aquí serán el Logit y el Probit.
Proyecto e-Math Financiado por la Secretaría de Estado deEducación y Universidades (MECD)
1
Regresión Logística
OBJETIVOS
• • • •
________________________
Ampliar los conceptos de regresión al caso en que la variable dependiente sea categórica. Conocer el modelo de probabilidad lineal y los problemas que éste presenta a la hora de explicar el comportamiento de una variable dependiente binaria. Entender los modelos Logit y Probit como modelos quepermiten superar las dificultades del modelo de probabilidad lineal. Aprender a realizar regresión logística binaria con ayuda de Minitab, interpretando correctamente los resultados generados por el programa.
CONOCIMIENTOS PREVIOS
___________________________________
Aparte de estar iniciado en el uso del paquete estadístico Minitab, resulta muy conveniente haber leído con profundidad lossiguientes math-blocks: • • Regresión Lineal Múltiple Introducción al MRLG
CONCEPTOS FUNDAMENTALES_______________________________________
Modelos con variable dependiente cualitativa
Un modelo de regresión múltiple (no necesariamente lineal) nos permite explicar el comportamiento de una variable dependiente Y en función de una serie de variables independientes X1, X2, ..., Xk y de un términode perturbación u, i.e.:
Y = f (X 1 , X 2 ,..., X k , u )
En el caso particular de que el modelo de regresión sea lineal, tendremos una expresión de la forma:
Y = β 1 + β 2 ⋅ X 2 + ... + β k ⋅ X k + u
(donde usamos la notación X1 = 1 para la “variable” que acompaña al término independiente). El objetivo de la regresión será estimar los parámetros del modelo (en el caso lineal: β1, β2,..., βk), de forma que el modelo resultante se ajuste lo mejor posible a las observaciones. Cuando la variable dependiente Y es continua, resulta frecuente utilizar un modelo de regresión lineal múltiple como el anterior. En tal caso la estimación de los parámetros β1, β2, ..., βk se lleva a cabo mediante los métodos de Mínimos Cuadrados (MCO o MCG). Por otro lado, puede ocurrir que la variabledependiente Y sea una variable cualitativa o categórica, i.e., que Y sólo pueda tomar un conjunto reducido de valores. En tales circunstancias, el modelo de regresión lineal presentará una serie de inconvenientes serios
Proyecto e-Math Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
2
Regresión Logística (como veremos en este math-block), por lo que será...
Regístrate para leer el documento completo.