Regresión logística en spss

Solo disponible en BuenasTareas
  • Páginas : 28 (6958 palabras )
  • Descarga(s) : 0
  • Publicado : 20 de enero de 2011
Leer documento completo
Vista previa del texto
DOCUWEB FABIS Dot. Núm 0702012

Cómo hacer una Regresión Logística con SPSS© “paso a paso”. (I)
Aguayo Canela, Mariano.
Servicio de Medicina Interna. Hospital Universitario Virgen Macarena. Sevilla

Resumen
En este primer documento sobre la Regresión Logística (Binaria) se aportan los conceptos básicos teóricos para llevarla a cabo, junto con recomendaciones elementales para una correctaaplicación del análisis, y luego se explican detalladamente las opciones que tiene el programa estadístico SPSS y la interpretación de los principales resultados.

0. Introducción.
0.1. RECORDATORIO TEÓRICO.
Cuando tengamos una variable dependiente dicotómica (0/1; SI/NO; VIVO/MUERTO; CURADO/NO-CURADO, HIPERTENSIÓN/NORMOTENSIÓN, etc.) que deseemos predecir, o para la que queramos evaluar laasociación o relación con otras (más de una) variables independientes y de control, el procedimiento a realizar es una REGRESIÓN LOGÍSTICA (RL) BINARIA MULTIVARIANTE.1 La Regresión Logística es probablemente el tipo de análisis multivariante más empleado en Ciencias de la Vida. Las razones más poderosas son: 1. Permite introducir como variables predictoras de la respuesta (efecto o v. dependiente)una mezcla de variables categóricas y cuantitativas. 2. A partir de los coeficientes de regresión (β) de las variables independientes introducidas en el modelo se puede obtener directamente la OR de cada una de ellas,2 que corresponde al riesgo de tener el resultado o efecto evaluado para un determinado valor (x) respecto al valor disminuido en una unidad (x-1).
Así, si la variable independiente esuna variable cuantitativa, la OR que se obtiene representa la probabilidad del evento predicho que tiene un individuo con
También podría llevarse a cabo un análisis discriminante, que permite –al igual que la RL- clasificar a los individuos, pero requiere el cumplimiento de dos supuestos: las p variables independientes deben seguir una distribución Normal multivariante, y las matrices devarianzas-covarianzas de las p variables independientes en cada grupo deben ser iguales. Por ello se dice que la RL es más robusta que el análisis discriminante, al requerir menos supuestos.
2 1

OR = eβ, siendo el número “e” la base de los logaritmos neperianos (una constante cuyo valor es 2,718). Correspondencia: marianoaguayo@telefonica.net

1 de 16

Aguayo Canela, Mariano

DocuWebfabis.org, 2007

un valor x frente a la probabilidad que tiene un individuo con valor (x-1). Por ejemplo, si X es la variable EDAD (en años cumplidos) y estamos prediciendo muerte, la OR será la probabilidad de muerte que tiene, por ejemplo, un individuo de 40 años en relación a la que tiene uno de 39 años.3 Si la variable independiente es cualitativa, la RL sólo admite categóricas dicotómicas, de maneraque la OR es el riesgo de los sujetos con un valor frente al riesgo de los sujetos con el otro valor para esa variable.

3. En la RL la variable dependiente (la que se desea modelizar, Y) es categórica, habitualmente dicotómica (RL binaria), lo que constituye una circunstancia muy frecuente y simple de representar fenómenos en la naturaleza y en ciencias de la vida: SI/NO, PRESENTE/AUSENTE,etc. Esto hace a este tipo de análisis el ideal para aplicar en los estudios de casos y controles, estudios en los que los casos tienen algo (habitualmente una enfermedad, un efecto o un desenlace) y los controles no. 4. Lo que se pretende mediante la RL es expresar la probabilidad de que ocurra el evento en cuestión como función de ciertas variables, que se presumen relevantes o influyentes. Si esehecho que queremos modelizar o predecir lo representamos por Y (la variable dependiente), y las k variables explicativas (independientes y de control) se designan por X1, X2, X3,…,Xk, la ecuación general (o función logística) es: 1 P(Y=1) = --------------------------------------------------------------1 + exp (– α – β1X1 – β2X2 – β3X3 – … – βKXk)

donde α, β1, β2, β3,…, βk son los parámetros...
tracking img