Tr REGRESION_MULTIPLE
MODELO DE REGRESIÓN LINEAL MÚLTIPLE
Ana Justel
Justel Eusebio - 2007
Métodos Estadí
Estadísticos
Licenciatura en Biologí
Biología
REGRESIÓN MÚLTIPLE
Cuando la respuesta depende de varias variables explicativas
cuantitativas
La regresión múltiple es mejor que la simple porque se
mejora la predicció
predicción de la variable respuesta
Cuando la respuesta depende de más de una variable,la
regresión simple las considera una a una y se pueden
producir fácilmente sesgos en la estimación de los efectos
que tienen cada una de ellas en la respuesta
Las
ideas
de
la
regresión
simple
automáticamente a la regresión múltiple
Ana Justel
Justel Eusebio - 2007
Métodos Estadí
Estadísticos
Licenciatura en Biologí
Biología
se
extienden
casi
Modelo
y i = β0 + β1x1i + β 2 x 2i + L + βk xki + ui
Requisitos adicionales de la regresión múltiple
Hay al menos tantos datos como pará
parámetros desconocidos
“n es igual o mayor que k+2”
k+2”
Ninguna de las variables explicativas es combinació
combinación lineal
exacta de las restantes (colinearidad)
colinearidad)
Ana Justel
Justel Eusebio - 2007
Métodos Estadí
Estadísticos
Licenciatura en Biologí
Biología
y i = β0 + β1x1i + β 2 x 2i +L + βk x ki + ui
Interpretació
Interpretación de los pará
parámetros:
β0
Representa el valor medio de la respuesta (y) cuando
todas las variable explicativas (x) valen cero
Representa el incremento de la respuesta media (y)
cuando la variable explicativa (xi) aumenta en una
unidad y el resto de las variables explicativas
i = 1,..., k
permanecen constantes
βi
Ana Justel
Justel Eusebio - 2007Métodos Estadí
Estadísticos
Licenciatura en Biologí
Biología
Los datos
La nube de puntos está
está en
un espacio de dimensió
dimensión
k+1, que es difí
difícil de ver
cuando k es mayor que 2
Notación matricial
x11
x21
⎛ y1 ⎞ ⎛1
⎜ ⎟ ⎜
x12
x22
⎜ y 2 ⎟ ⎜1
=
⎜ M ⎟ ⎜M
M
M
⎜ ⎟ ⎜
⎜ y ⎟ ⎜1
x1n
x2n
⎝ n⎠ ⎝
L
L
O
L
xk1 ⎞⎛ β 0 ⎞ ⎛ u1 ⎞
⎟⎜ ⎟ ⎜ ⎟
xk 2 ⎟⎜ β1 ⎟ ⎜ u 2 ⎟
+
M ⎟⎜ M ⎟ ⎜ M ⎟
⎟⎜ ⎟ ⎜ ⎟
xkn ⎟⎠⎜⎝ β k⎟⎠ ⎜⎝ u n ⎟⎠
Y = Xβ + U
U → N(0, σ 2I)
Ana Justel
Justel Eusebio - 2007
Métodos Estadí
Estadísticos
Licenciatura en Biologí
Biología
Estimación de los parámetros
Los cálculos son complicados
y los hacen los ordenadores
Ana Justel
Justel Eusebio - 2007
Métodos Estadí
Estadísticos
Licenciatura en Biologí
Biología
Ejemplo: Terapia génica en el tratamiento de un tipo de cáncer
(Álvarez 2004, tesisdoctoral)
En cada cultivo se prueba a administrar diferentes concentraciones
de fluorocitosina (5FC) y distintos niveles de radiación
Se miden los porcentajes de supervivencia de las líneas celulares
de cáncer, siendo el tratamiento más efectivo el que da un
porcentaje menor
Coeficientesa
Estimació
Estimación de los
coeficientes
Modelo
1
(Constante)
fluorocitosina
radiacion
Coeficientes noestandarizados
B
Error típ.
71,578
1,183
-,108
,005
-4,227
,417
Coeficientes
estandarizad
os
Beta
-,716
-,337
t
60,525
-21,539
-10,131
Sig.
,000
,000
,000
a. Variable dependiente: supervivencia
yˆ = 71,578 − 0,108 fluorocito sina − 4,227radiación
Ana Justel
Justel Eusebio - 2007
Métodos Estadí
Estadísticos
Licenciatura en Biologí
Biología
Intervalos de confianza de los coeficientes
Errortípico
i = 1,..., k
Los qi+1,i+1 está
están en la
diagonal principal de la
matriz (X’X)-1
Los cálculos son complicados
y los hacen los ordenadores
Ana Justel
Justel Eusebio - 2007
Métodos Estadí
Estadísticos
Licenciatura en Biologí
Biología
Ejemplo: Terapia génica en el tratamiento de un tipo de cáncer
(Álvarez 2004, tesis doctoral)
En cada cultivo se prueba a administrar diferentesconcentraciones
de fluorocitosina (5FC) y distintos niveles de radiación
Se miden los porcentajes de supervivencia de las líneas celulares
de cáncer, siendo el tratamiento más efectivo el que da un
porcentaje menor
Coeficientesa
Modelo
1
(Constante)
fluorocitosina
radiacion
Coeficientes no
estandarizados
B
Error típ.
71,578
1,183
-,108
,005
-4,227
,417
Coeficientes
estandarizad
os
Beta
-,716
-,337
t...
Regístrate para leer el documento completo.