Unidades Regineal
Objetivos:
Al finalizar este capitulo el alumno será capaz de:
• Representar la recta que define la relación lineal
entre dos variables
• Estimar la recta de regresión por el método de
mínimos cuadrados e interpretar su ajuste.
• Realizar inferencia sobre los parámetros de la recta
de regresión
• Construir e interpretar intervalos de confianza e
intervalos depredicción para la variable
dependiente
• Realizar una prueba de hipótesis para determinar si
el coeficiente de correlación es distinto de cero
USOS DEL ANÁLISIS DE REGRESIÓN:
• Predicción: razón principal para usar regresión.
• Descripción: La idea es establecer una ecuación que
describa la relación entre la variable dependiente y las
variables predictoras.
• Control: Controlar elcomportamiento o variación de la
variable de respuesta. Selección de variables
REPRESENTACION GRAFICA
•
•
•
Relación entre las variables
Sugerir modelos posibles
Existencia de valores atípicos
GRAFICO DE DISPERSION
EL MODELO DE REGRESIÓN LINEAL SIMPLE
Yi o 1 X i ei
Suposiciones del modelo:
• La variable X es no aleatoria y observada
con la mejor precisión posible.• Los errores ei son variables aleatorias con
media 0 y varianza 2 constantes .
• Los errores ei y ej (i,j=1…,n) son
independientes
entre
s i.
Es
decir,
Cov(eiej)=0.
ESTIMACION DE LOS PARAMETROS
OBJETIVO:
Hallar los estimadores bo y b1 de los parámetros desconocidos o,
1 respectivamente, y obtener la ecuación de predicción
ANALISIS DE VARIANZA
Descomposición de lavariación total
CUADRO ANOVA
Fuentes de Variación G.L Suma de Cuadrados(SC) Cuadrados Medios(CM) Test F
Regresión
1 SCReg
CMReg=SCReg
F=CMReg/CME
Error
n-2 SCE
CME =SCE/n-2
Total
n-1 SCY
Test de F de la tabla del ANOVA
Ho : 1 0
Ha : 1 0
El coeficiente de determinación R2
Corresponde a la porción de la variación total SCTo, de
la variable dependiente que es explicada por elmodelo
de regresión.
SC Re g
R
SCTo
2
Se han recogido datos de una localidad mediante sendas
encuestas sobre el consumo (Y ) de productos de hogar
y del ingreso (X) de los consumidores consultados,
obteniéndose los siguientes resultados:
X
7.1
3.4
5.5
4.3
3.7
6
3.3
6.7
5.1
4.5
2.7
5.9
Y
54.6
44.7
51
49.7
47.2
55
42.9
55.6
47.6
49.5
44.6
57.2
• ¿Cumplelos supuestos de la regresión?
• Hallar la ecuación de regresión estimada
• Hallar el ANOVA
• Determinar el coeficiente de determinación
• Probar si existe relación lineal entre X e Y. Usar un nivel
de significación del 5 %..
Regression Plot
Y2 = 35.1728 + 3.05029 X2
S = 2.11519
R-Sq = 82.2 %
R-Sq(adj) = 80.5 %
57
Y2
52
47
42
3
4
5
X2
6
7
Normal Probability Plot
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
-3
-2
-1
0
1
2
3
4
RESI3
Average: -0.0000000
StDev: 2. 01676
N: 12
Anders on-Darling Normality Tes t
A-Squared: 0. 241
P-Value: 0.713
Residual Model Diagnostics
Normal Plot of Residuals
I Chart of Residuals
4
5
UCL= 5.266
0
M ean= - 5.9E- 16
2
Residual
Residual
3
1
0
-1
-2
-5
-3
-2
-1
0
1
LCL= - 5.266
0
2
5
10
Normal Score
Observation Number
Histogram of Residuals
Residuals vs. Fits
3
Res idual
Frequenc y
4
2
1
0
-3
-2
-1
0
1
Residual
2
3
4
4
3
2
1
0
-1
-2
-3
45
50
Fit
55
The regression equation is
Y2 = 35.2 + 3.05 X2Predictor
Coef
SE Coef
T
P
Constant
35.173
2.258
15.58
0.000
X2
3.0503
0.4482
6.81
0.000
S = 2.115
R-Sq = 82.2%
R-Sq(adj) = 80.5%
Analysis of Variance
Source
DF
SS
MS
F
P
1
207.21
207.21
46.31
0.000
Residual Error
10
44.74
4.47
Total
11
251.95
Regression
INTERVALO DE CONFIANZA PARA EL...
Regístrate para leer el documento completo.