SOLUCIONARIO DEL LABORATORIO 1
ANÁLISI DE REGRESIÓN
ROLDA ESCOBEDO JORDAN
09140057
Ejercicio 0.1.
Siendo:
X: Temperatura
Y: Dureza
a) Muestre los datos en un gráfico de dispersión.
x<-c(220,220,220,220,220,225,225,225,225,225,230,230,230,230,230,235,235,235,235,235)
y<-c(137,137,137,136,135,135,133,132,133,133,128,124,126,129,126,122,122,122,119,122)
x
y
plot(x,y)
b) Halle laestimación mínimos cuadráticos de los parámetros . Muestre la gráfica de la recta estimada en el gráfico de dispersión
SC_x<-sum((x-mean(x))^2)
SC_y<-sum((y-mean(y))^2)
SP_xy<-sum((x-mean(x))*(y-mean(y)))
estB1<-SP_xy/SC_x
estB1
estB0<-mean(y)-estB1*mean(x)
estB0
est<-estB1*x+estB0
est
lines(x,est,col="red",type="l",pch=1)
c) Muestre las propiedades de los estimadores pormínimos cuadrados, halle la suma de cuadrados de los residuos y el estimador de la varianza
Propiedades de los estimadores
La suma de los errores y la suma de los errores por la temperatura son cero, además de que las medias de Dureza y los ajustes son iguales.
sum(res);sum(res*x)
[1] 1.705303e-13
[1] 3.831246e-11
mean(y);mean(est)
[1] 129.4
[1] 129.4
Suma de cuadrados de los residuos (SCR)res<-y-est
SCR<-sum(res^2);SCR
SCT<-sum((y-mean(y))^2);SCT
SCE<-SCT-SCR;SCE
estvar<-SCR/18
estvar
d) Halle la descomposición de la varianza de Y en varianza explicada por la regresión y varianza residual
Anova(lm(y~x))
e) El Coeficiente de determinación es:
coef_det<-SCE/SCT;coef_det
El coeficiente de correlación es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr
Ejercicio 0.2.
X: edad
Y:tsis
a) Verifique los supuestos de la regresión lineal simple.
-Linealidad:
plot(x,y)
Se generará el siguiente modelo lineal:
m2<-lm(y~x)
-Homocedasticidad:
plot(fitted(m2),residuals(m2))
abline(h=0)
abline(h=-20);abline(h=20)
No hay relación entre la varianza y los ajustes, por lo tanto la varianza no varía con respecto a la edad. Hayhomocedasticidad.
Usaremos el test de Durbin-Watson. Pero antes instalaremos unos paquetes:
install.packages('car')
library(car)
install.packages('lmtest')
library(lmtest)
Aplicando el test:
durbinWatsonTest(m2)
No existe evidencia significativa para afirmar la presencia de autocorrelación de los residuos.
-Normalidad
Debemos instalar un paquete para el test de kolmogorov(n>50)install.packages('nortest')
library(nortest)
Luego:
lillie.test(residuals(m2))
Sal rechazar la H0 se observa no hay normalidad en los residuos.
b) Halle la estimación mínimos cuadráticos de los parámetros . Haga las transformaciones que fuese posible para mejorar el ajuste.
SC_x<-sum((x-mean(x))^2)
SC_y<-sum((y-mean(y))^2)
SP_xy<-sum((x-mean(x))*(y-mean(y)))
Estimacion de :
estB1<-SP_xy/SC_x;estB1
[1]0.9262238
Estimacion de :
estB0<-mean(y)-mean(x)*estB1;estB0
[1] 104.5483
c) Halle la descomposición de la varianza de Y en varianza explicada por la regresión y varianza residual.
est<-estB0+estB1*x
res<-y-est
SCR<-sum(res^2);SCR
[1] 14740.35
SCT<-sum((y-mean(y))^2);SCT
[1] 28011.77
SCE<-SCT-SCR;SCE
[1] 13271.42
estvar<-SCR/67;estvar
[1] 220.0052
d) Halle el coeficiente de determinación yel coeficiente de correlación
El Coeficiente de determinación es:
coef_det<-SCE/SCT;coef_det
El coeficiente de correlación es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr
e) Haga un análisis de residuos
Gráfica Edad vs Residuos/desviación
plot(y,res/(estvar)^0.5)
Ejercicio 0.3.
X: Renta
Y:Gasto
a) Verifique los supuestos de la regresión lineal simple-Linealidad
plot(x,y)
m3<-lm(y~x)
-Homocedasticida
plot(fitted(m3),residuals(m3))
abline(h=0)
Abline(h=-4);abline(h=4)
A nivel que aumenta el valor del ajuste, los residuos tienden a aumentar ligeramente, por tanto no se puede afirmar la homocedasticidad.
-Independencia de los errores
No existe evidencia significativa para afirmar la presencia de...
Regístrate para leer el documento completo.