Estadistica

Solo disponible en BuenasTareas
  • Páginas : 5 (1189 palabras )
  • Descarga(s) : 0
  • Publicado : 24 de enero de 2011
Leer documento completo
Vista previa del texto
read.table("impuesto.txt")

impuesto=read.table("impuesto.txt",col.names=c(“año”,"impuestos","trabajadores","universitarios","ingreso","vivienda","mayoredad","seguro","solteros"),header=F)

attach(impuesto)

# ANALISIS PREVIO
pairs(impuesto,panel=panel.smooth)

# AUTOCORRELACION

mod=lm(impuestos~trabajadores+universitarios+ingreso+vivienda+mayoredad+seguro+solteros)
residual=mod$resplot(residual[-17],residual[-1], xlab=expression(hat(epsilon)[i]), ylab=expression(hat(epsilon)[i+1]),main="Residuales sucesivos")

library(car)
durbin.watson(mod)

# LINEALIDAD
mod=lm(impuestos~trabajadores+universitarios+ingreso+vivienda+mayoredad+seguro+solteros)
par(mfrow=c(3,3))
cr.plots(mod,main="Residuales parciales")

# CORRECCION DE NO LINEALIDADmod2=lm(impuestos~trabajadores+universitarios+poly(ingreso,2)+poly(vivienda,2)+mayoredad+seguro+solteros)
par(mfrow=c(3,3))
cr.plots(mod2,main="Residuales parciales")

# NORMALIDAD

library(car)

qq.plot(mod2,labels=año, ylab=”Residuales estudentizados”,
simulate=T)

# HETEROCEDASTICIDAD
residualabsoluto=abs(mod2$res)
plot(mod2$fit,residualabsoluto,xlab="ValoresAjustados",ylab="Residuales",main=”Residuales Absolutos”)
ncv.test(mod2)

# MULTICOLINEALIDAD

Mod1=lm(impuestos~trabajadores)
Mod2=lm(impuestos~universitarios)
Mod3=lm(impuestos~ poly(ingreso,2))
Mod4=lm(impuestos~ poly(vivienda,2))
Mod5=lm(impuestos~mayoredad)
Mod6=lm(impuestos~seguro)
Mod7=lm(impuestos~solteros)
Mod8=lm(impuestos~trabajadores+universitarios)
Mod9=lm(impuestos~trabajadores+universitarios+ poly(ingreso,2))Mod10=lm(impuestos~trabajadores+universitarios+ poly(ingreso,2)+ poly(vivienda,2))
Mod11=lm(impuestos~trabajadores+universitarios+poly(ingreso,2)+poly(vivienda,2)+mayoredad)
Mod12=lm(impuestos~trabajadores+universitarios+ poly(ingreso,2)+ poly(vivienda,2) +mayoredad+seguro)
Mod13=lm(impuestos~trabajadores+universitarios+poly(ingreso,2)+poly(vivienda,2)+mayoredad+seguro+solteros)

vif(Mod13)cor(cbind(trabajadores,universitarios,poly(ingreso,2),poly(vivienda,2),mayoredad,seguro,solteros))
anova(Mod1)
anova(Mod1,Mod8)

# CORRECCION DE MULTICOLINEALIDAD
# RIDGE

X=cbind(trabajadores,universitarios,poly(ingreso,2),poly(vivienda,2),mayoredad,seguro,solteros)
Y=impuestos
rxx=cor(X)
rxy=cor(X,Y)

I=diag(9)
C=c(seq(0, 0.01, 0.001),seq(0.02, 0.1, 0.01),seq(0.2, 1, 0.1))Ridge=matrix(0,29,18) rownames(Ridge)=C

for (i in 1:29) {
Ridge[i,1:9]=t(solve(rxx + C[i]*I)%*%rxy)
Ridge[i,10:18]=diag(solve(rxx + C[i]*I)%*%rxx%*%solve(rxx + C[i]*I))

}

library(MASS)

lm.ridge(impuestos~trabajadores+universitarios+poly(ingreso,2)+poly(vivienda,2)+mayoredad+seguro+solteros)mod.rr=lm.ridge(impuestos~trabajadores+universitarios+poly(ingreso,2)+poly(vivienda,2)+mayoredad+seguro+solteros, lambda = seq(0, 0.1, 0.001))

summary(mod.rr)

select(mod.rr)

nGCV lim]
identify(1:17,lev,año)

# VALORES DE INFLUENCIA
# DF FITS
dffits=dffits(mod3)
dffits[abs(dffits)>1]
plot(dffits,ylab="DFFITS",main="DFFITS")
abline(h=1)
abline(h=-1)
identify(1:17,dffits,año)

# COOK
cook=cooks.distance(mod3)
plot(cook,ylab="Distancia de Cook", main="Distancias de Cook")identify(1:17,cook,año)
cook[16]
cook[17]
pf(cook[16],6,11)
pf(cook[17],6,11)

# DF BETAS
dfbetas = dfbetas(mod3)
plot(abs(dfbetas[,2]),abs(dfbetas[,3]), xlab="Cambio en coef trabajadores",ylab="Cambio en coef vivienda lineal")
abline(h=1)
abline(v=1)
identify(abs(dfbetas[,2]),abs(dfbetas[,3]),año)

plot(abs(dfbetas[,4]),abs(dfbetas[,5]), xlab="Cambio en coef viviendacuadratica",ylab="Cambio en coef mayor edad")
abline(h=1)
abline(v=1)
identify(abs(dfbetas[,4]),abs(dfbetas[,5]),año)

plot(abs(dfbetas[,6]),abs(dfbetas[,7]), xlab="Cambio en coef seguro",ylab="Cambio en coef solteros")
abline(h=1)
abline(v=1)
identify(abs(dfbetas[,6]),abs(dfbetas[,7]),año)

# ELIMINANDO VALORES EXTREMOS Y DE INFLUENCIA
mod4=update(mod3,subset=-c(16,17))

# SELECCION DE VARIABLES...
tracking img