taller regresion
Jorge Camilo Torres Cárdenas
Cédula 79664357
Universidad Sergio Arboleda
Modelos probabilísticos
EJERCICIO 1. CAPACITACIÓN
Matrix
MatrixPlot
Plotof
of JTS.
JTS.INGRESO.
INGRESO.EDUCACIO.
EDUCACIO.DISCIPLI.
DISCIPLI.SEMANAS.
SEMANAS.EMPLEOS
EMPLEOS
Paso 1.
Identificación
00
20
20
40
40
33
66
99
44
88
1122 20
20
40
40
60
6022
44
66
11000
000
500
500
JTS
JTS00
40
40
20
20
INGRESO
INGRESO
00
99
66
EDUCACIO
EDUCACIO
33
1122
88
DISCIPLI
DISCIPLI
44
60
60
40
40
SEMANAS
SEMANAS
20
20
EMPLEOS
EMPLEOS
Mejores
subconjuntos
Modelo propuesto:
JTS= βo + EDUCACION +
DISCIPLINA
Paso 2.
Estimación
El modelo presenta un ajuste del 96%. El pvalue para la variable DISCIPLINA es mayor
que α por tanto se rechaza Ho, así mismo, los
valores VIF sonmayores a 3, por tanto, se
procede a eliminar la variable DISCIPLINA por
tener un p-value mayor que α y un VIF alto.
El nuevo modelo propuesto seria:
JTS= βo + EDUCACION
Al quitar la variable DISCIPLINA los valores
VIF son mayores que 3, quitando la constante
los valores VIF aumentaron a 10.60 en cada
variable, en vista de lo anterior, se decidió
plantear el modelo JTS= EDUCACION
+DISCIPLINA. Estodado que la variable
INGRRESO presenta el mayor VIF
En esta caso el ajuste del modelo es del
97.9% con p-value menores que α y valores
VIF menores que 3.
Residual
Residual Plots
Plotsfor
forJTS
JTS
Versus
VersusFits
Fits
99
99
200
200
90
90
1100
00
Residual
Residual
Paso 3. Validación
Percent
ercent
P
Normal
NormalProbability
ProbabilityPlot
Plot
50
50
1100
11
-1
-100
00
00
110000
00
250
250
500
500
7750
50
Residual
Residual
Fitted
FittedValue
Value
Histogram
Histogram
Versus
VersusOrder
Order
11000
000
200
200
Residual
Residual
66
44
22
00
-1
-100
00
-200
-200
200
200
88
Frequency
Frequency
De acuerdo con los gráficos pareciera que los
residuos en el histograma no son normales,
por tanto, se procede con una prueba de
normalidad.
-200
-200
00
-1
-150
50-1
-100
00 -50
-50
00
50
50
Residual
Residual
1100
00 1150
50 200
200
1100
00
00
-1
-100
00
-200
-200
11
55
1100
1155
20
20
25
25
Observation
ObservationOrder
Order
3300
3355
Probability
Probability Plot
Plot of
of RESI1
RESI1
Normal
Normal -- 95%
95%CI
CI
99
99
Normalidad
Mean
Mean 4,841
4,841
StDev
86,80
StDev 86,80
N
35
N
35
AD
0,383
AD
0,383
P-Value
P-Value 0,378
0,378
9595
90
90
P-value 0.378 > α; Se acepta Ho, los datos son
normales.
Perce
rcent
nt
Pe
80
80
70
70
60
60
50
50
40
40
30
30
20
20
1100
55
11
-300
-300
-200
-200
-1
-100
00
00
RESI1
RESI1
1100
00
200
200
300
300
Test
Test for
forEqual
Equal Variances:
Variances:RESI1
RESI1vs
vsgrupos
grupos
Multiple
Multiplecomparison
comparisonintervals
intervalsfor
forthe
thestandardstandarddeviation,
deviation,αα =
=0,05
0,05
Prueba de
Varianza
Multiple
MultipleComparisons
Comparisons
11
P-Value
P-Value 0,988
0,988
Levene’s
Levene’sTest
Test
P-Value
P-Value 0,996
0,996
Se armaron 5 grupos de 7 datos.
El p-value de 0,988 es > α, se acepta Ho;
varianzas iguales.
Por tanto el modelo es:
grupos
grupos
22
33
44
JTS = 112,08 EDUCACIO - 14,42 DISCIPLINA
55
50
50
1100
00
1150
50
200
200IfIfintervals
intervalsdo
donot
not overlap,
overlap,the
thecorresponding
correspondingstdevs
stdevsare
aresignificantly
significantlydifferent.
different.
250
250
Matrix
Matrix Plot
Plot of
of CALOR.
CALOR.ALUNIO
ALUNIO TRIC.
TRIC.SILI_TRICAL.
SILI_TRICAL.ALUMINFERRO.
ALUMINFERRO....
...
Ejercicio 2
Calor Cemento
00
11
00
20
20 30
30
45
45
60
60
88
11
66
24
00
24
25
25
50
50
1120
20
11
00
00
CALOR
CALOR
80
80
20
20
11
00
ALUNIO
ALUNIOTRIC
TRIC
00
60
60
SILI_TRICAL
SILI_TRICAL
40
40
20
20
20
20
Paso 1. Identificación
11
00
ALUMINFERRO
ALUMINFERRO
00
SILI_DICAL
SILI_DICAL
Mejores
Subconjuntos
Modelo propuesto:
CALOR= βo + SILICATO +
SILICATO DICALCICO
Paso 2.
Estimación
En este caso, todas las variables presentan un
p-value menor que α, el modelo presenta...
Regístrate para leer el documento completo.