Paquitowey

Páginas: 22 (5379 palabras) Publicado: 14 de noviembre de 2014
Estad´ıstica Empresarial
´n
Problemas Bloque 1: Regresio
Problema 1: Se dispone de datos correspondientes a Y = “precios en euros” de 100 viviendas y sus caracter´ısticas: X1 = “superficie en m2 ”, X2 = “edad de la vivienda”, X3 =
“buenas vistas (1 = ’S´ı’ y 0 = ’No’)”, X4 = “n´
umero de plazas de garaje”, X5 = “n´
umero
de dormitorios” y X6 = “n´
umero de cuartos de ba˜
no”.
a) Para laregresi´on de Y frente a las variables X1 , X2 , ..., X6 , se sabe que la observaci´on
con mayor residual estudentizado es la 38 con t38 = 3.8 y, adem´as, tenemos la siguiente
tabla que nos muestra las observaciones con mayor “leverage”, ¿Qu´e podr´ıamos decir de la
observaci´on 38?
Row
Leverage
DFITS
-------------------------------6
0.100549
-0.548886
11
0.15576
0.894118
12
0.108364-0.554416
20
0.0589026
-0.545707
38
0.167861
1.962470
44
0.154132
0.835235
58
0.105883
0.702488
63
0.203285
0.926891
95
0.056569
0.536579
-----------------------------------

En lo que sigue trabajaremos siempre sin la observaci´on 38 y supondremos que los plots de
residuos de los modelos ajustados son correctos.
b) Repetimos la regresi´on de Y frente a esas 6 variablesexplicativas. ¿Es la regresi´on
globalmente significativa? ¿Qu´e variables son significativas a nivel α = 0.05?
Source
Sum of Squares
---------------------------Model
3.25493E11
Residual
1.16648E11
---------------------------Total (Corr.)
4.42141E11

Standard
T
Parameter
Estimate
Error
Statistic
-------------------------------------------CONSTANT
47354.6
24453.7
1.9365
superficie1054.82
132.921
7.93573
edad
-2705.33
898.555
-3.01075
vistas
34128.5
10031.3
3.40221
garajes
44452.4
13814.6
3.21778
dormitorios
6620.58
6156.46
1.07539
ba~
nos
18769.7
8588.74
2.18538
--------------------------------------------

c) ¿Son razonables los signos de los coeficientes? Comenta brevemente dichos signos. ¿Es
razonable que el “n´
umero de dormitorios” no seauna variable significativa para explicar el
precio? ¿A qu´e puede ser debido?
d) La siguiente tabla nos proporciona las sumas de cuadrados secuenciales (en el orden
que aparecen en la tabla):

Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
------------------------------------------------------------------------superficie
2.67123E11
1
2.67123E11
210.68
0.0000
edad
5.2571E9
15.2571E9
4.15
0.0446
vistas
3.03854E10
1
3.03854E10
23.96
0.0000
garajes
1.25881E10
1
1.25881E10
9.93
0.0022
dormitorios
4.08405E9
1
4.08405E9
3.22
0.0760
ba~
nos
6.05543E9
1
6.05543E9
4.78
0.0314
-------------------------------------------------------------------------

¿Pueden suponerse simultanemente nulos (en presencia del resto de las variables) los coeficientesde las variables X5 y X6 ?
Finalmente, tras aplicar un m´etodo de selecci´on de variables, ajustamos el siguiente Modelo
Final:
Standard
T
Parameter
Estimate
Error
Statistic
P-Value
------------------------------------------------------------------------CONSTANT
57056.4
22747.8
2.50822
0.0139
superficie
1069.83
132.297
8.08657
0.0000
edad
-2308.43
819.947
-2.81534
0.0059vistas
35336.2
9976.61
3.5419
0.0006
garajes
43470.3
13796.0
3.15094
0.0022
ba~
nos
21476.8
8218.45
2.61324
0.0105
------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
------------------------------------------------------------------------Model
3.24027E11
5
6.48053E10
51.03
0.0000
Residual1.18114E11
93
1.27005E9
-------------------------------------------------------------------------

e) Usando este u
´ltimo modelo, ¿Se puede afirmar que por cada a˜
no de antig¨
uedad se
deprecia la vivienda en promedio en m´as de 2000 euros?
f) Obt´en un intervalo de confianza de garant´ıa 95% para la diferencia de precio medio
entre viviendas con las mismas caracter´ısticas dependiendo de que...
Leer documento completo

Regístrate para leer el documento completo.

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS