Ing comercial
Problema 4.1.
“Los datos de la tabla adjunta proporcionan la distancia en línea recta (LR) y por carretera (DC) entre veinte pares de puntos geográficos (localidades) de Sheffield.
1. ¿Existe una relación lineal entre las dos variables?
2. ¿Es suficientemente bueno el modelo de regresión lineal que explica lavariable de interés DC en función de la variable regresora LR?. Estimar el modelo de regresión lineal. Calcular intervalos de confianza al 90% para los parámetros del modelo.
3. Calcular la tabla ANOVA del modelo. Interpretación de la misma.
4. Predecir la distancia por carretera entre dos ciudades cuya distancia en línea recta es 25. Calcular un intervalo de predicción al 90%. Repetir elapartado si la distancia (LR) es 50.
5. ¿Existe un modelo linealizable mejor?
| | | | | |
DC | LR | DC | LR | DC | LR |
| | | | | |
10'7 | 9'5 | 16'6 | 12'1 | 28'8 | 21'6 |
6'5 | 5'0 | 29'0 | 22'0 | 31'2 | 26'5 |
29'4 | 23'0 | 40'5 | 28'2 | 6'5 | 4'8 |
17'2 | 15'2 | 14'2 | 12'1 | 25'7 | 21'7 |
18'4 | 11'4 | 11'7 | 9'8 | 26'5 | 18'0 |
19'7 | 11'8 | 25'6 | 19'0 |33'1 | 28'0 |
16'3 | 14'6 | 9'5 | 8'3 | | |
| | | | | |
| | | | | |
Datos del problema [ASCII] [spss-10] [sgplus-5]
Desarrollo del Problema 4.1.
En primer lugar se representa gráficamente la nube de puntos haciendo el siguiente análisis de Statgraphics
graficos>graficos de dispersion>grafico x-y
Que permite tener una primera idea acerca del comportamiento del ajustelineal.
Un estudio detallado del ajuste lineal se obtiene con el siguiente análisis
dependencia>regression simple
En el apartado de resumen de procedimientose obtiene la recta de regresión estimada (estimación de los coeficientes de 0 y 1 y de sus desviaciones típicas lo que permite calcular intervalos de confianza de los mismos). En este mismo apartado se obtiene la tabla ANOVA del modelo ylos coeficientes de determinación. En este caso dado que el coeficiente de correlación es r = 0'969 se concluye que el ajuste lineal es bueno.
El apartado forecasts permite calcular predicciones e intervalos de confianza y de predicción.
Si se desea tener una idea acerca de la existencia de modelos linealizables que mejoren el ajuste lineal, ésto se puede hacer en el apartado comparison ofalternatives models que proporciona la correlación de doce ajustes. En este problema los ajustes “doble recíproco” y “multiplicativo” mejoran ligeramente (en correlación) al lineal y habría que evaluar la conveniencia de trabajar con estos modelos. El ajuste de alguno de estos modelos se hace en analysis summary en el apartado de opciones.
Este análisis también proporciona las observaciones conresiduos grandes (unusual residuals), las observaciones influyentes (influential points) y diferentes gráficos que permiten evaluar la bondad del ajuste y el cumplimiento de las hipótesis básicas.
Problema 4.2. (Datos simulados)
“Este problema consta de dos partes. En un primer apartado se simula un conjunto de datos bidimensional que sigue un modelo de regresión lineal simple con diseño fijo. En elsegundo apartado se estudia el modelo de regresión que mejor se ajusta a los datos simulados en el apartado anterior.
La variable regresora X toma los valores 5,8,12,15,20,22,25,27,30 y 33, y para cada valor de X se tienen 15 observaciones de la variable respuesta Y, en total, 150observaciones. Los valores se generan a partir del modelo matemático
donde E, sigue una distribución N
1.Generación de la muestra.
2. Hacer un estudio estadístico básico de la variable condicionada Y/X.
3. Calcular la recta de regresión ajustada a las observaciones simuladas: estimación de los parámetros, tabla ANOVA, contraste de regresión y de linealidad, intervalos de confianza. ¿Se obtienen resultados congruentes, la recta de regresión ajustada está próxima a la recta generadora de las...
Regístrate para leer el documento completo.