Regresion lienal
Problema 4.3.
“Los datos de la tabla adjunta muestran el tiempo de impresión de trabajos que se han imprimido en impresoras de la marca PR. Se está interesado en estudiar la relación existente entre la variable de interés “tiempo de impresión de un trabajo” y la variable explicativa “número de páginas del trabajo”. Hacer el estudio en base a los datos obtenidos en elmuestreo y que son los de la tabla adjunta”.
Datos del problema [ASCII] [spss-10] [sgplus-5]
Solución Problema 4.3.
Se calculan los estadísticos básicos de las variables X e Y,
Que permiten calcular las estimaciones de los parámetros de la recta de regresión
Ahora, se pueden calcular las predicciones i
La suma de cuadrados de los residuos es
Que permite calcular la varianzaresidual
Las varianzas de los parámetros son
De donde se deducen los siguientes intervalos de confianza (al 90%) y contrastes de hipótesis:
| Intervalo de confianza para 2 732 | < < 732 |
54'3245 | < < 94'0592 |
85'325 | < 2 < 147'735 |
|
| Intervalo de confianza para 1 t73 | < < t73 |
- 1'6664 | < < 1'6664 |
1 | 8'108 ± 0'7142 = |
|| Intervalo de confianza para 0 t73 | < < t73 |
- 1'6664 | < < 1'6664 |
0 | 13'515 ± 4'378 = |
|
| Contraste de hipótesis para 1 1 | = = = 18'917 ~ t n-2 |
p - valor | = 0'0000 Se rechaza H 0 |
|
| Contraste de hipótesis para 0 0 | = = = 5'144 ~ t n-2 |
p - valor | = 0'0000 Se rechaza H 0 |
|
El coeficiente de correlación es
En el siguiente gráficose representa la nube de puntos y la recta ajustada
Nube de observaciones y recta ajustada.
El gráfico de residuos frente a las predicciones se observa en el siguiente gráfico,
Gráfico de residuos
Se calcula la tabla ANOVA del modelo y se obtiene
scR | = i = 175ei2 = 8025'61 |
scG | = i = 1752 = 75 . sy2 = 47.368'95 |
scE | = i = 1752 = V T - V NE = 39.343'34 |
que permiteconstruir la siguiente tabla
A partir de esta tabla se puede realizar el contraste de regresión
Se rechaza la hipótesis nula y se asume que el modelo ajustado es significativo.
En este problema para cada valor de x se dispone de varias observaciones de Y, se puede hacer el contraste de linealidad
Para ello se descompone la scR en dos términos:
scR1 | = i = 1752 = 2.765'84 |
scR2 |= i = 1752 = 5.259'77 |
scR | = i = 175ei2 = i = 1752 = 8.025'61 |
Que permite construir la siguiente tabla ANOVA más completa
Se rechaza la hipótesis nula y se deduce que el modelo lineal no es el que mejor se ajusta a la nube de observaciones.
Predicciones.
“Calcular intervalos de confianza al 90% para el tiempo medio de impresión de los trabajos que tienen 6 y 12 hojasrespectivamente.
Calcular, también, intervalos de predicción al 90% para el tiempo de impresión de un trabajo que tiene 6 hojas. Calcular el intervalo de predicción para el tiempo de impresión de un trabajo de 12 hojas”.
Sea xt = 6, su valor de influencia (leverage) es
ht | = = 0'013857 |
nt | = = 72'1651 (es el número de observaciones equivalente). |
La varianza del estimador de la mediacondicionada mt = E es
V ar | = = 1'5235 |
| = 1'2343. |
El estimador de la media condicionada es
De ambos resultados se obtiene que el intervalo de confianza al 90% es
mt | 62'163 ± t 73 . 1'2343 |
mt | 62'163 ± 2'0568 = . |
La predicción para xt = 6 es
Con varianza
V ar | = + 109'94 = 111'4635 |
| = 10'5576. |
Por tanto, el intervalo de predicción al 90% es
yt |62'163 ± t 73 . 10'5576 |
yt | 62'163 ± 17'593 = . |
Análogamente, se realizan los cálculos para xq = 12, su valor de influencia es
hq | == 0'08523 |
nq | = = 11'7323 (es el número de observaciones equivalente). |
Por tanto, la varianza del estimador de la media condicionada mq = E es
V ar | = = 9'3707 |
| = 3'0612. |
El estimador es
y el intervalo de confianza al 90%...
Regístrate para leer el documento completo.