Regresion lienal

Solo disponible en BuenasTareas
  • Páginas : 7 (1606 palabras )
  • Descarga(s) : 0
  • Publicado : 31 de enero de 2012
Leer documento completo
Vista previa del texto
Regresión Lineal Simple
Problema 4.3.
“Los datos de la tabla adjunta muestran el tiempo de impresión de trabajos que se han imprimido en impresoras de la marca PR. Se está interesado en estudiar la relación existente entre la variable de interés “tiempo de impresión de un trabajo” y la variable explicativa “número de páginas del trabajo”. Hacer el estudio en base a los datos obtenidos en elmuestreo y que son los de la tabla adjunta”.

Datos del problema [ASCII] [spss-10] [sgplus-5]
Solución Problema 4.3.
Se calculan los estadísticos básicos de las variables X e Y,

Que permiten calcular las estimaciones de los parámetros de la recta de regresión

Ahora, se pueden calcular las predicciones i

La suma de cuadrados de los residuos es

Que permite calcular la varianzaresidual

Las varianzas de los parámetros son

De donde se deducen los siguientes intervalos de confianza (al 90%) y contrastes de hipótesis:
| Intervalo de confianza para 2 732 | < < 732 |
54'3245 | < < 94'0592 |
85'325 | < 2 < 147'735 |
|
| Intervalo de confianza para 1 t73 | < < t73 |
- 1'6664 | < < 1'6664 |
1 | 8'108 ± 0'7142 = |
|| Intervalo de confianza para 0 t73 | < < t73 |
- 1'6664 | < < 1'6664 |
0 | 13'515 ± 4'378 = |
|
| Contraste de hipótesis para 1 1 | = = = 18'917 ~ t n-2 |
p - valor | = 0'0000 Se rechaza H 0 |
|
| Contraste de hipótesis para 0 0 | = = = 5'144 ~ t n-2 |
p - valor | = 0'0000 Se rechaza H 0 |
|
El coeficiente de correlación es

En el siguiente gráficose representa la nube de puntos y la recta ajustada

Nube de observaciones y recta ajustada.
El gráfico de residuos frente a las predicciones se observa en el siguiente gráfico,

Gráfico de residuos
Se calcula la tabla ANOVA del modelo y se obtiene
scR | = i = 175ei2 = 8025'61 |
scG | = i = 1752 = 75 . sy2 = 47.368'95 |
scE | = i = 1752 = V T - V NE = 39.343'34 |
que permiteconstruir la siguiente tabla

A partir de esta tabla se puede realizar el contraste de regresión

Se rechaza la hipótesis nula y se asume que el modelo ajustado es significativo.
En este problema para cada valor de x se dispone de varias observaciones de Y, se puede hacer el contraste de linealidad

Para ello se descompone la scR en dos términos:
scR1 | = i = 1752 = 2.765'84 |
scR2 |= i = 1752 = 5.259'77 |
scR | = i = 175ei2 = i = 1752 = 8.025'61 |
Que permite construir la siguiente tabla ANOVA más completa

 

Se rechaza la hipótesis nula y se deduce que el modelo lineal no es el que mejor se ajusta a la nube de observaciones.
Predicciones.
“Calcular intervalos de confianza al 90% para el tiempo medio de impresión de los trabajos que tienen 6 y 12 hojasrespectivamente.
Calcular, también, intervalos de predicción al 90% para el tiempo de impresión de un trabajo que tiene 6 hojas. Calcular el intervalo de predicción para el tiempo de impresión de un trabajo de 12 hojas”.
Sea xt = 6, su valor de influencia (leverage) es
ht | = = 0'013857 |
nt | = = 72'1651 (es el número de observaciones equivalente). |
La varianza del estimador de la mediacondicionada mt = E es
V ar | = = 1'5235 |
| = 1'2343. |
El estimador de la media condicionada es

De ambos resultados se obtiene que el intervalo de confianza al 90% es
mt | 62'163 ± t 73 . 1'2343 |
mt | 62'163 ± 2'0568 = . |
La predicción para xt = 6 es

Con varianza
V ar | = + 109'94 = 111'4635 |
| = 10'5576. |
Por tanto, el intervalo de predicción al 90% es
yt |62'163 ± t 73 . 10'5576 |
yt | 62'163 ± 17'593 = . |
Análogamente, se realizan los cálculos para xq = 12, su valor de influencia es
hq | == 0'08523 |
nq | = = 11'7323 (es el número de observaciones equivalente). |
Por tanto, la varianza del estimador de la media condicionada mq = E es
V ar | = = 9'3707 |
| = 3'0612. |
El estimador es

y el intervalo de confianza al 90%...
tracking img