Modelos de regresion no lineal multiple
MODELO DE REGRESION NO LINEAL La hipótesis de linealidad entre dos o más variables es una hipótesis muy fuerte que a menudo no se cumple. En estas circunstancias existen otro tipo de funciones de tipo no lineal que podrían ajustarse a los datos. En esta sección realizaremos procedimientos equivalentes a los de regresión lineal pero con otras funciones. Enestadística, la regresión no lineal es un problema de inferencia para un modelo tipo:
Regresión cuadrática Ejemplo1: En la fábrica Dacron S.A., se tienen los siguientes datos correspondientes a las horas trabajadas (en miles) que producen el producto gama (en unidades). Horas trabajadas: 1 Producción : 25 a) 2 15 4 10 5 10 7 15 8 10 8 20 9 20 10 35 12 45
Trazar el diagrama de esparcimiento.b)
Ajustar a los datos un modelo adecuado. Al trazar el diagrama de esparcimiento, se observa que el modelo parabólico sería un modelo adecuado.
ˆ Y
205 1560 14750
a
10 a 66 a
bX
66 b
c X2
548 c 5022 c 48788 c
548 b 5022 b
548 a
10 66 548
66 548 5022
548 5022 48788 1 337 672
205 a 1560 14750
66 548
548 5022
5022 48788
40 072 580 1 337 67229,957
10 b 66
205 1560
548 5022 48788
548 14750
10 578 600 1 337 672
7,908
1
Docente Carlos Ortega Muñoz
Estadística Aplicada - Administración
10 c 66
66 548
205 1560
548 5022 14750
1 043 220 1 337 672
0,780
ˆ Y
c)
29,96
7,91 X
0,78 X2
Hallar el volumen de producción esperado para 14 mil de horas. Si X = 14:
ˆ Y0
29,96
7,91 140,78
142
72
d)
Calcular e interpretar el coeficiente de correlación parabólica.
r
29,957 205
7,908 1560 0, 780 14750 5425 10 20,52
10
20,52
r
0,95
Un modelo parabólico sí es confiable es decir, se pueden realizar pronósticos. e) Calcular e interpretar el coeficiente de determinación parabólico.
r2
0,95 2
90%
El 90% de las variaciones que se producenen la producción se pueden atribuir a las variaciones producidas en el número de horas trabajadas, el 10% restante de estas variaciones son debidas a otros factores o a efectos aleatorios. f) Calcular el error de estimación cuadrático.
SC
Y2
a
Y n
b 2
XY
c
XY
SC
g)
5425
29,95696
205
7,90822 8
1560
0,77988 1560
36,06
Para 14 mil horas, ¿cuánto seespera que sea la producción mínima y máxima?
Y0
Z1
/2
SC
72 1,96 1,32 Y
36,06 142,68
Identifique en SPSS los datos calculados en los ítems de arriba: Resumen del modelo R cuadrado corregida ,876 Error típico de la estimación 4,096
R ,951
R cuadrado ,904
La variable independiente es horas de trabajadas.
ANOVA Suma de cuadrados Regresión Residual Total 1105,048117,452 1222,500 Media cuadrática 552,524 16,779
gl 2 7 9
F 32,930
Sig. ,000
La variable independiente es horas de trabajadas.
2
Docente Carlos Ortega Muñoz
Estadística Aplicada - Administración
Coeficientes Coeficientes estandarizado s Beta -2,398 3,055 t -5,156 6,568 6,871 Sig. ,001 ,000 ,000
Coeficientes no estandarizados B -7,908 ,780 29,957 Error típico 1,534 ,1194,360
horas de trabajadas horas de trabajadas ** 2 (Constante)
produccion
Observada Cuadrático
50
40
30
20
10 0 2 4 6 8 10 12
horas de trabajadas
Regresión exponencial Ejemplo 2: La demanda de televisores (miles de unidades) y los gastos de publicidad (cientos de dólares) en un país desde 1998 hasta 2002 fue: Gastos de Publicidad : 2 4 5 7 12 Demanda de TV : 3 6 12 24 45a) Trazar el diagrama de esparcimiento.
b)
Ajustar los datos a un modelo exponencial.
ˆ Y
a . bX
3
Docente Carlos Ortega Muñoz
Estadística Aplicada - Administración
Log Y = Log a + X log b
5,37 38,96
5( log a) 30 (log a)
30 (log b) 238(log b)
5
30
30 238
290
5,37 log a
30 109, 26 290 a
b
38,96 238 290
Por lo tanto el modelo será: c)
ˆ...
Regístrate para leer el documento completo.