regresion lineal simple
En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación:
Y = a + b X + e
Donde:
a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y.
b esel coeficiente de regresión poblacional (pendiente de la línea recta)
e es el error
SUPOSICIONES DE LA REGRESIÓN LINEAL
1. Los valores de la variable independiente X son fijos, medidos sin error.
2. La variable Y es aleatoria
3. Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y)
4. Las variancias de las subpoblaciones Y son todas iguales.
5. Todas lasmedias de las subpoblaciones de Y están sobre la recta.
6. Los valores de Y están normalmente distribuidos y son estadísticamente independientes.
ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRAL
Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El método de estimación es el de Mínimos Cuadrados,mediante el cual se obtiene:
Luego, la ecuación de regresión muestral estimada es
Que se interpreta como:
a es el estimador de a
Es el valor estimado de la variable Y cuando la variable X = 0
b es el estimador de b , es el coeficiente de regresión
Está expresado en las mismas unidades de Y por cada unidad de X. Indica el número de unidades en que varía Y cuando se produce un cambio, enuna unidad, en X (pendiente de la recta de regresión).
Un valor negativo de b sería interpretado como la magnitud del decremento en Y por cada unidad de aumento en X.
3. ANTECEDENTES DEL PROBLEMA
Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el peso deuna persona seleccionada de entre el grupo con dicha estatura, resultando:
X
152
155
152
155
157
152
157
165
162
178
183
178
Y
50
61.5
54.5
57.5
63.5
59
61
72
66
72
84
82
Con estos datos vamos a plantear una ecuación de regresión simple que nos permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y contrastaremos nuestra hipótesis con la prueba F.
4. DESARROLLORepresentación matemática y gráfica de los datos:
Representación Matemática
estatura
pesos
Regresión Lineal
I.C. para la media
I. C. individual
datos
x
y
x ^2
y ^2
xy
y est.
Residual
L. I.
L. S.
L. I.
L. S.
1
152
50
23104
2500
7600
56.43
-6.43
53.07
59.79
47.30
65.56
2
155
61.5
24025
3782.3
9532.5
59.03
2.47
56.09
61.97
50.05
68.02
3
152
54.5
231042970.3
8284
56.43
-1.93
53.07
59.79
47.30
65.56
4
155
57.5
24025
3306.3
8912.5
59.03
-1.53
56.09
61.97
50.05
68.02
5
157
63.5
24649
4032.3
9969.5
60.77
2.73
58.05
63.48
51.85
69.68
6
152
59
23104
3481
8968
56.43
2.57
53.07
59.79
47.30
65.56
7
157
61
24649
3721
9577
60.77
0.23
58.05
63.48
51.85
69.68
8
165
72
27225
5184
11880
67.714.29
65.17
70.24
58.85
76.57
9
162
66
26244
4356
10692
65.11
0.89
62.65
67.56
56.27
73.94
10
178
72
31684
5184
12816
78.99
-6.99
74.65
83.33
69.45
88.52
11
183
84
33489
7056
15372
83.32
0.68
78.01
88.64
73.31
93.34
12
178
82
31684
6724
14596
78.99
3.01
74.65
83.33
69.45
88.52
Representación Gráfica
5. HIPÓTESIS
HO: No hay relación entre lavariable peso y la variable estatura.
HA: Hay relación entre la variable peso y la variable estatura.
Tabla de análisis de varianza
Fuente de
Grados de
Suma de
Cuadrados
Variación
libertad
cuadrados
medios
estadístico F
Debido a
la regresión
1
1061.1
1061.1
73.08
error
10
145.2
14.5
total
11
1206.3...
Regístrate para leer el documento completo.