REGRESION LINEAL POR EL METODO DE LOS MINIMOS CUADRADOS
INTERNACINALES. APUNTES Y EJERCICIO DE REGRESIÓN LINEAL POR
EL MÉTODO DE LOS MÍNIMOS CUADRADOS.
Cancún Q Roo a 22 de junio de 2009.
Profesor, Juan Francisco Bárcenas Graniel.
1. Si tenemos los siguientes datos obtenidos de una muestra previa de la
población cancunense, en la cual se desea determinar la relación lineal
del diámetro de la cabeza de15 personas de ambos sexos, con rango
de edades entre 16 y 41 años. Obtener una regresión con la siguiente
metodología de los mínimos cuadradosi. Los resultados servirán para
obtener un estimado de la cantidad de personas a muestrear para
obtener datos que sirvan para la obtención la distribución de tallas de
sombrero en Cancún.
n° observación
EDAD (AÑOS)
ESTATURA (M)
DMETRO
CABEZA (CM)
1
20155
51
2
16
172
55
3
22
165
53
4
23
153
51
5
22
168
54
6
20
154
55
7
20
158
54
22
164
56
9
41
168
56
10
22
173
58
11
22
160
55
12
20
170
57
13
24
183
59
14
20
167
55
15
20
180
55
8
1
Gráfica 1. Dispersión de los datos.
Diámetro de cabeza
(cm)
Estatura vs. Diámetro de la cabeza.
60
59
58
57
56
55
54
53
52
51
50
DMETRO
CABEZA
(CM)
150160
170
180
190
Estatura (cm)
2. Empíricamente puedo hacer un ajuste de una recta, que muestre la
tendencia de los puntos graficados. Esta recta tendrá la propiedad de pasar
por “en medio” de la dispersión de puntos. La ecuación Es la siguiente
Yi bo bi X i
La idea fundamental del análisis de regresión es obtener aquellos valores que
sean buenos estimadores de los parámetros bo ybi y que también minimicen
los errores de Yi para cada una de las observaciones.
Donde:
b1
SSxy
SSx
bo Y b1 X
n
Promedio de x
X
x
i 1
i
n
n
Promedio de y
Y
2
y
i 1
n
i
3. Este modelo implica preguntarnos ¿Existe una relación entre las dos
variables? Y ¿Que tan fuerte es esta relación?
Para contestar estas dos preguntas se recurrió al Coeficiente de Correlación (r)
y elCoeficiente de Determinación (r2) El valor de r siempre tendrá valores
dentro del rango -1 y 1, donde el valor negativo implica una relación lineal
negativa y viceversa. Es decir mientras más cercano al uno absoluto se
encuentre el coeficiente de correlación, el modelo que representa a la relación
probabilística tendrá una mejor correspondencia con los datos generados en la
realidad1. Paradeterminar los valores críticos de r, se tendrá un nivel de
significación α=0.10
En base a la tabla IX2 encontramos los valores críticos de r
r > valor absoluto 0.412
r
r
2
SS xy
SS xx SS yy
SS xy2
SS x SS y
Donde:
SS xy xy
1
x y
n
SS x x 2
1
x 2
n
SS y y 2
1
y 2
n
Yi= El valor estimado de la variable dependiente en la iesima observación.
bo y βi sonparámetros obtenidos por el método de mínimos cuadrados.
Xi= Es el valor de la variable independiente en la iesima observación.
ε =Es el error aleatorio.
n= número de datos.
x= observación de la variable independiente.
y= observación de la variable dependiente.
X = Promedio de las observaciones de x.
Y =Promedio de las observaciones de y.
SSx = Suma de cuadrados de x
SSy = Suma de cuadrados de y
1
Opcit. (Rubio, 2003)
3
Tabla 1. De las operaciones efectuadas
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
totales
Estatura=
xi
medición
real
155
172
165
153
168
154
158
164
168
173
160
170
183
167
180
2490
SSx
1134
SSy
68.9333333
SSxy
201
n° de
observación
Diámetro = yi
medición real
xi
yi
xi*yi
51
55
53
51
54
55
54
56
56
58
55
57
59
55
55
824
24025
29584
27225
23409
28224
23716
2496426896
28224
29929
25600
28900
33489
27889
32400
414474
2601
3025
2809
2601
2916
3025
2916
3136
3136
3364
3025
3249
3481
3025
3025
45334
2
DIÀMETRO
estimado
error
7905
9460
8745
7803
9072
8470
8532
9184
9408
10034
8800
9690
10797
9185
9900
136985
53.0
56.0
54.8
52.6
55.3
52.8
53.5
54.6
55.3
56.2
53.9
55.6
57.9
55.1
57.4
-2.0
-1.0
-1.8
-1.6
-1.3
2.2
0.5
1.4
0.7
1.8
1.1
1.4
1.1
-0.1
-2.4
b1=...
Regístrate para leer el documento completo.