estadistica
Un distribuidor de cervezas está analizando el sistema de entregas de su producto; en
particular, está interesado en predecir el tiempo sugerido para servir a los detallistas. El
ingeniero industrial a cargo del estudio ha sugerido que los factores que influyen sobre el
tiempo de entrega son el número de cajas de cervezas y la máxima distancia que debeviajar el despachador. Se tomaron muestras y se obtienen los resultados que se
muestran en la tabla 1.
Número de
Cajas (X1)
Distancia
(X2)
Tiempo
(Y)
10
30
24
15
25
27
10
40
29
20
18
31
25
22
25
18
31
33
12
26
26
14
34
28
16
29
31
22
37
39
24
20
33
17
25
30
13
27
25
3023
42
24
33
40
Tabla 1: Número de cajas transportadas, distancia recorrida y tiempo de servicio
al cliente para 15 muestras de un sistema de reparto de cerveza
Primero se explorará las relaciones entre todas las parejas de variables, en particular la relación de Y
con cada una de las variables independientes. Esto lo detectaremos a través de las correlaciones y la
función pairsde R, la cual produce un gráfico matricial para las variables dadas.
Comandos en R:
cervezas=read.table('cervezas.txt',header=T) – Cargando los datos
pairs(cervezas)
25
30
35
40
25
30
20
30
35
40
10
15
20
No.cajas
35
40
20
25
Distancia
25
30
Tiempo
10
15
20
25
30
25
30
35
40
Figura 1: Plot matricialde las variables del conjunto de datos “cervezas”
cor(cervezas) - Correlaciones
No.cajas Distancia Tiempo
No.cajas 1.0000000 -0.4052976 0.7246466
Distancia -0.4052976 1.0000000 0.1269032
Tiempo
0.7246466 0.1269032 1.0000000
Si deseamos observar
plot(Distancia,Tiempo)
los
gráficos
bidimensionales
hacemos:
plot(No.cajas,Tiempo)
y
40
40
35
35
TiempoTiempo
30
30
25
25
10
15
20
25
30
20
No.cajas
25
30
35
40
Distancia
Figura 2: Gráficos 2D de la variable respuesta en función de las variables independientes por separado
Se puede observar que la variable independiente “No. de cajas” (X1) es la que tiene mejor relación
lineal con el tiempo de entrega, es decir, a medida que aumenta una de ellasaumenta la otra. En
tanto la máxima distancia (X2) que debe recorrer el despachador no parece tener una relación lineal
muy marcada para predecir el tiempo.
AJUSTE DE UN MODELO
Supongamos que se decide usar un modelo de la forma:
yi = β0 + β1x1i + β2 x2i +εi
De manera matricial tenemos, ࢅ ൌ ࢄࢼ ࢿ, donde
Y: vector n x 1 de respuestas (variable dependiente)
X: matriz n x p quecontiene ceros, unos y/o valores de variables independientes (matriz de diseño)
ࢼ: vector p x 1 de parámetros
ࢿ: vector n x 1 de errores aleatorios
15
15
i =1
Datos:
24
1
27
1
ۊ ۇ
1ۇ
29
ۋ ۈ
1ۈ
31
ۋ ۈ
1ۈ
25ۋ
ۈ
1ۈ
33ۋ
ۈ
1ۈ
26ۋ
ۈ
ࢅ ൌ ࢄ , ۋ82ۈൌ 1ۈ
1ۈ
ۋ13ۈ
1ۈ
ۋ93ۈ
1ۈ
ۋ33ۈ
1ۈ
ۋ03ۈ
1ۈ
ۋ52ۈ
1
42
1ۉی04ۉ
15
i =1
∑ x1i = 270 ,∑ x2i = 420 , ∑ yi = 463
10
15
10
20
25
18
12
14
16
22
24
17
13
30
24
30
25
40ۊ
18ۋ
22ۋ
31ۋ
β
26ۋ
ࢼ , ۋൌ ቌβଵ ቍ
34
29ۋ
βଶ
37ۋ
20ۋ
25ۋ
27ۋ
23
33ی
i =1
Con lo cual las ecuaciones normales (sistema de mínimos cuadrados) toman la forma
15
൭270
420
ሺࢄ௧ ࢄሻࢼ ൌ ሺࢄ௧ ࢅሻ
270
5364
7347
መ
ߚ463
420
መ
7347 ൱ ቌߚଵ ቍ ൌ ൭ 8679 ൱
13027
12308 ߚଶ
መ
−1
ˆ
β 0 15
ˆ
β 0 3, 478 −0, 069 −0, 078 463
270
420 463
ˆ
ˆ
β1 = 270 5.364 7.347 * 8.679 ⇒ β1 = −0, 069 0, 0024 0, 001 * 8.679
ˆ
ˆ
β 2 420 7.347 12.308 13.027
−0, 078 0, 001 0, 002 13.027
β2
...
Regístrate para leer el documento completo.