estadistica

Páginas: 7 (1618 palabras) Publicado: 16 de septiembre de 2013
Ejemplo de Regresión Lineal Múltiple

Un distribuidor de cervezas está analizando el sistema de entregas de su producto; en
particular, está interesado en predecir el tiempo sugerido para servir a los detallistas. El
ingeniero industrial a cargo del estudio ha sugerido que los factores que influyen sobre el
tiempo de entrega son el número de cajas de cervezas y la máxima distancia que debeviajar el despachador. Se tomaron muestras y se obtienen los resultados que se
muestran en la tabla 1.
Número de
Cajas (X1)

Distancia
(X2)

Tiempo
(Y)

10

30

24

15

25

27

10

40

29

20

18

31

25

22

25

18

31

33

12

26

26

14

34

28

16

29

31

22

37

39

24

20

33

17

25

30

13

27

25

3023

42

24
33
40
Tabla 1: Número de cajas transportadas, distancia recorrida y tiempo de servicio
al cliente para 15 muestras de un sistema de reparto de cerveza

Primero se explorará las relaciones entre todas las parejas de variables, en particular la relación de Y
con cada una de las variables independientes. Esto lo detectaremos a través de las correlaciones y la
función pairsde R, la cual produce un gráfico matricial para las variables dadas.
Comandos en R:
cervezas=read.table('cervezas.txt',header=T) – Cargando los datos
pairs(cervezas)

25

30

35

40

25

30

20

30

35

40

10

15

20

No.cajas

35

40

20

25

Distancia

25

30

Tiempo

10

15

20

25

30

25

30

35

40

Figura 1: Plot matricialde las variables del conjunto de datos “cervezas”

cor(cervezas) - Correlaciones
No.cajas Distancia Tiempo
No.cajas 1.0000000 -0.4052976 0.7246466
Distancia -0.4052976 1.0000000 0.1269032
Tiempo

0.7246466 0.1269032 1.0000000

Si deseamos observar
plot(Distancia,Tiempo)

los

gráficos

bidimensionales

hacemos:

plot(No.cajas,Tiempo)

y

40

40

35

35

TiempoTiempo

30

30

25

25
10

15

20

25

30

20

No.cajas

25

30

35

40

Distancia

Figura 2: Gráficos 2D de la variable respuesta en función de las variables independientes por separado

Se puede observar que la variable independiente “No. de cajas” (X1) es la que tiene mejor relación
lineal con el tiempo de entrega, es decir, a medida que aumenta una de ellasaumenta la otra. En
tanto la máxima distancia (X2) que debe recorrer el despachador no parece tener una relación lineal
muy marcada para predecir el tiempo.
AJUSTE DE UN MODELO

Supongamos que se decide usar un modelo de la forma:
yi = β0 + β1x1i + β2 x2i +εi

De manera matricial tenemos, ࢅ ൌ ࢄࢼ ൅ ࢿ, donde

Y: vector n x 1 de respuestas (variable dependiente)
X: matriz n x p quecontiene ceros, unos y/o valores de variables independientes (matriz de diseño)

ࢼ: vector p x 1 de parámetros

ࢿ: vector n x 1 de errores aleatorios

15

15

i =1

Datos:

24
1
27
1
‫ۊ ۇ‬
‫1ۇ‬
29
‫ۋ ۈ‬
‫1ۈ‬
31
‫ۋ ۈ‬
‫1ۈ‬
25‫ۋ‬
‫ۈ‬
‫1ۈ‬
33‫ۋ‬
‫ۈ‬
‫1ۈ‬
26‫ۋ‬
‫ۈ‬
ࢅ ൌ ‫ ࢄ , ۋ82ۈ‬ൌ ‫1ۈ‬
‫1ۈ‬
‫ۋ13ۈ‬
‫1ۈ‬
‫ۋ93ۈ‬
‫1ۈ‬
‫ۋ33ۈ‬
‫1ۈ‬
‫ۋ03ۈ‬
‫1ۈ‬
‫ۋ52ۈ‬
1
42
‫1ۉ‬‫ی04ۉ‬
15

i =1

∑ x1i = 270 ,∑ x2i = 420 , ∑ yi = 463

10
15
10
20
25
18
12
14
16
22
24
17
13
30
24

30
25
40‫ۊ‬
18‫ۋ‬
22‫ۋ‬
31‫ۋ‬
β଴
26‫ۋ‬
‫ ࢼ , ۋ‬ൌ ቌβଵ ቍ
34
29‫ۋ‬
βଶ
37‫ۋ‬
20‫ۋ‬
25‫ۋ‬
27‫ۋ‬
23
33‫ی‬

i =1

Con lo cual las ecuaciones normales (sistema de mínimos cuadrados) toman la forma

15
൭270
420


ሺࢄ௧ ࢄሻࢼ ൌ ሺࢄ௧ ࢅሻ

270
5364
7347


ߚ଴463
420

7347 ൱ ቌߚଵ ቍ ൌ ൭ 8679 ൱
13027
12308 ߚଶ


−1
ˆ
 β 0   15
ˆ
 β 0   3, 478 −0, 069 −0, 078   463 
270
420   463 
  
  
 

ˆ
ˆ
 β1  =  270 5.364 7.347  *  8.679  ⇒  β1  = −0, 069 0, 0024 0, 001  *  8.679 

 

 ˆ  
 ˆ  
 β 2   420 7.347 12.308  13.027 
−0, 078 0, 001 0, 002  13.027 
 

 β2  
 

...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Estadistica
  • Estadistica
  • Estadistica
  • Estadistica
  • Estadistica
  • Estadisticas
  • Estadistica
  • Estadistica

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS