Regresi N Lineal 2015 00
Ejemplo 1
El dueño de una empresa que vende carros desea determinar si
hay relación lineal entre los años de experiencia de sus
vendedores y la cantidad de carros que venden. Los siguientes
datos representan los años de experiencia (X) y las unidades de
carros vendidas al año (Y), de 10 vendedores de la empresa.
Solución:
Primero hacemos un grafico considerando los añosexperiencia en el eje horizontal y las ventas en el eje vertical.
de
2
Scatterplot of ventas vs years
50
v
ventas
40
30
Se puede notar que hay una
buena tendencia lineal
20
10
0
5
10
15
20
25
years
3
Covarianza
La covarianza se define como:
∑ (x − x )( y
n
S xy = Cov( x; y ) =
i =1
i
i
− y)
n
Cov(x;y) = 0 independencia lineal
Cov(x;y) > 0 relación lineal directa o positivaCov(x;y) < 0 relación lineal inversa o negativa
4
El Coeficiente de Correlación
Llamado también coeficiente de correlación de Pearson, se
representa por r y es una medida que representa el grado de
asociación entre dos variables cuantitativas X e Y.
Cov( x; y )
r=
SxS y
∑ (X
N
rxy =
.
S xy
Sx Sy
=
i =1
∑ (X
N
i =1
i
i
− X )(Yi − Y
− X)
2
∑ (Y
N
i =1
i
)
− Y
)
2
5
ElCoeficiente de Correlación
• La correlación varia entre -1 y 1.
• En la mayoria de los problemas, una correlación mayor
que 0.75 o menor que -0.75 es considerada bastante
aceptable. Una correlación que cae entre -0.3 y 0.3 es
considerada muy baja.
• Si la correlación es positiva, entonces cuando X aumenta
se espera que Y también aumente.
• Si la correlación es negativa, entonces cuando X aumenta
se esperaque Y disminuya.
6
Ejemplo 1(continua)
Interpretación: Existe una buena relación lineal entre los años de
experiencia y las unidades que vende el vendedor. Además mientras
más experiencia tiene el vendedor más carros venderá. Se puede
usar los años de experiencia para predecir las unidades que venderá
anualmente a través de una línea recta.
7
Ejemplo 2
área(pies2) precio
3060
179000
1600126500
2000
134500
1300
125000
2000
142000
1956
164000
2400
146000
1200
129000
1800
135000
1248
118500
2025
160000
1800
152000
1100
122500
3000
220000
2000
141000
Scatterplot of precio vs área
220000
200000
180000
precio
io
Casa
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
160000
140000
120000
1000
1500
2000
área
2500
3000
8
Regresión lineal simple
- Modelo poblacional:
Y = α + βX + ε
- Modelomuestral:
∧
∧
Y =α+ β X +u
- Modelo estimado:
Yˆ = αˆ + βˆX
Hipótesis básicas
1. El término de Error es una variable aleatoria con media cero:
E (ε i ) = 0
2. Homocedasticidad: la varianza del término de error es constante:
Var (ε i ) = σ
3. Los errores se distribuyen normalmente:
4. Los errores son independientes entre sí.
2
ε i ≈ N (0, σ )
2
Regresión Lineal Simple
Se trata de predecirel comportamiento de Y usando X entonces el
modelo de regresión lineal simple es de la forma:
Y =α + β X +ε
Donde
Y es llamada la variable de respuesta o dependiente,
X es llamada la variable predictora o independiente,
α es el intercepto de la línea con el eje Y,
β es la pendiente de la línea de regresión y
ε
es un error aleatorio, el cual se supone que tiene media 0 y
constante σ2.
11Línea de regresión estimada
El modelo de regresion lineal es estimado por la ecuación
Yˆ = αˆ + βˆX
El estimado αˆ de α y el estimado βˆ de β son hallados usando el
método de mínimos cuadrados, que se basa en minimizar la suma de
cuadrados de los errores:
n
n
)
) 2
)
)
2
Q (α ; β ) = e = ( y − α − β x )
∑
i =1
Luego se obtienen
βˆ =
s xy
sx
2
y
i
∑
i =1
i
αˆ = y − βˆx
i
.
12
Ejemplo 2(continua)
Se desea hallar una línea de regresión que permita
predecir el precio de una casa (Y) basado en el área
de la misma (X).
Solución
Para ello tenemos la ventana de diálogo para la regresión.
13
Resultados
Regression Analysis
The regression equation is
precio = 73168 + 38.5 area
Predictor
Constant
area
S = 14118
Coef
StDev
T
P
73168
12674
5.77 0.000
38.523
6.391
6.03 0.000
R-Sq =...
Regístrate para leer el documento completo.