Ejemplo correlacion y regresion
Documento de lectura
Estadística Descriptiva
Regresión y Correlación
COEFICIENTE DE CORRELACIÓN
De los diversos coeficientes de correlación que existen, el más popular y utilizado es el Coeficiente de
Correlación de Pearson. Para su aplicación es indispensable que la correlación sea lineal. El coeficiente de
correlación de Pearson, que se simboliza con la letraminúscula r, se calcula dividiendo la suma de los
productos de las desviaciones de cada variante de X e Y, con respecto a sus medias (suma que se
denomina covarianza de X e Y), por el producto de las desviaciones estándar de ambas variables. En forma
práctica, el coeficiente de correlación de Pearson es:
Ejemplo:
La siguiente tabla muestra los datos registrados en una muestra de empresas que mide sunivel de ventas
en función del gasto de publicidad y promoción.
X
Y
Gastos de promoción
Ventas en miles
245
13.4
172
10.3
291
15.1
124
6.9
191
7.3
218
14.2
101
5.2
259
11.8
307
14.3
142
5.5
∑
Estadística Descriptiva
2050
104
- 2-
x2
60025
29584
84681
15376
36481
47524
10201
67081
94249
20164
y2
179.56
106.09
228.01
47.61
53.29
201.64
27.04
139.24
204.49
30.25
xy
3283
1771.6
4394.1
855.61394.3
3095.6
525.2
3056.2
4390.1
781
465366
1217.22
23546.7
2015
Regresión y Correlación
La fórmula que se debe aplicar para determinar el coeficiente de Pearson es:
(
√(
(
)
)
(
)(
)
)(
)
√
REGRESIÓN LINEAL
Se busca encontrar una línea recta que se ajuste de mejor manera a los datos observado, por ello se busca
minimizar las diferencias de los valores observados con los esperados, paraello se utiliza el método de
mínimos cuadrados que intenta buscar la función: Y = a + bx. Otra posible notación es
.
Las fórmulas que se aplican para determinar ambos parámetros de la línea recta son:
(
)(
)
(
)(
) (
)
)
(
(
(
(
)
)(
(
)
)
)
Para la ecuación de regresión sustituimos valores:
Estadística Descriptiva
- 3-
2015
Regresión y Correlación
REGRESIÓN EN EXCEL
Pararealizar el procedimiento sobre análisis de regresión y correlación utilizando Excel es necesario
verificar inicialmente que se encuentre activada en la pestaña de datos la aplicación de análisis de datos.
Luego se siguen los siguientes pasos.
El ingreso de datos se puede observar de la siguiente forma
Luego el resumen de resultados se presenta a continuación, resaltando los valores principalespara el
análisis de los datos en color amarillo.
Estadística Descriptiva
- 4-
2015
Regresión y Correlación
La gráfica del ejercicio es la siguiente:
Estadística Descriptiva
- 5-
2015
Regresión y Correlación
EJEMPLO DE PROYECTO
TEMA
RELACIÓN DEL PRECIO DEL COMBUSTIBLE
Y DE LA CANASTA BÁSICA
INTRODUCCIÓN
El siguiente informe tiene la finalidad de conocer si existe alguna relación entre dosvariables importantes, el promedio
anual del precio del diesel1 y como este determina al promedio de la canasta básica vital
HIPOTESIS
El costo de la canasta básica (variable dependiente) se encuentra relacionado de manera directa y depende del precio
del combustible diesel (variable independiente), pues es el utilizado en el transporte de carga pesada, ya que eleva el
costo de transporte de losproductos de la canasta básica, y por lo mismo el precio a los consumidores también se
incrementa.
RESULTADOS
La serie de datos estudiada comprende de 2002 al 2012. Los resultados obtenidos mediante el análisis de datos de Excel,
se presentan a continuación.
CUADRO No. 1
PRECIOS DE VARIABLES EN ESTUDIO
PERIODO 2002-2012
Canasta básica
Precio diesel
2002
2003
2004
2005
2006
2007
2008
2009
20102011
2012
Sumatoria
Promedio
1
9.9
11.18
13.68
18.13
19.99
21.49
30.12
20.07
24.42
31.05
31.93
21.08727273
2199.66
2265.8
2347.96
2490.09
2602.14
2879.35
3393.41
3564
3705.8
4230.98
4645.3
X2
98.01
124.9924
187.1424
328.6969
399.6001
461.8201
907.2144
402.8049
596.3364
964.1025
1019.5249
5490.245
3120.408182 499.113182
Y2
XY
4838504.12
5133849.64
5512916.16
6200548.21
6771132.58...
Regístrate para leer el documento completo.