Cap Tulo 13
Regresión lineal y correlación
Objetivos: Al terminar este capítulo podrá:
1.
Trazar un diagrama de dispersión.
2.
Entender e interpretar los términos variable dependiente y variable
independiente.
3.
Calcular y explicar el coeficiente de correlación, y el coeficiente de
determinación, así como el error estándar de estimación.
4.
Realizar una prueba de hipótesis paraestablecer si el coeficiente de
correlación de la población es cero.
1
Capítulo 13 (Continuación)
5.
Determinar la línea (o recta) de regresión de mínimos cuadrados.
6.
Elaborar e interpretar intervalos de confianza e intervalos de predicción
para la variable dependiente.
7.
Establecer e interpretar una tabla de ANOVA.
2
Análisis de correlación
El análisis de correlación es ungrupo de técnicas
estadísticas usadas para medir la fuerza de la
asociación entre dos variables.
Un diagrama de dispersión es una gráfica que
representa la relación entre dos variables.
La variable dependiente es la variable que se predice o
calcula.
La variable independiente proporciona las bases para el
cálculo. Es la variable de predicción.
3
El coeficiente de correlación, r
Elcoeficiente de correlación (r) es una medida de la
intensidad de la relación lineal entre dos variables.
Requiere datos de nivel de razón.
Puede tomar cualquier valor de -1.00 a 1.00.
Los valores de -1.00 o 1.00 indican la correlación
perfecta y fuerte.
Los valores cerca de 0.0 indican la correlación débil.
Los valores negativos indican una relación inversa y los
valores positivos indican una relacióndirecta.
4
Correlación negativa perfecta
Y
10
9
8
7
6
5
4
3
2
1
0
0
1
2
3
4
5
X
6
7
8
9
5
10
Correlación positiva perfecta
Y
10
9
8
7
6
5
4
3
2
1
0
0
1
2
3
4
5
X
6
7
8
9
6
10
Correlación cero
Y
10
9
8
7
6
5
4
3
2
1
0
0
1
2
3
4
5
X
6
7
8
9
7
10
Correlación positiva fuerte
Y
10
9
8
7
6
5
4
3
2
1
0
0
1
2
3
4
5
X
6
7
8
9
8
10
Fórmula para r
Calculamos el coeficiente de correlación de las
fórmulas siguientes.
( X X )(Y Y )
r
(n 1) s x s y
n(XY ) (X )(Y )
n ( X
2
) ( X ) n Y Y
2
2
9
2
Coeficiente de determinación
El coeficiente de determinación (r2) es la proporción de
la variación total en la variable dependiente (y) que se
explica por la variación en la variableindependiente (x).
Es el cuadrado del coeficiente de correlación.
Su rango es de 0 a 1.
No da ninguna información sobre la dirección de la
relación entre las variables.
10
Ejemplo 1
Juan Escobedo, presidente de la sociedad de alumnos
de la Universidad de Toledo, se ocupa de estudiar el
costo de los libros de texto. Él cree que hay una relación
entre el número de páginas en el texto y el precio de
ventadel libro. Para proporcionar una prueba,
selecciona una muestra de ocho libros de texto
actualmente en venta en la librería. Dibuje un diagrama
de dispersión. Compruebe el coeficiente de correlación.
11
Ejemplo 1 (Continuación)
Libro
Intr. a la Historia
Álgebra
Intr.a la Psicología
Intr. a la Sociología
Mercadotecnia
Intr. a la Biología
Fund. de Jazz
Intr.a la EnfermeríaPáginas
500
700
800
600
400
500
600
800
Precio ($)
84
75
99
72
69
81
63
93
12
Ejemplo 1 (Continuación)
Scatter Diagram of Number of Pages and Selling Price of Text
100
90
Price ($)
80
70
60
400
500
600
700
800
Page
13
Ejemplo 1 (Continuación)
Libro
Páginas
X
Precio ($)
Y
XY
X2
Y2
Intr. a la Historia
500
84
42,000
250,000
7,056
Álgebra
700
75
52,500
490,000
5,625
Intr. ala Psicología
800
99
79,200
640,000
9,801
Intr. a la Sociología
600
72
43,200
360,000
5,184
Mercadotecnia
400
69
27,600
160,000
4,761
Intr. a la Biología
500
81
40,500
250,000
6,561
Fund. de Jazz
600
63
37,800
360,000
3,969
800
4,900
93
636
74,400
640,000
397,200 3,150,000
8,649
51,606
Intr. a la Enfermería
Total
14
Ejemplo 1 (Continuación)
r
n(XY )...
Regístrate para leer el documento completo.