Estadistica
Apuntes de clase del curso Seminario Investigativo VI
Por:
Gustavo Ramón S.*
* Doctor en Nuevas Perspectivas en la Investigación en Ciencias de la Actividad Física y el Deporte
(Universidad de Granada).
Docente – Investigador del Instituto Universitario de Educación Física, Universidad de
Antioquia (Colombia).
Correo: gusramon2000@yahoo.es
Correlaciónentre variables
La Correlación es una técnica estadística usada para determinar la relación entre
dos o más variables.
La relación entre la duración de una carrera de distancia y el test del escalón, o la
relación entre las características de la personalidad y la participación en deportes
de alto riesgo.
La correlación puede ser de al menos dos variables o de una variable dependiente
y doso más variables independientes, denominada correlación múltiple.
Coeficiente de correlación
El Coeficiente de Correlación es un valor cuantitativo de la relación entre dos o
más variables.
La coeficiente de correlación puede variar desde -1.00 hasta 1.00.
La correlación de proporcionalidad directa o positiva se establece con los valores
+1.00 y de proporcionalidad inversa o negativa, con-1.00. No existe relación entre
las variables cuando el coeficiente es de 0.00.
Nombre
Masa corporal
Fuerza
Pedro
60
130
Pablo
70
150
Chucho
80
170
Jacinto
90
190
José
100
210
Nombre
Masa corporal
Fuerza
Pedro
1
1
Pablo
2
2
Chucho
3
3
Jacinto
4
4
José
5
5
Coeficiente de correlación = rN
Masa
X
X2
Fuerza
Y
Y2
XY
1
60
3600
100
10000
6000
2
65
4225
105
11025
6825
3
70
4900
102
10404
7140
4
75
5625
135
18225
10125
5
80
6400
95
9025
7600
6
85
7225
125
15625
10625
7
90
8100
140
19600
12900
8
95
9025
130
16900
12350
9100
10000
148
21904
14800
Σ
720
59100
1080
13270
88065
Ecuaciones de Regresión
La fórmula general para una ecuación de regresión lineal es:
Y’= a+bX
donde Y’ es el valor predicho
• a es el intercepto
• b es la pendiente de la línea
•y X es el predictor
• a puede ser calculada a partir de la siguiente fórmula:
a = My - bMx , donde My es la media de Y, yMx es la media de X
•b puede ser calculada a partir de la siguiente fórmula:
4 b = r (Sy/Sx) , donde Sy es la desviación estándar de Y, y Sx la de X
Intercepto = a = O
Pendiente = b = Y / X = (5-0) / (5 — 0) = 1
Si X = 2 → Y = O + 1*2 = 2
b= r (Sy/Sx)= 0.771 (19.71/13.69)= 1.110
a= My – bMx= 120 - 1.110*80= 31.2
Con esta ecuación de regresión podemos calcular los valores de losextremos para
la masa corporal (60 y 100 kg):
Y60 = 31.2 + 1.110*60 = 97.8
Y100 = 31.2 + 1.110*100 = 142.2
Valores reales para una masa corporal de 60kg era de 100 Kp y en el caso estimado
fue de 97.8 (una diferencia de -2.2 kp)
Para el 100 kg, era de 150 y su estimación fue de 142.2 (una diferencia de -7.8kp).
Esto sucede porque la correlación no es de 1.00.
error estándar de la estimación.En el anterior ejemplo, hicimos la recta de regresión de Y sobre los valores de X.
Pero igualmente podríamos calcular y dibujar la línea de regresión de los valores
de X sobre Y (X’= 15.71 + O.536Y). El resultado final sería el gráfico siguiente.
Se puede observar que ambas rectas se cortan en el punto correspondiente a la
media de X y la media de Y.
Se podría decir que la relación entrelas rectas de regresión gira en este punto
común. De manera que, cuando r es igual a 1, las rectas se superponen y cuando r
es cero, las rectas son perpendiculares.
Se pueden realizar diagramas de dispersión en los que aparece una sola recta de
regresión: la que sirve para predecir Y a partir de los valores de X.
Aunque este estudio se refiera a una sola recta, todas las conclusiones serán...
Regístrate para leer el documento completo.