Estadictica (correlacion)
ELABORADO POR: DOUGLAS AGUILAR
INTRODUCCIÓN
Parte de la Estadística corresponde a la Estadística Inferencial y dentro de ella la correlación la cual es muy usada en la Investigación Científica, una herramienta muy útil cuando se trata de relacionar 2 o más variables, relacionadas entre si, como por ejem. nivel de hemoglobina y embarazo en el ámbito de las Ciencias de laSalud, la Correlación implica el grado de dependencia de una variable respecto a otra, de esta manera, existe varios tipos de correlación, la distribución bidimensional, temas que se añadirán a la presente investigación.
LA CORRELACIÓN
Indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuandolos valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad.
CLASES DE CORRELACIÓN
Correlación directa
La correlación directa se da cuandoal aumentar una de las variables la otra aumenta.
Correlación inversa
La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.
Correlación nula
La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables.
DISTRIBUCIÓN BIDIMENSIONAL
Distribución estadística en la que intervienen dos variables, x e y, y, por tanto, a cadaindividuo le corresponden dos valores, xi, yi. Estos dos valores se pueden considerar como coordenadas de un punto (xi, yi) representado en un diagrama cartesiano. Así, a cada individuo de la distribución le corresponderá un punto, y toda la distribución se verá representada mediante un conjunto de puntos.
Por ejemplo, supongamos que si a los cinco hijos, A, B, C, D y E, de una familia se les pasanunas pruebas que miden la aptitud musical (Mu) y la aptitud para las matemáticas (Ma), se obtienen los siguientes resultados:
Esta tabla es una distribución bidimensional porque intervienen dos variables: valoración Mu, valoración Ma. A cada individuo le corresponden dos valores: A(5,6), B(7,10), C(4,5), D(8,6), E(2,4). De este modo se asocia a cada individuo un punto en un diagramacartesiano:
Esta representación gráfica de una distribución bidimensional se llama nube de puntos o diagrama de dispersión.
DIAGRAMA DE DISPERSIÓN
Un diagrama de dispersión es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultadosobtenidos. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causa-efecto es la clave de la resolución eficaz de un problema, que las relaciones de causa-efecto casi siempre muestran variaciones, y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números
EL COEFICIENTE DE PEARSON
Es un índiceestadístico que mide la relación lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones estándar de ambas variables:
Siendo:
σXY la covarianza de (X,Y)
σX y σY lasdesviaciones típicas de las distribuciones marginales.
El valor del índice de correlación varía en el intervalo [-1, +1]:
• Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total entre las dos variables, es decir, que la variación de una de ellas puede influir en el valor que pueda tomar la otra. Pudiendo haber relaciones no lineales entre las dos...
Regístrate para leer el documento completo.