Estadistica Ii
En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar losvalores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad
Problema de dependencia:
El problema de la dependencia consiste en el estudio de la relación existente entre dos o más características de los elementos de una población. Nos vamos a ocupar sólo del estudio de la relación entre dos características quepuedan ser representadas mediante variables medibles, suponiendo que de cada elemento de la población podemos obtener un valor para cada una de las variables, es decir consideraremos distribuciones estadísticas bidimensionales.
Diagrama de dispersión:
Un diagrama de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables paraun conjunto de datos.
Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical.1 Un diagrama de dispersión se llama también gráfico de dispersión.
Coeficiente de correlación lineal de Pearson:
El coeficiente de correlación de Pearson,pensado para variables cuantitativas (escala mínima de intervalo), es un índice que mide el grado de covariación entre distintas variables relacionadas linealmente. Adviértase que decimos "variables relacionadas linealmente". Esto significa que puede haber variables fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la correlación de Pearson. Por ejemplo, larelación entre la ansiedad y el rendimiento tiene forma de U invertida; igualmente, si relacionamos población y tiempo la relación será de forma exponencial. En estos casos (y en otros muchos) no es conveniente utilizar la correlación de Pearson. Insistimos en este punto, que parece olvidarse con cierta frecuencia.
El coeficiente de correlación de Pearson es un índice de fácil ejecución e,igualmente, de fácil interpretación. Digamos, en primera instancia, que sus valores absolutos oscilan entre 0 y 1. Esto es, si tenemos dos variables X e Y, y definimos el coeficiente de correlación de Pearson entre estas dos variables como rxy entonces:
0 ≤ rxy ≤ 1
Hemos especificado los términos "valores absolutos" ya que en realidad si se contempla el signo el coeficiente de correlación dePearson oscila entre –1 y +1. No obstante ha de indicarse que la magnitud de la relación vienen especificada por el valor numérico del coeficiente, reflejando el signo la dirección de tal valor. En este sentido, tan fuerte es una relación de +1 como de -1. En el primer caso la relación es perfecta positiva y en el segundo perfecta negativa.
Es una falacia que se comete al inferir que dos o máseventos están conectados causalmente porque se dan juntos. Esto es, la falacia consiste en inferir que existe una relación causal entre dos o más eventos por haberse observado una correlación estadística entre ellos. Esta falacia muchas veces se expresa mediante la frase «correlación no implica causalidad».
En general, la falacia reside en que dados dos eventos, A y B, al descubrir una correlaciónestadística entre ambos, es un error inferir que A causa B porque podría ser que B cause A, o también podría ser que un tercer evento cause tanto A como B, explicando así la correlación.
Determinación de la causalidad:
El filósofo David Hume argumentó que la relación causal entre dos eventos no puede ser percibida, y en cambio sólo se puede percibir correlación. Sin embargo, es posible...
Regístrate para leer el documento completo.