Análisis de datos en los estudios epidemiológicos iii

Solo disponible en BuenasTareas
  • Páginas : 8 (1988 palabras )
  • Descarga(s) : 0
  • Publicado : 27 de mayo de 2011
Leer documento completo
Vista previa del texto
Formación Metodológica: Correlación y regresión Julia García

Análisis de datos en los estudios epidemiológicos III Correlación y regresión
Julia García Salinero. Departamento de Investigación Fuden

Introducción
En el capitulo anterior estudiamos lo que se denomina estadística descriptiva univariada (una sola variable), sin embargo la mayor parte de investigaciones llevadas a cabo no solopretenden describir fenómenos en base a la distribución de sus variables principales, sino que intentan encontrar relación entre algunas de las variables estudiadas. A la parte de la estadística que se encarga de estudiar este tipo de relaciones entre variables se le denomina estadística descriptiva bivariada o multivariada. En los siguientes capítulos vamos a detenernos en el estudio de algunasde las pruebas estadísticas que debemos utilizar cuando queremos encontrar relación o asociación entre las diferentes variables del estudio. Ya indicamos en el capitulo anterior que los datos de una distribución de frecuencias se ordenaban en tablas de distribución. En el caso de la estadística bivariada también organizamos los datos en tablas, que en este caso se denominan tablas de contingencia.Una tabla de contingencia es una distribución con dos o más dimensiones (bidimensional), en la cual las frecuencias de dos o más variables se tabulan de manera cruzada. A pesar de que se pueden construir tablas de contingencia con varias variables y categorías las más frecuentemente utilizadas son las tablas de contingencia de 2x2 (dos filas por dos columnas), es decir dos variables que presentandos categorías cada una de ellas. Volveremos más tarde sobre este tema.

Los conceptos de Correlación y Regresión
Correlación Se utiliza para obtener una medida del grado o la fuerza de la asociación entre dos variables cuantitativas. El método más comúnmente utilizado para describir la relación entre dos variables es el coeficiente de correlación. Este tipo de relaciones puede ilustrarse deforma grafica, o bien, como sucede casi siempre, calcularse a través de la realización de una prueba que defina la magnitud de esa relación. La representación gráfica de una correlación entre dos variables se denomina grafica o diagrama de dispersión, que no será estudiado en este capitulo, ya que no suele ser muy utilizado. En la figura 1 observamos un ejemplo de un diagrama de dispersión queexpresa la relación existente entre la dosis de un determinado fármaco hipotensor y los valores de la presión sanguínea. A pesar de la utilización de diagramas, el índice más frecuentemente empleado, para determinar la intensidad de la relación entre dos variables X e Y, es el coeficiente de correlación de Pearson. Este coeficiente se calcula cuando las variables de estudio fueron medidas en escala deintervalos o de proporción. Cuando las variables fueron medidas en escala ordinal, se suele utilizar el coeficiente de correlación de rho de Sperman. Sus valores oscilan entre -1 y +1. Un valor de Pearson igual a 0 indica la ausencia de relación, es decir que las dos variables son independientes. Valores grandes de dicho coeficiente (r), ya sean positivos o negativos, indican una fuerte relaciónentre las dos variables. Un valor de r positivo indica que valores grandes de la variable X se asocian con valores grandes de la variable Y; y los valores bajos de la variable X se asocian con valores bajos de la variable Y. Por su parte, un valor de r negativo indica que los valores grandes de la variable X se asocian con valores bajos de la variable Y, y que valores bajos de la variable X seasocian con valores altos de la variable Y. En la figura 2 observamos diferentes tipos de correlación, aunque nosotros solo nos detendremos en el análisis de la correlación lineal. El coeficiente de correlación de Pearson depende fundamentalmente de: • La variabilidad del grupo. A mayor variabilidad de la población , el r tiene mayor fuerza; El influjo de una tercera variable que pudiera enmascarar...
tracking img