ESTADISTICA
Análisis de Regresión y Correlación
CONCEPTOS
Muchas veces las decisiones se basan en la relación entre dos o más variables. Ejemplos
Dosis de fertilizantes aplicadas y rendimiento del cultivo.
La relación entre la radiación que reciben los sensores con la que se predicen los rendimientos por parcelas con los rendimientos reales observados en dichas parcelas.
Relación entre tamaño deun lote de producción y horas -hombres utilizadas para realizarlo.
Distinguiremos entre relaciones funcionales y relaciones estadísticas
Relación funcional entre dos variables
Una relación funcional se expresa mediante una función matemática.
Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma:
Y=f(X)
Cuando se trabaja con dos omás variables, es importante conocer la relación entre ellas. Si una o más variables son aleatorias, no habrá una relación unívoca entre los valores de dos de las variables -es decir, dado un valor de una variable (la variable controlada), hay un posible rango de valores de la otra- y por lo tanto se requiere una descripción probabilística. La relación probabilística de las variables, que se describecon la media y la varianza de una variable aleatoria en función de los valores de la otra variable, se conoce como análisis de regresión. Cuando el análisis se limita a funciones lineales, se trata de una regresión lineal, pero la regresión puede ser también de tipo no lineal. En algunos casos, problemas de regresión no lineal pueden convertirse en lineales mediante una transformación de lasvariables originales
Conceptos básicos
Análisis de Regresión: Es un procedimiento estadístico que estudia la relación funcional entre variables.Con el objeto de predecir una en función de la/s otra/s.
Análisis de Correlación: Un grupo de técnicas estadísticas usadas para medir la intensidad de la relación entre dos variables
Diagrama de Dispersión: Es un gráfico que muestra la intensidad yel sentido de la relación entre dos variables de interés.
Variable dependiente (respuesta, predicha, endógena): es la variable que se desea predecir o estimar
Variables independientes (predictoras, explicativas exógenas). Son las variables que proveen las bases para estimar.
Regresión simple: interviene una sola variable independiente
Regresión múltiple: intervienen dos o más variablesindependientes.
Regresión lineal: la función es una combinación lineal de los parámetros.
Regresión no lineal: la función que relaciona los parámetros no es una combinación lineal
Gráfico de dispersión
Los diagramas de dispersión no sólo muestran la relación existente entre variables, sino también resaltan las observaciones individuales que se desvían de la relación general. Estas observaciones sonconocidas como outliers o valores inusitados, que son puntos de los datos que aparecen separados del resto.
Gráfico de dispersión entre Bandas
Coeficiente de correlación lineal
El Coeficiente de Correlación (r) requiere variables medidas en escala de intervalos o de proporciones
- Varía entre -1 y 1.
- Valores de -1 ó 1 indican correlación perfecta.
- Valorigual a 0 indica ausencia de correlación.
- Valores negativos indican una relación lineal inversa y valores positivos indican una relación lineal directa
Correlación Negativa Perfecta
Ausencia de Correlación
Correlación Fuerte y Positiva
Fórmula para el coeficente de correlación (r) Pearson
Modelos de Regresión
Unmodelo de regresión, es una manera de expresar dos ingredientes esenciales de una relación estadística:
-
Una tendencia de la variable dependiente Y a variar conjuntamente con la variación de la o las X de una manera sistemática
- Una dispersión de las observaciones alrededor de la curva de relación estadística
Estas dos características están implícitas en un modelo de regresión,...
Regístrate para leer el documento completo.