COEFICIENTE DE DETERMINACION R2
En estadística, el coeficiente de determinación, denominado R2 y pronunciado R cuadrado, es un estadístico usado en el contexto de un modelo estadístico cuyo principalpropósito es predecir futuros resultados o testear una hipótesis. El coeficiente determina la calidad del modelo para replicar los resultados, y la proporción de variación de los resultados que puedeexplicarse por el modelo.1
Hay varias definiciones diferentes para R2 que son algunas veces equivalentes. Las más comunes se refieren a la regresión lineal. En este caso, el R2es simplemente elcuadrado del coeficiente de correlación de Pearson, lo cual es sólo cierto para la regresión lineal simple. Si existe varios resultados para una única variable, es decir, para una X existe una Y, Z... elcoeficiente de determinación resulta del cuadrado del coeficiente de determinación múltiple. En ambos casos el R2 adquiere valores entre 0 y 1. Existen casos dentro de la definición computacionalde R2 donde este valor puede tomar valores negativos2 .
Cálculo
Caso general
Un modelo estadístico se construye para explicar una variable aleatoria que llamaremos dependiente a través de otrasvariables aleatorias a las que llamaremos factores. Dado que podemos predecir una variable aleatoria mediante su media y que, en este caso, el error cuadrático medio es su varianza, el máximo errorcuadrático medio que podemos aceptar en un modelo para una variable aleatoria que posea los dos primeros momentos es la varianza. Para estimar el modelo haremos varias observaciones de la variable a predeciry de los factores. A la diferencia entre el valor observado de la variable y el valor predicho la llamaremos residuo. La media cuadrática de los residuos es la varianza residual.
Si representamospor la varianza de la variable dependiente y la varianza residual por , el coeficiente de determinación viene dado por la siguiente ecuación:
Se...
Regístrate para leer el documento completo.