coeficiente de determinacion
El coeficiente de determinación o coeficiente de correlación múltiple al cuadrado, es una medida descriptiva que sirve para evaluar la bondad de ajuste del modelo a lodatos, ya que mide la capacidad predictiva del modelo ajustado. Se define como el cociente entre la variabilidad explicada por la regresión y la variabilidad total, esto es:
algunas otras formasde presentar el coeficiente de determinación son:
Algunas de las equivalencias anteriores pueden verse a partir de la demostración de .
Demostración de formula
El coeficiente de determinaciónmúltiple, es una generalización del valor de definida en la lección de Rcuadrado definida para una línea recta.
Utilidad
Se utiliza para medir la reducción en la variabilidad total de debido ala inclusión de las variables regresoras . Un valor grande de no necesariamente implica que el modelo es bueno. Adicionar variables al modelo siempre incrementa el valor de , ya sea que las variablescontribuyan o no al modelo. Es posible que modelos con valor de grande sean malos en la predicción o estimación.
OBSERVACIONES
1. mide la correlación entre y y .
2. Si existe error puro, esimposible que alcance el valor de . La única manera en que podría dar , sería que se tuviera un perfecto ajuste de los datos en el cual , lo cual es un improbable evento en la práctica,
3. Si , estoes si (suponiendo que el modelo ha sido ajustado), entonces .
4. es
una medida de la utilidad de los términos en el modelo diferentes de
La estadística R2 ajustada
Como alternativa aluso de como medida de la idoneidad de un modelo, es común que se informe el coeficiente de determinación múltiple ajustado, denotado por . esta dado por
Se observa que toma en cuenta ("ajusta por")tanto el tamaño de la muestra como el número de parámetros del modelo. siempre es menor que y lo que es más importante , no puede "forzarce" hacia con sólo agregar más y más variables...
Regístrate para leer el documento completo.