Medidas globales de bondad de ajuste

Solo disponible en BuenasTareas
  • Páginas : 5 (1169 palabras )
  • Descarga(s) : 0
  • Publicado : 6 de noviembre de 2011
Leer documento completo
Vista previa del texto
Medidas globales de la bondad de ajuste
Estas medidas nos permiten tener una idea global sobre el ajuste del modelo, pero no nos permiten comprobar la presencia de valores extremos y de su influencia en el modelo desarrollado.
1. Devianza del modelo. Es una medida del grado de diferencia entre las frecuencias observadas y predichas por el modelo de la variable dependiente, de forma que amayor devianza, peor es el modelo. Su cálculo es -2 veces el logaritmo neperiano de la verosimilitud del modelo. La devianza nos puede orientar durante la etapa de selección del modelo final. Idealmente el modelo final, el mejor modelo, debería tener la menor devianza de los modelos analizados.
2. Razón de verosimilitud. El estadístico que se usa es G, que es -2 veces el logaritmo neperiano delcociente entre la verosimilitud del modelo con el conjunto de p covariables introducidas en el mismo y la del modelo sólo con la constante (o más fácil la diferencia entre las devianzas del modelo saturado y el modelo sólo con la constante). Este estadístico sigue una distribución χ2 con p grados de libertad. Si este estadístico alcanza significación estadística indica un buen ajuste, quiere decirque uno o más de los coeficientes de las covariables introducidas en el modelo es distinto de 0. SPSS® ofrece este estadístico con el término "χ2 del modelo" (frente a "χ2 de mejora " que en SPSS® indica la razón de verosimilitud por la introducción de una covariable).
3. χ2 residual de Pearson y devianza de residuos: Se trata de dos pruebas basadas en los residuos de nuestro modelo (se verámás adelante el concepto de residuo), que siguen una distribución χ2 con m-(p+1) grados de libertad. La ausencia de significación indica que el ajuste del modelo es bueno. No son aportadas por SPSS®.
Ambos estadísticos asumen que las celdas de las tablas de contingencia formadas por todas las covariables cualitativas no tienen frecuencias 0 y en no más del 20% de ellas las frecuenciasesperadas son menores de 5. Esta asunción debe haberse asegurado en el análisis univariado previo.
4. Prueba de Hosmer-Lemeshow: Cuando los patrones de covariables siguen una distribución n-asintótica, la χ2 residual de Pearson y la devianza de resíduos no se ajustan bien a una distribución χ2. Por ello en general será más apropiada la prueba de Hosmer-Lemeshow, que agrupa los n sujetos en m patronessegún criterios estadísticos. En concreto los sujetos se agrupan según los 9 deciles de las probabilidades esperadas; a partir de aquí puede construirse una tabla de contingencia de 10 x 2 de la que puede construirse un estadístico que seguirá una distribución χ2 con 8 grados de libertad. La ausencia de significación indica un buen ajuste del modelo.
Es conveniente comprobar la tabla decontingencia de la que deriva el estadístico; la presencia de celdas con frecuencias esperadas menores de 5 aconseja colapsar filas para eliminar estas celdas de baja frecuencia esperada; esto implicaría además reducir proporcionalmente los grados de libertad de la χ2 empleada (1 por fila eliminada) y recalcular el estadístico.
5. Tablas de clasificación: La ecuación del modelo ya diseñado nosproporciona una probabilidad P(Y=1|X), lo que nos permite predecir a partir de ella para cada sujeto un valor de y (Ypred), tal que si P(Y=1|X)≤0.5 entonces Ypred=0, y si P(Y=1|X)>0.5 entonces Ypred=1. Estos valores predichos de Y pueden enfrentarse a los valores reales de Y (Yobs) de la muestra, obteniendo una tabla de 2x2 de la que es posible determinar la tasa global de clasificacionescorrectas, la sensibilidad, la especificidad, el valor predictivo positivo, el valor predictivo negativo y el llamado índice de Youden (sensibilidad + especificidad - 1); mayores valores del índice de Youden denotarán una mejor capacidad predictiva.
Sin embargo, las tablas de clasificación y sus correspondientes índices son malos parámetros para comparar distintos modelos, pues sensibilidad y...
tracking img