Candidato a Doctor
Para la regresión lineal, la suma de cuadrados del error puro SSPE se calcula utilizando respuestas replicadas en el mismo nivel de X. Lasuma de cuadrados del error o residual se parte en un componente debido al error “puro” y un componente debido a la falta de ajuste o sea:
SSE = SSPE + SSLOF
Esto mismo podría extenderse a laregresión múltiple, donde el cálculo de SSPE requiere observaciones replicadas en Y con el mismo nivel de las variables regresoras X1, X2, ......, Xk, o sea que algunas de las filas de la matriz X deben serlas mismas. Sin embargo estas condiciones repetidas no son comunes y este método es poco usado.
Daniel y Wood han sugerido un método para obtener un estimado del error independiente del modelodonde no hay puntos repetidos exactos. El procedimiento busca puntos en el espacio X que son “vecinos cercanos” es decir observaciones que se han tomado con niveles cercanos de Xi1, Xi2, ..., Xik. Lasrespuestas Yi de tales “vecinos cercanos” pueden ser considerados como réplicas a usar para el cálculo del error puro. Como una medida de la distancia entre dos puntos Xi1, Xi2, ..., Xik y Xj1, Xj2,..., Xjk proponen el estadístico de suma de cuadrados ponderados de la distancia como:
(3.69)
Los pares de puntos que tienen esta distancia pequeña son vecinos cercanos sobre los cuales sepuede calcular el error puro, y los que generan están ampliamente separados en el espacio X.
El estimado del error puro se obtiene del rango de los residuos en el punto i e i’, como sigue:(3.70)
Hay una relación entre el el rango de una muestra de una distribución normal y la desviación estándar de la población. Para muestras de tamaño 2, la relación es:
Estadesviación estándar corresponde al error puro.
Un algoritmo para calcular la desviación estándar estimada es como sigue:
1. Arreglar los conjuntos de datos de puntos X’s en orden ascendente de Yi-est....
Regístrate para leer el documento completo.