Metodos de regresion

Solo disponible en BuenasTareas
  • Páginas : 15 (3709 palabras )
  • Descarga(s) : 4
  • Publicado : 14 de octubre de 2009
Leer documento completo
Vista previa del texto
Revista Colombiana de Estad´ ıstica Volumen 24 (2001) No 1, p´ginas 33 a 43 a

´ ´ COMPARACION DE TRES METODOS DE ´ REGRESION LINEAL USANDO ´ PROCEDIMIENTOS DE SIMULACION
JUAN C. TORRES C.*

Resumen Cuando desea ajustarse un modelo lineal a un conjunto de datos, el m´todo de regresi´n usualmente m´s empleado es el de m´ e o a ınimos cuadrados. Este m´todo es ´ptimo si la distribuci´n de losresiduos es gaussiana. e o o Existen casos en donde el supuesto de normalidad en los residuales no se cumple y se hace necesario el uso de m´todos alternativos de regree si´n, como la regresi´n v´ m´ o o ıa ınimas desviaciones absolutas (LAD) o la regresi´n no param´trica basada en rangos, los cuales no requieren de suo e puestos distribucionales sobre los residuos y permiten obtener una mejorestimaci´n de los par´metros del modelo de regresi´n. o a o Palabras clave: Modelo lineal; an´lisis de regresi´n; simulaci´n. a o o Abstract When it’s necessary to fit a lineal model to a data set, least squares regression method is usually used. This method is optimum if the residuals distribution is normal. When the assumption of residuals normality doesn’t comply it’s necessary to use alternativeregression methods, as Least absolute deviations (LAD) or Non parametric regression based on ranks, which don’t need the assumption about the residuals distribution and allow a better estimation of regression model parameters. Key words: Linear model, regression analysis, simulation.
* Estad´ ıstico egresado de la Universidad Nacional de Colombia y Consultor del Departamento AdministrativoNacional de Estad´ ıstica DANE. Correo electr´nico: jctoo rresc@dane.gov.co

33

34

Juan C. Torres C.

1.

Introducci´n o

El objetivo de este art´ ıculo es determinar cu´l de los tres m´todos de regrea e si´n: M´ o ınimo cuadr´tica, No param´trica basada en rangos o M´ a e ınima desviaci´n absoluta, presenta un mejor ajuste cuando la distribuci´n de los errores o o aleatorios tiene formadiferente de la gaussiana en elongaci´n y cuando hay o presencia de observaciones at´ ıpicas u “outliers”. Para cumplir con el objetivo, se calcularon estimaciones de los coeficientes del modelo de regresi´n y sus meo didas de ajuste para los tres m´todos de regresi´n mediante procedimientos de e o simulaci´n realizados con el paquete estad´ o ıstico SAS.

2.

Regresi´n M´ o ınimo Cuadr´tica aPara el modelo dado por la expresi´n Y = Xβ + e, el m´todo construo e ˆ ye el estimador β = (X X)−1 X Y , que minimiza la suma de cuadrados de los errores. Para un conjunto de datos observados, cuando la expresi´n o 2 f (b) = (Yi − xi b) se hace m´ ınima, el vector de valores b se conoce como la estimaci´n m´ o ınimo cuadr´tica de β. En la funci´n anterior xi representa la a o i-´sima fila de lamatriz X. Se estima la varianza de la poblaci´n de los errores e o con s2 = e2 /(n − p − 1), en donde los ei son los errores obtenidos con los i datos observados, n es el n´mero de observaciones realizadas y p es el n´mero u u de variables explicativas en el modelo.

3.

Regresi´n no Param´trica Basada en Rangos o e

El m´todo se basa en el modelo lineal Y = Xβ + e. No existen f´rmulas e oexpl´ ıcitas para el estimador β. Sin embargo, mediante un algoritmo iterativo es posible obtener el vector de estimaci´n de β. Para un conjunto de datos o observados, el vector β = [b0 b] se conoce como la estimaci´n no param´trica o e de β, en donde el vector b de tama˜o 1 × p, minimiza la funci´n n o g(b) = rango(yi − xi b) − n+1 (yi − xi b) 2

en donde b = [b1 , b2 , · · · , bp ] y xi = [xi1, xi2 , · · · xip ] y la estimaci´n no param´o e trica de b0 se obtiene como la mediana de las diferencias de yi − xi b. Ya que no existen f´rmulas expl´ o ıcitas para calcular los coeficientes estimados, Birkes y Dodge (1993) describen un algoritmo para estimarlos. De igual manera, los mismos autores describen un algoritmo para estimar la desviaci´n est´ndar de o a

Comparaci´n de tres...
tracking img