Regresion Lineal
SANTIAGO BETANCUR RAIGOZA - 94012609846
JILBER IBICA OVEJERO - 1116863475
ALEXIS VARGAS MUÑOZ - 1128470829
PROFESOR
CARLOS MARIO LOPERA
UNIVERSIDAD NACIONAL DE COLOMBIA
SEDE MEDELLIN
FACULTAD DE CIENCIAS
ESTADISTICA II
2012
REGRESION LINEAL MULTIPLE
Objetivo: Usar de manera eficiente las herramientas del análisis de regresión para resolver unproblema práctico.
Presentación del problema. En un estudio a gran escala realizado en EE.UU sobre el número total de crímenes serios ocurridos en áreas metropolitanas se recogió información en 141 de estas áreas, durante los años 1976 y 1977. A continuación se analizará una muestra aleatoria de tamaño 60 de esa base:
Abreviatura y Nombre de la variable | | Descripción |
ID: Número deidentificación | | Número de Identificación de cada observación (hospital) |
Y: Total de crímenes serios | | Número total de crímenes serios en 1977 reportados por las agencias de la ley (en miles) |
X1: Área territorial | | En millas cuadradas (en cientos) |
X2: Población total | | Población estimada de 1977 (en cientos de miles) |
X3: Porcentaje poblacional en ciudadescentrales | | Porcentaje de la población de 1976 en la(s) ciudad(es) central(es) |
X4: Porcentaje poblacional de adultos mayores | | Porcentaje de la población de 1976 de 65 años o más |
X5: Número de médicos activos | | Número de médicos profesionalmente activos a diciembre de 1977 (en miles) |
X6: Número de camas de hospital | | Número de camas y camillas durante 1977 (en miles) |X7: Porcentaje de graduados de bachillerato | | Porcentaje de población adulta (25 años o más) que completó el bachillerato |
X8: Fuerza civil laboral | | Número total de personas de 16 años o más empleadas o buscando trabajo en 1977 (en cientos de miles) |
X9: Ingreso total personal | | Ingreso total recibido en 1976 por personal de cualquier fuente (en cientos de millones dedólares) |
1. Estime un modelo de regresión lineal múltiple que explique el número total de crímenes serios en términos de las variables predictoras X1 a X9. Analice la significancia del modelo y de los parámetros. Comente los resultados.
n=60 ; K= 9 ; P=K+1=10
Variable respuesta
Y: Total de crímenes serios
Variables predictoras o regresoras
X1: Área territorialX2: Población total
X3: Porcentaje poblacional en ciudades centrales
X4: Porcentaje poblacional de adultos mayores
X5: Número de médicos activos
X6: Número de camas de hospital
X7: Porcentaje de graduados de bachillerato
X8: Fuerza civil laboral
X9: Ingreso total de personas
Planteamiento del modelo:
Yi=β0+ β1Xi,1+β2Xi,2+β3Xi,3+β4Xi,4+β5Xi,5+β6Xi,6+ β7Xi,7+β8Xi,8+β9Xi,9+εi ;i=1, 2, 3,…, 60
O en forma matricial podemos plantear el modelo como:
Ynx1=χnxpβpx1+εnx1 ;
Y= Y1Y2⋮Y60 ; β=β0β1⋮β60 ; ε=ε1ε2⋮ε60
Los supuestos de dicho modelo son:
εi~iidN0,σ2 ; ∀i=1, 2,…, 60
Ó
ε~iidN60(060x1, σ2I60) ; ∀i=1, 2,…, 60
Ecuación ajustada del modelo
Yi=β0+β1Xi,1+β2Xi,2+β3Xi,3+β4Xi,4+β5Xi,5+β6Xi,6+ β7Xi,7+β8Xi,8+β9Xi,9Se obtuvieron las siguientes salidas de SAS:
* Tabla 1.1. Tabla Anova
Análisis de la varianza Suma de CuadradoFuente DF cuadrados de la media F-Valor Pr > FModel 9 470766 52307 374.85 <.0001Error 50 6977.05748 139.54115Total corregido 59 477743RaízMSE 11.81275 R-cuadrado 0.9854Media dependiente 61.84847 Adj R-Sq 0.9828Var Coef 19.09951 |
* Tabla 1.2. Estimación de parámetros.
Estimadores de parámetrosEstimador del ErrorVariable DF parámetro estándar Valor t Pr > |t|Intercept 1 -21.72154 15.20035 -1.43 0.1592X1...
Regístrate para leer el documento completo.