Models count data.

Solo disponible en BuenasTareas
  • Páginas : 16 (3849 palabras )
  • Descarga(s) : 0
  • Publicado : 28 de noviembre de 2011
Leer documento completo
Vista previa del texto
Prova d’avaluació continuada 3. Models Count Data.

Problema 1. Es vol estimar un model que relacioni el fet que una persona sigui arrestada als Estats Units (variable NARR86) en funció d’una sèrie de característiques. Per això, es disposa (en el fitxer 01518_PAC3.xls) d’informació relativa a una mostra de 2725 individus de les següents variables:

NARR86: variable dicotòmica que recull sil’individu ha estat arrestat en l’any 1986 (NARR86=1 si ha estat arrestat i 0 si no ho ha estat)
PTIME86: nombre de mesos que l’individu ha estat prèviament en presó des del 18 anys
INC86: ingressos legals (en milers de dòlars) de l’individu l’any 1986

A partir d’aquesta informació, es vol analitzar en quina mesura el nombre de mesos que ha estat en presó des dels 18 anys (PTIME86) i els seusingressos legals l’any 1986 (INC86) expliquen la probabilitat de que aquest individu hagi estat arrestat l’any 1986. Per fer-ho, es demana:

a. Estimeu un model de probabilitat lineal per tal d’explicar la probabilitat de que un individu sigui arrestat o no en funció dels determinants anteriorment esmentats. Interpreteu els resultats de l’estimació tot analitzant els següents punts:significació individual dels coeficients, valor dels coeficients, signe dels coeficients i bondat de l’ajust. En el cas de la bondat de l’ajust, considereu els següents indicadors: el coeficient de determinació R2 i el contrast de significació conjunta de la F.

Per a calcular el model de probabilitat lineal amb Minitab, he seguit els següents passos;

Estadísticas Regresión RegresiónEl resultat ha estat el següent;

Análisis de regresión: narr86 vs. ptime86; inc86

La ecuación de regresión es
narr86 = 0,359 - 0,0206 ptime86 - 0,00134 inc86

Predictor Coef SE Coef T P
Constante 0,35895 0,01124 31,93 0,000
ptime86 -0,020607 0,004362 -4,72 0,000
inc86 -0,0013446 0,0001277 -10,53 0,000

S = 0,438208 R-cuad. = 4,2%R-cuad.(ajustado) = 4,2%

Análisis de varianza

Fuente GL SC CM F P
Regresión 2 23,122 11,561 60,20 0,000
Error residual 2722 522,695 0,192
Total 2724 545,817

Fuente GL SC Sec.
ptime86 1 1,820
inc86 1 21,302

Significació individual dels coeficients

El que hem d’observar primer és si per a un nivell deconfiança del 95%, el p valor associat és major o menor que 0,05 (nivel de significancia) com podem observar en el nostre cas, els p valors associats a les variables PTIME86 i INC86 són menors que 0,0005 (redondeando 0,000) i per tant, podem rebutjar la hipòtesis nul.la de que els coeficients d’aquestes variables són 0 nulos, es a dir que són variables que resultan significatives a l’hora depredir la variable de resposta NARR86.

Nota: Los resultados de los contrastes de significación individual no son del todo fiables, puesto que el termino de perturbación u del modelo de probabilidad lineal no sigue una distribución normal.

Valor dels coeficients

Els coeficients en el nostre cas, Ens indiquen el canvi que experimenta la probabilitat prevista que un individu siguiarrestat en el año 1986 quan s’incrementa en una unitat la variable que acompanya el coeficient sempre que la resta de variables no canviïn. Com podem veure als resultats, un increment d’una unitat de un mes de arresto de PTIME86 sempre que los ingresos legales no varien INC86 sigui constant, fa que la probabilitat d’arrestar un individu disminueixi un 2,0607% i un increment de 1000 dolares en losingresos legales en una un unitat de INC86 sempre que el tiempo de arresto no varie PTIME88 sigui constant, fa que la probabilitat d’arrest d’un individu també disminueixi un 0,13446%.

Signe dels coeficients

Observem que el signe del coeficient de les dues variables: PTIME86 i INC86, és negatiu, per tant, tanto los meses de prisión y los ingresos legales aquestes desfavoreixen la...
tracking img