Modelos loglineales

Páginas: 5 (1024 palabras) Publicado: 25 de septiembre de 2013
Tarea de modelación de conteos
Parte I. Regresión Poisson
Parte II. Modelos loglineales

1- Comenta qué es el problema de sobredispersión ¿Por qué el uso de la distribución binomial negativa puede ayudar a resolver este problema?
Respuesta:
Si los datos Y1, Y2, ….., Yn son Poisson, entonces: E[Yi] = = Var[Yi]. Si en la práctica ocurre E[Yi] < Var[Yi], entonces hay un problema dedispersión. Entre sus posibles causas se encuentra las siguientes:
Puede atribuirse a que no se integran al modelo las variables explicativas que afectan los conteos.
Que existan excesos de ceros.
El uso de la distribución binomial negativo negativa resuelve el problema de dispersión, es decir, si suponemos que Y1, Y2, ….., Yn tienen una distribución binomial negativa, tal que:
E[Yi] = ;Var[Yi] = + D *2
Donde D es el parámetro de dispersión.
El problema de exceso de ceros, puede deberse a que existen fenómenos estadísticos que se entrecruzan: uno genera ceros, otro, los valores no nulos. Esto ocurre, por ejemplo, al tratar de modelar el número de cigarrillos fumados por cada uno de los integrantes de un grupo de personas, puede que alguno de ellos, simplemente, no sean fumadores.2- En la clase se hizo el ejercicio de modelar los conteos de los accidentes entre trenes y vehículos de carreteras del Reino Unido de 1975 a 2003. Ahora modela en función del tiempo de los conteos de accidentes entre trenes exclusivamente, estos son:
traicollisions = c(0, 1, 0, 1, 1, 0, 1, 2, 1, 2, 0, 1, 2, 1, 4, 2, 1, 2, 0, 5, 2, 2, 2, 2, 3, 2, 1, 2, 5)
y los millones de kilómetros recorridospor los tres años son:
trainkm = c(518, 516, 508, 503, 505, 487, 463, 437, 423, 415, 425, 430, 439, 431, 436, 443, 397, 414, 418, 389, 401, 372, 417, 430, 426, 430, 425, 426, 436)

Haz un análisis de regresión poisson, escribe detallada y claramente la fórmula del modelo que ajustas.
Call:
glm(formula = traincollisions ~ anio, family = poisson, offset = log(trainkm))

DevianceResiduals:

Min 1Q Median 3Q Max
1.90366 -0.51531 0.01297 0.23044 1.96364

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.84969 0.23514-20.625 < 2e-16 ***
anio -0.05914 0.01793 -3.299 0.000971 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Por tanto:

Calcula la devianza. Usando la distribución de la devianza ¿Qué dices acerca de si el modelo ajusta bien o no?
(Dispersion parameter for poisson family taken to be1)

Null deviance: 35.120 on 28 degrees of freedom
Residual deviance: 23.518 on 27 degrees of freedom
AIC: 87.488
P-value = 0.6568993

Number of Fisher Scoring iterations: 5


“Como se puede observar, el modelo tiene un buen ajuste, esto debe a dos factores: primero,la devianza de sus residuales tiende hacer igual a sus grados de libertad; y segundo, el P-Value del modelo es superior al , por tanto, el modelo tienen buen ajuste. Por otro lado, tanto su intercepto como la variable años son significativos en el modelo”

Calcula los residuales de la devianza ¿hay alguno muy grande?
RESIDUALES DE LA DEVIANZA
OBS
[,1]
[,2]
[,3]
1
0.774
0
-1.000
20.818
1
0.222
3
0.855
0
-1.000
4
0.898
1
0.114
5
0.957
1
0.045
6
0.979
0
-1.000
7
0.987
1
0.013
8
0.988
2
1.023
9
1.015
1
-0.015
10
1.057
2
0.893
11
1.148
0
-1.000
12
1.232
1
-0.188
13
1.335
2
0.499
14
1.390
1
-0.281
15
1.492
4
1.681
16
1.608
2
0.244
17
1.529
1
-0.346
18
1.692
2
0.182
19
1.812
0
-1.000
20
1.789
5
1.795
21...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Análisis Loglineal
  • LOS MODELOS DE LOS MODELOS
  • Modelado
  • Modelos
  • Modelos
  • Modelos
  • modelos
  • modelo

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS