Estadistica
Ejemplo: Como parte de un proyecto de mejora ambiental en el campus en el que proponemos la eliminaci´n de la circulaci´n de veh´ o o ıculos, queremosincluir un estudio sobre la opini´n de las personas vinculadas a la universidad. o ¿Cu´nta gente est´ a favor de prohibir la entrada de coches en el campus? a a ¿C´mo definimos la poblaci´n? o o 1. Todos los estudiantes matriculados durante este curso en los tres ciclos 2. Todo el personal de administraci´n y servicios (incluidos los dependientes o de alguna contrata) con un contrato de seis mesescomo m´ ınimo 3. Todos los profesores a tiempo completo.
Suponemos que en cada elemento de la poblaci´n se ha definido una o variable aleatoria, y queremos conocer su distribuci´n entre los o elementos de la poblaci´n. o Puede ocurrir: 1. La distribuci´n la conocemos por estudios anteriores o viene o prefijada por la forma de recoger la informaci´n. o 2. La forma de la distribuci´n la conocemospero depende de los o valores que toman algunos par´metros (caracter´ a ısticas que sirven para determinarla) 3. No tenemos ni idea de como se distribuye la probabilidad.
¿Podemos estudiar la variable en toda la poblaci´n? o SI =⇒ hacemos un CENSO, que es un estudio exhaustivo en todos los elementos de la poblaci´n o NO =⇒ cogemos una MUESTRA, que es un conjunto representativo de elementos dela poblaci´n o Cuando la muestra est´ bien escogida podemos obtener una infora maci´n similar a la del censo con mayor rapidez y menor coste. o
An´lisis de poblaciones grandes por muestreo a N n
≡ ≡
tama˜o de la poblaci´n n o n´mero de elementos que forman la muestra u
≡
n/N N/n
Fracci´n de muestro (proporci´n de la poblaci´n representada en o o o la muestra) Factor de elevaci´n(unidades en la poblaci´n por cada elemento o o en la muestra)
≡
ESTIMADOR: valor que puede calcularse a partir de los datos de la muestra y que proporciona informaci´n sobre el valor del par´metro o a ´ Importante: ¿c´mo es su PRECISION? o
En el ejemplo: Para cada individuo de los N que hay en la poblaci´n definimos o Xi = 1 si la persona i-´sima est´ a favor e a 0 si est´ en contra a Xi ∼Bernoulli(p)
El par´metro p es la proporci´n de personas a favor =⇒ ¿Cu´nto vale p? a o a ¿Censo o muestra? Elegimos una muestra de n personas =⇒ X1 , . . . , Xn v.a.i.i.d. Bernoulli(p) X ≡ n´mero de personas a favor entre las n, u X=
n i=1 Xi
∼ Bin(n, p)
N´mero esperado de respuestas positivas es E(X) = np u Estimamos p como la proporci´n de respuestas positivas en la muestra o
¿C´moelegimos la muestra para que sea representativa de toda la poblaci´n? o o
Sesgos de muestreo El riesgo principal de un procedimiento de muestreo es obtener una MUESTRA SESGADA, que significa que no es representativa de la poblaci´n o 1. Sesgo de selecci´n: algunos miembros de la poblaci´n tienen una o o probabilidad m´s alta que otros de estar representados en la muestra a
En el ejemplo: sis´lo preguntamos a las personas que salen de la estaci´n o o de tren a primera hora ⇒ MUESTRA SESGADA
Soluci´n: Dise˜ar la muestra con un procedimiento objetivo que garano n tice la representaci´n de todos los individuos de la poblaci´n . . . o o 2. Sesgo por no respuesta: una parte de la poblaci´n no esta represeno tada porque no proporciona respuesta
En el ejemplo: si enviamos uncuestionario, puede que no contesten los que no tienen coche propio por sentirse poco afectados ⇒ MUESTRA SESGADA
Soluci´n: no siempre se puede evitar, pero al menos se debe controlar o (incluir preguntas tipo “¿tienes coche propio . . . ?”)
Muestreo aleatorio simple (m.a.s.) Diremos que hemos extra´ una muestra aleatoria simple cuando ıdo su proceso de extracci´n garantice: o 1. Cada elemento de...
Regístrate para leer el documento completo.