distribuciones de probabilidad
• Probabilidad: Con una muestra aleatoria o
experimento aleatorio, la probabilidad que
una observación tome un valor en particular
es la proporción de veces que el resultado
ocurriría en una secuencia muy larga de
observaciones.
• Generalmente corresponde a la proporción
poblacional (y por lo tanto, cae entre 0 y 1) ya
sea para una población real o conceptual.Reglas básicas de probabilidad
Sean A, B posibles resultados
• P(no A) = 1 – P(A)
• Para A y B, posibles resultados distintos
P(A o B) = P(A) + P(B)
• P(A y B) = P(A)P(B dado A)
• Para resultados “independientes”
P(B dado A) = P(B), entonces
P(A y B) = P(A)P(B)
Datos de GSS 2006
Income
Above Aver.
Average
Below Aver.
Total
Happiness
Very Pretty Not too
--------------------272
294
49
454
835131
185
527
208
--------------------911
1656
388
Total
615
1420
920
2955
Sea A = average income, B = very happy
• P(A) estimada por 1420/2955 = 0.481 (“probabilidad marginal”),
P(no A) = 1 – P(A) = 0.519
• P(B dado A) estimada por 454/1420 = 0.320
(“probabilidad condicional ”)
• P(A y B) = P(A)P(B dado A) estimada por 0.481(0.320) = 0.154
(igual a 454/2955, “probabilidad conjunta”)
B1: unapersona selec. aleatoriamente es “very happy”
B2: segunda persona selec. aleatoriamente es “very
happy”
• P(B1), P(B2) estimada por 911/2955 = 0.308
• P(B1 y B2) = P(B1)P(B2) estimada por
(0.308)(0.308) = 0.095
• Si, por otro lado, B2 se refiere a la pareja de la persona
B1, B1 y B2 probablemente no son independientes y
esta fórmula no es apropiada
Distribución de probabilidad de una variable
• Listade los posibles resultados de una
“variable aleatoria” y sus probabilidades
• Variable discreta: asigna probabilidades P(y) a
valores individuales y, con
0 P( y ) 1, P( y ) 1
Ejemplo
• Selecciona una muestra aleatoria de 3 personas y
pregunta si están a favor (F) o en contra (C) de un
sistema de salud público
y = número a favor (0, 1, 2, ó 3)
• Para posibles muestras de tamaño n = 3,Muestra
(C, C, C)
(C, C, F)
(C, F, C)
(F, C, C)
y
0
1
1
1
Muestra
(C, F, F)
(F, C, F)
(F, F, C)
(F, F, F)
y
2
2
2
3
• Si la población está igualmente dividida entre F y C, estas
ocho muestras son igualmente posibles y la distribución
de probabilidad de la variable aleatoria y (el número a
favor) es
y
0
1
2
3
P(y)
1/8
3/8
3/8
1/8
• (Caso especial de la “distribución binomial”, en Cap. 6)
• Enla práctica, las distribuciones de probabilidad son
estimadas de datos muestrales y entonces tienen una
forma de distribuciones de frecuencias
Datos GSS
• Ejemplo: y = número de personas que conocen a
alguien que se haya suicidado en los últimos 12
meses (variable “suiknew”).
Distribución de probabilidad estimada es
y
0
1
2
3
P(y)
.895
.084
.015
.006
Media (valor esperado)
• Como lasdistribuciones de frecuencias,
distribuciones de probabilidad tienen medidas
descriptivas tales como media y desviación estándar
• Media (valor esperado)
E (Y ) yP( y )
• µ = 0(0.895) + 1(0.084) + 2(0.015) + 3 (0.006) = 0.13
representa un “resultado promedio de una secuencia
larga”
(media = moda = 0)
Desviación estándar
• Desviación estándar – medida de una distancia
“típica” de un resultado dela media, denotada
por
2
= ( y ) P ( y )
(No vamos a necesitar calcular esta fórmula)
• Si una distribución tiene aprox. forma de
campana, entonces:
– Toda o casi toda la distribución cae dentro del
intervalo µ - 3σ y µ + 3σ
– Probabilidad del 0.68 cae dentro de µ - σ y µ + σ
Ejemplo
• De un resultado más adelante en el capítulo, si n personas
son seleccionadas aleatoriamente deuna población con
proporción que favorece sistema de salud público (1- , se
oponen), entonces
y = número de personas en la muestra que está a favor, tiene
una distribución de probabilidad con forma de campana con
E ( y ) n , n (1 )
p. ej., con n = 1000, = 0.50, obtenemos µ = 500, σ = 16
• Casi toda la distribución cae entre
500 – 3(16) = 452 y 500 + 3(16) = 548
• Es decir,...
Regístrate para leer el documento completo.