Xxxxxxxxxxxxxxxxx
Imagen popular de la estadística: "Existen medias mentiras, mentiras y estadísticas". Dos significados: (1) Colección de datos numéricos (una estadística). (2) Ciencia: obtener regularidades de fenómenos de masas (la estadística).
"Más del 75% de los americanos blancos son propietarios de su casa y menos del 50% de los hispanos y afroamericanos no son propietarios de su casa.Aquí hay un abismo, el abismo de la propiedad de la casa". George W. Bush, Cleveland, 1 de julio de 2002 1 www.bushisms.com
La estadística surgió como una necesidad del estado: el censo y su descripción política, geográfica y económica. En el siglo XVII y XVIII nace la probabilidad aplicada a los juegos de azar que ejerce una fuerte influencia sobre la estadística. En el XIX empieza a aplicarsea cuestiones sociales. Y actualmente se aplica a la historia, psicología, pedagogía, ingeniería, biología, economía, periodismo, política, medicina...
2
Definición de Estadística
La Estadística es la ciencia de la
• sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de• deducir las leyes que rigen esos fenómenos
• y poder hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
3
Método científico y estadística
Plantear hipótesis
Diseñar experimento
Obtener conclusiones
Recoger datos y analizarlos
4
Pasos en un estudio estadístico
• Plantear hipótesis sobre una población:
• Los fumadores tienen “más bajas”laborales que los no fumadores. • ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?
• Decidir qué datos recoger (diseño de experimentos)
– Qué individuos pertenecerán al estudio (muestras).
• Fumadores y no fumadores en edad laboral. • Criterios de exclusión: ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas?
– Qué datos recoger de los mismos (variables).
• Número de bajas. •Tiempo de duración de cada baja. • ¿Sexo? ¿Sector laboral? ¿Otros factores?
5
Pasos en un estudio estadístico (y 2)
• Recoger los datos (muestreo):
– ¿Estratificado? ¿Sistemáticamente?
• Describir (resumir) los datos obtenidos:
• Tiempo medio de baja en fumadores y no fumadores (estadísticos) • % de bajas por fumadores y sexo (frecuencias), gráficos,...
• Realizar una inferencia sobre lapoblación:
• Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.
• Cuantificar la confianza en la inferencia:
– Nivel de confianza del 95% – Significación del contraste: p = 2%
6
Población y muestra
• Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). – Normalmente es demasiado grande parapoder abarcarlo.
• Muestra („sample’) es un subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) – Debería ser “representativo” – Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales).
7
Variables
• Una variable es una característica observable que varía entre los diferentes individuosde una población. La información que disponemos de cada individuo es resumida en variables.
• En los individuos de la población española, de uno a otro es variable:
– El grupo sanguíneo
• {A, B, AB, O} Var. Cualitativa
– Su nivel de felicidad “declarado”
• {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal
– El número de hijos
• {0,1,2,3,...} Var. Numérica discreta
– La altura• {1,62 ; 1,74; ...} Var. Numérica continua
8
• Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. • Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos.
– Sexo (Cualit: Códigos arbitrarios)
• 1 = Hombre • 2 = Mujer
– Raza (Cualit: Códigos arbitrarios)
• 1 =...
Regístrate para leer el documento completo.