Primeros pasos de la estadistica (resumen)
Es la disciplina que se ocupa del conjunto de métodos utilizados en la obtención, organización y análisis de datos, tanto para la deducción de conclusiones como para la toma de decisiones.
Variables
Variable: cada una de las características que se desea conocer de una población y que tiene la condición de variar.
Tipos de variables:
□ Cualitativa (o Atributo):Produce una respuesta que atiende a una cualidad. Sus valores (modalidades) no se pueden asociar a un número.
Nominales: Sus valores no se pueden ordenar. Sexo, Grupo Sanguíneo, Religión, Nacionalidad.
Ordinales: Sus valores se pueden ordenar. Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor.
□ Cuantitativa: Sus valores son numéricos (tiene sentido operar algebraicamentecon ellos). Discretas: Si toma valores enteros. Número de hijos, Número de cigarrillos, Número de goles
Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presión arterial, peso.
Pasos en un estudio estadistico
□ Plantear hipótesis sobre una población: Los fumadores tienen “más bajas” laborales que los no fumadores. ¿En qué sentido? ¿Mayor número?¿Tiempo medio?
□ Decidir qué datos recoger (diseño de experimentos)
□ Qué individuos pertenecerán al estudio (muestras). Fumadores y no fumadores en edad laboral.
□ Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas?
□ Qué datos recoger de los mismos (variables). Número de bajas,Tiempo de duración de cada baja, ¿Sexo? ¿Sector laboral? ¿Otrosfactores?
□ Recoger los datos (muestreo) ¿Estratificado? ¿Sistemáticamente?
□ Describir (resumir) los datos obtenidos: tiempo medio de baja en fumadores y no (estadísticos) % de bajas por fumadores y sexo (frecuencias), gráficos,...
□ Realizar una inferencia sobre la población. Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.
□ Cuantificar laconfianza en la inferencia Nivel de confianza del 95%. Significación del contraste: p=2%
Modalidades
← Los posibles valores de una variable suelen denominarse modalidades.
← Las modalidades pueden agruparse en clases (intervalos)
› Edades:
← Menos de 20 años, de 20 a 50 años, más de 50 años
› Hijos:
← Menos de 3 hijos, De 3 a 5, 6 omás hijos
← Las modalidades/clases deben forman un sistema exhaustivo y excluyente
› Exhaustivo: No podemos olvidar ningún posible valor de la variable
← Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
← Bien: ¿Cuál es su grupo sanguíneo?
› Excluyente: Nadie puede presentar dos valores
simultáneos de la variable← Estudio sobre el ocio
← Mal: De los siguientes, qué le gusta: (deporte, cine)
← Bien: Le gusta el deporte: (Sí, No)
← Bien: Le gusta el cine: (Sí, No)
← Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
Definición del tamaño muestral
La definición del tamaño muestral depende delos siguientes factores:
□ Los objetivos del estudio.
□ Los conocimientos previos sobre el comportamiento de la característica en la población.
□ Los recursos técnicos y financieros para obtener la información.
□ El error máximo que se permitirá el analista.
□ La confiabilidad de la inferencia esperada por el analista.
Muestras representativas
Una muestra representativaes una muestra que recoge todas las características relevantes de la población.
El método de muestreo seleccionado y el tamaño de la muestra determinan su representatividad.
Muestreo probabilistico
Son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y,...
Regístrate para leer el documento completo.