Estadística básica

Solo disponible en BuenasTareas
  • Páginas : 15 (3568 palabras )
  • Descarga(s) : 0
  • Publicado : 17 de marzo de 2011
Leer documento completo
Vista previa del texto
ESTADÍSTICA BÁSICA |
Muestreo e Inferencia |
|
|
|
LUIS MARTIN |
01/03/2011 |
|

CONCEPTOS PREVIOS

Población: grupo de individuos que se desea estudiar en orden a contestar una pregunta de investigación.
Muestra: selección de un número pequeño (en relación a la población) de individuos de la población para ser estudiados y usar la información para inferir conclusionesacerca de la población en su totalidad.
Sesgo (Bias): favoritismo sistemático en el proceso de recogida de datos.
Outliers: valores muy distintos (por exceso o por defecto) que no son típicos en el data set.
Estadístico: número que resume los datos recogidos en una muestra.
x=xin
Media (Mean):

Se ve afectada por los outliers.
Si nos referimos a la media de la población total, la notamosµ. Si a la muestra, x.
Mediana (Median): es el punto exacto de la distribución en el que hay igual número de datos por debajo que por encima de ese valor. No está influida por los outliers.
Cálculo de la mediana:
1) ordena los valores de menor a mayor
2) Si el data set cuenta con un número impar de datos, la mediana es exactamente el valor que está en el medio.
3) Si es par, se tomanlos dos valores del medio y se les saca la media.
Interpretación del centro: comparación de media y mediana: tanto la media como la mediana son medidas centrales de la distribución de datos. ¿Cómo interpretar esa centralidad? ¿qué implica el hecho de que media y mediana tengan valores distintos?
Si la distribución tiene outliers en el tramo inferior, el histograma será asimétrico hacia laizquierda (skewed to the left) y la media será inferior a la mediana.
Si tiene outliers en el tramo superior, el histograma será asimétrico a la derecha (skewed to the right) y la media será mayor que la mediana.

σ =(x-µ)2n
s=(x-x)2n-1
Desviación estándar (Standard deviation): utilizada para medir la variabilidad o desparrame entre los datos de un data set. En términos generales, es la distanciapromedio de los datos a la media del data set o distribución.

La desviación estándar o desviación típica se nota como σ cuando nos referimos al total de la población, y s cuando nos referimos a la muestra.
Regla empírica: aproximadamente el 68% de los datos están dentro del intervalo de una desviación estándar de la media (por encima o por debajo). Esto es, el 68% de los valores de ladistribución están comprendidos entre Media-SD y Media+SD. Aproximadamente el 95% de los datos están dentro del intervalo de dos desviaciones estándar de la media (por encima o por debajo). Esto es, el 95% de los valores de la distribución están comprendidos entre Media-2SD y Media+2SD. Y finalmente, aproximadamente el 99% de los datos están dentro del intervalo de tres desviaciones estándar de la media (porencima o por debajo). Esto es, el 99% de los valores de la distribución están comprendidos entre Media-3SD y Media+3SD.
Percentil (Percentile): Sirve para dar una idea de la posición relativa que ocupa un dato respecto al resto de datos de la distribución. El percentil de un determinado valor es igual al porcentaje de datos que están por debajo de ese valor. Por ejemplo, percentil 75 es el datopor debajo del cual se encuentra el 75% de todos los datos que conforman la distribución.
Cálculo del percentil: 1) Coloca los valores de menor a mayor. 2) Multiplica en formato decimal el % que sea por el total de valores, n. 3) Redondea el resultado al valor entero superior más cercano. 4) El valor que ocupa ese lugar es el percentil buscado.
Puntuación estándar (Standard Score): representa elnúmero de desviaciones estándar que un valor está por encima o por debajo de la media. Indica su posición relativa a grandes rasgos.
p.e.=(Valor-x )s

Distribución normal estándar: Si un data set tiene una distribución normal, y estandarizamos todos los datos según la fórmula anterior, esos valores estándar se llaman Z-valores y su distribución (que también será normal) se denomina...
tracking img