Medidas de tendencia central
1
Medidas de Tendencia Central
La Media La media (o promedio) de una muestra x1, x2,…, xn de tamaño n de una variable o característica x, se define como la suma de todos los valores observados en la
1 n muestra, dividida por el número total de observaciones n, es decir, X = å X i . Por n i =1
ejemplo si los datos son x1 = 1, x2 =2, x3=3,entonces la media es 1/3(1+2+3)=2. La Mediana Dado un conjunto de n observaciones x1, x2,…, xn, de la variable o característica x, se define la mediana de este conjunto de valores, como aquel valor que no es superado ni supera a más de la mitad de las n observaciones, arregladas en orden de magnitud creciente o decreciente.
EYP2214 Estadística para Construcción Civil
2
Cálculo de la Mediana:Ordenar los datos en orden de magnitud creciente X (1) , X ( 2) ,..., X ( n ) , entonces la
mediana esta definida mediante la siguiente fórmula:
si n es impar ì X ( n +1) / 2 ï ï Me = í ï X ( n / 2) + X ( n / 2+1) si n es par ï î 2 En el ejemplo previo, la mediana Me=2.
Nota: En general, la mediana no se ve afectada por valores muy grandes o por
valores muy pequeños en los datos encomparación a la media. Por ejemplo, si x3= 40, la media es 1/3(1+2+40)=14.33, sin embargo la mediana es Me=2.
EYP2214 Estadística para Construcción Civil
3
La Moda
La moda de una muestra x1, x2,…, xn, es aquel valor de la variable que se presenta con mayor frecuencia; es decir es el valor que más se repite, y se denota por Mo.
Los Percentiles
Los percentiles son valores que dividen ala muestra ordenada en forma ascendente (o descendente) en 100 partes iguales, y se denotan por Pi , i = 1,2,...,99.
Cálculo de los Percentiles:
1. Se ordena los datos en forma ascendente (o descendente) X (1) , X ( 2) ,..., X ( n ) (ó X ( n ) , X ( n −1) ,..., X (1) ).
EYP2214 Estadística para Construcción Civil
4
2. Se determina el percentil de acuerdo a lo siguiente: * Si i (n + 1)es un entero, entonces Pi = X æ i (n +1) ö ç ÷ 100 100
è ø
* Si
i (n + 1) es fraccionario, hacemos una interpolación lineal entre los dos 100
valores correspondientes a las dos observaciones entre las cuales se encuentra la fracción.
Observación:
Para el caso en que i = 25,50,75, se denominan cuartiles, y cuando i = 10,20,...,90 , se denominan deciles.
EYP2214 Estadística paraConstrucción Civil
5
Medidas de Dispersión
La Varianza
La varianza de una muestra x1, x2,…, xn de una variable o característica x, se define como la media del cuadrado de las desviaciones de las observaciones con respecto al promedio de esos datos. La varianza muestral entonces queda definida como: 2 = 1 æ n X − X 2ö ç å ÷ S ç ÷ i n −1 i = 1 è ø Por ejemplo la varianza dex1=1,x2=2,xn=3, es 1/2[(1-2)2+(2-2)2+(3-2)2]=1.
(
)
EYP2214 Estadística para Construcción Civil
6
Un posible inconveniente para la interpretación de la varianza es que, por el efecto del cuadrado en la definición, no está expresada en las mismas unidades que los datos, sino en su cuadrado (por ejemplo, si los datos se toman en metros, la varianza se expresará en metros cuadrados). Como unamanera de eliminar este inconveniente, se define la desviación estándar.
Desviación Estándar
La desviación estándar se define por la raíz cuadrada positiva de la varianza.
S= ö 1 æ n ç å X − X 2÷ ÷ n − 1çi = 1 i è ø
(
)
La desviación estándar de x1=1,x2=2,xn=3, es
σ= 1 æ 2 2 2 ç (1− 2) + (2 − 2) + (3 − 2) ö = 1 = 1 . ÷ ø 3 −1 è
EYP2214 Estadística para Construcción Civil
7Rango
El rango se calcula como la diferencia entre el máximo valor y el mínimo valor presentes en el conjunto de datos: R = X máx − X mín .
Rango Intercuartil
El rango intercuartil es la longitud del intervalo donde está contenido el 50% central de los datos: RI = Q3 − Q1 o RI = P75 − P25 .
EYP2214 Estadística para Construcción Civil
8
Medidas de Tendencia Central (datos tabulados)...
Regístrate para leer el documento completo.