Medidas descriptivas de los datos

Solo disponible en BuenasTareas
  • Páginas : 6 (1423 palabras )
  • Descarga(s) : 0
  • Publicado : 14 de mayo de 2011
Leer documento completo
Vista previa del texto
1.3 Medidas descriptivas de los datos
Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la información contenida en ella.
El estudio de una variable estadística comienza con la obtención de datos, bien sondeando la población o tomando una muestra. El siguiente paso en el proceso es la ordenación de datos elaborando la tabla correspondiente. Trabajar con una tabla es complejo y tedioso por lo que es más conveniente la introducción de nuevos parámetros que nos permitan resumir la información que contienen esas tablas.
El objetivio que se persigue es la sintetización de la información que nos aportan los datos con la menor pérdida posible. Vamos a agrupar los parámetros en tres grupos dependiendo de su función.
▪ Medidas decentralización.
Con ellas pretendemos condensar los distintos valores de la variable en uno sólo que los resuma.

▪ Medidas de posición.
Una vez ordenados los datos de menor a mayor será necesario identificar la posición de los valores.

▪ Medidas de dispersión.
Las medidas de centralización nos condensan los datos en uno sólo pero no nos aportan información ninguna sobre laconcentración o dispersión de los datos, habrá pues que introducir medidas que palien esta carencia.

1.3.1  Medidas de tendencia central o de localización
La medida más evidente que podemos calcular para describir un conjunto de observaciones numéricas es su valor medio. La media no es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que sedispone.
Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La media de edad de estos sujetos será de:
[pic]
Más formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la variable en cuestión, el valor medio vendrá dado por:
[pic]
Otra medida de tendencia central que se utiliza habitualmente es la mediana. Es laobservación equidistante de los extremos.
La mediana del ejemplo anterior sería el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en elmedio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.
Si la media y la mediana son iguales, la distribución de la variable es simétrica. La media es muy sensible a la variación de las puntuaciones. Sin embargo, la mediana es menos sensible a dichos cambios.
Por último, otra medida de tendencia central, no tan usual comolas anteriores, es la moda, siendo éste el valor de la variable que presenta una mayor frecuencia.
En el ejemplo anterior el valor que más se repite es 60, que es la moda

1.3.2  Medidas de dispersión o escala
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersión de los mismos. Existen distintas formas de cuantificar esa variabilidad. Detodas ellas, la varianza (S2) de los datos es la más utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.
[pic]
Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.En el ejemplo anterior la varianza sería:
|Sx2= |[pic] |

La desviación típica (S) es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable.
La desviación típica es la medida de dispersión más utilizada en estadística.
[pic]
Aunque esta...
tracking img