Estad stica Descriptiva
Representación de los datos de una muestra: tablas de
frecuencias, frecuencias relativas y frecuencias relativas
acumuladas.
Representación gráfica de dichas tablas: Histogramas y polígonos
de frecuencias. Analogías de estos polígonos con las funciones
de probabilidad según el concepto frecuentista de la
probabilidad: distribuciones empíricas de probabilidad.Medidas de tendencia central, de dispersión de la muestra, de
sesgo y aplanamiento de la muestra, cuando los datos de ella
están o no agrupados. Analogía de estas medidas con las
correspondientes a la función de probabilidad de la variable
aleatoria discreta.
Representación de los datos de una muestra. Como se ha mencionado,
la Estadística Descriptiva se encarga de la obtención, organización,representación y descripción de los datos.
La obtención de los datos se logra a través de las técnicas de muestreo,
conforme al diseño del experimento seleccionado.
Como se podrá observar más adelante, existen expresiones que
permiten trabajar con la totalidad de los datos de la muestra; al arreglo
que utiliza la totalidad de los datos se le conoce como datos no
agrupados.
Antes de la evolucióntecnológica o bien, cuando los recursos de
cómputo son limitados, trabajar con un número alto de datos resulta
complicado. Por tal motivo, se conformó un arreglo de datos basado en
intervalos conocido como tabla de frecuencias. Cuando se utiliza la
tabla de frecuencias se dice que se trabaja con datos agrupados.
Ahora bien, con el avance en los recursos de cómputo resulta ahora de
lo más sencillo trabajarcon datos no agrupados, lo que evita errores
numéricos y los propios ocasionados por el agrupamiento de los datos
en las tablas de frecuencia. No obstante, las tablas de frecuencias son
necesarias para construir las representaciones gráficas de las muestras.
Intervalos de clase. Se refiere a los intervalos en los cuales serán
agrupados los n datos obtenidos en el muestreo. Una tabla de
frecuenciasse compone de un número finito de intervalos continuos,
todos del mismo ancho. El número de intervalos es variable y su elección
depende de la experiencia de quién construye la tabla. No existe
consenso por parte de los autores para determinar el número óptimo de
intervalos, pero en lo general se coincide que no sean tan pocos que no
resulte apropiada la agrupación de datos ni tantos que la hagapoco
Estadística
Marzo 2003
VDPM
1
práctica. En general, se recomienda que el número de intervalos no sea
ni menor de cinco ni mayor a quince.
Por otra parte, ciertos autores han establecido algunas reglas
matemáticas para determinar el número de intervalos. Dos de ellas son:
Ley de Sturges: # intervalos = 1 + 3.322 Log (n)
# intervalos =
n
En ambos casos, n es el número total de datos.
Lo queresulta importante, más que determinar el número de intervalos,
es que estos cumplan con una serie de características:
1. Todos los intervalos deben tener el mismo ancho.
2. Un dato sólo puede pertenecer a un solo intervalo.
3. No debe haber intervalos vacíos.
Ilustremos lo anterior con un ejemplo.
Ejemplo. Los siguientes datos corresponden a 80 mediciones de la
longitud de un travesaño parte deun chasis. Sus dimensiones son en
centímetros.
50.1
50.6
50.7
51.1
52.0
50.8
51.4
49.9
51.8
51.3
50.6
49.1
51.4
51.8
51.3
51.5
51.0
50.9
50.3
51.2
51.1
51.8
51.9
50.3
51.1
51.1
51.7
50.2
50.5
51.6
50.8
51.0
50.4
51.5
50.8
51.2
50.1
51.5
51.7
51.9
52.2
50.8
51.7
51.7
49.4
50.3
52.1
51.0
51.7
51.9
51.9
51.8
51.0
50.3
50.3
51.3
51.0
50.2
50.4
51.6
51.2
51.1
49.5
49.9
51.1
51.7
52.8
49.6
49.653.1
52.0
49.7
52.0
49.7
51.2
51.8
51.1
51.3
51.2
51.8
El primer paso para construir los intervalos de clase consiste en ordenar
los datos de menor a mayor, sin eliminar ninguno de ellos.
49.1
49.4
49.5
49.6
49.6
49.7
49.7
49.9
49.9
50.1
Estadística
Marzo 2003
50.1
50.2
50.2
50.3
50.3
50.3
50.3
50.3
50.4
50.4
50.5
50.6
50.6
50.7
50.8
50.8
50.8
50.8
50.9
51.0
51.0
51.0
51.0
51.0
51.1
51.1...
Regístrate para leer el documento completo.