1 ESTADISTICA DESCRIPTIVA
Prof. María B. Pintarelli
ESTADISTICA
1- Estadística Descriptiva
1. 1 – Introducción
El campo de la estadística tiene que ver con la recopilación, organización, análisis y uso
de datos para tomar decisiones razonables basadas en tal análisis.
Al recoger datos relativos a las características de un grupo de individuos u objetos, sean
alturas y pesos de estudiantes de unauniversidad o tuercas defectuosas producidas por
una fábrica, suele ser imposible o poco práctico observar todo el grupo, en especial si es
muy grande. En vez de examinar el grupo entero, llamado población o universo, se examina una pequeña parte del grupo, llamada muestra.
En muchos problemas estadísticos es necesario utilizar una muestra de observaciones
tomadas de la población de interés conobjeto de obtener conclusiones sobre ella. A
continuación se presenta la definición de algunos términos
Una población está formada por la totalidad de las observaciones en las cuales se
tiene cierto interés.
Una muestra es un subconjunto de observaciones seleccionada de una población
Si una muestra es representativa de una población, es posible inferir importantes conclusiones sobre la población apartir del análisis de la muestra. La parte de la estadística
que trata sobre las condiciones bajo las cuales tal inferencia es válida se llama estadística inductiva o inferencia estadística. Ya que dicha inferencia no es del todo exacta, el
lenguaje de las probabilidades aparecerá al establecer nuestras conclusiones.
La parte de la estadística que estudia la muestra sin inferir alguna conclusiónsobre la
población es la estadística descriptiva.
En particular la estadística descriptiva trata sobre los métodos para recolectar, organizar
y resumir datos.
La estadística descriptiva puede a su vez dividirse en dos grandes áreas: métodos gráficos y métodos numéricos.
En lo referente a la notación, n representa el número de observaciones en un conjunto
de datos, las observaciones estánrepresentadas por una variable con subíndice (por
ejemplo x1, x2, …, xn). Así la representación de los cinco valores, n = 5, de la velocidad
de un chip de computadora en MHz medida por un ingeniero, será: x1 = 481.5, x2 =
493.7 , x3 = 471.8, x4 = 486.4, x5 = 496.2,
1.2 – Distribución de frecuencias e histogramas
Supongamos que los siguientes datos representan la vida de 40 baterías para automóvil
similares,registradas al décimo de año más cercano. Las baterías se garantizan por tres
años.
1
Estadística Descriptiva
2.2
2.5
4.7
4.1
4.3
3.8
3.5
3.4
3.2
4.5
3.6
2.6
Prof. María B. Pintarelli
3.2
2.9
3.9
3.7
3.3
3.0
3.0
3.9
4.2
2.6
3.1
3.5
3.4
3.3
1.6
3.1
3.1
3.7
3.3
4.4
3.8
3.2
3.1
4.1
4.7
1.9
3.7
3.4
Para organizar los datos buscamos el mínimo y el máximo de la muestra, en este casoel
mínimo es 1.6 y el máximo es 4.7
Elegimos un intervalo (a, b) que contenga todos los datos, por ejemplo a = 1.5 y b = 5.0.
Dividimos el intervalo (a, b) en subintervalos que pueden ser de igual longitud, pero no
necesariamente, y contamos cuántas observaciones caen en cada subintervalo, esa será
la frecuencia del intervalo. Para esto debemos decidir cuántos subintervalos utilizaremos. Engeneral se puede usar la regla de tomar aproximadamente n subintervalos.
Los subintervalos se llaman intervalos de clase o simplemente clases. Resulta satisfactorio utilizar no menos de 5 clases ni más de 20.
En el ejemplo 40 ≈ 6 , entonces 6 o 7 clases será una elección satisfactoria.
Como b − a = 5.0 − 1.5 = 3.5 , si tomamos r = 7 clases entonces la longitud de cada una
sería b − a = 0.5 .
rConstruimos una tabla de frecuencias de manera tal que, por ejemplo, en el intervalo
(1.5 , 2.0) están las observaciones mayores a 1.5 y menores o iguales que 2.0.
Los extremos de los intervalos de clase son los límites de clase inferior y superior.
( )
Intervalo
de clase
Marca
de clase
Frecuencia f
Frecuencia
relativa
Frecuencia
acumulada
1.5 – 2.0
2.0 – 2.5
2.5 – 3.0
3.0 – 3.5
3.5 – 4.0
4.0 –...
Regístrate para leer el documento completo.