Apuntes Estadística
Grado en Ingeniería Industrial
Cristina Varela Roa
Grado en Ingeniería Eléctrica
Curso 2011/2012
Tema 1: Estadística Descriptiva
Conceptos:
•Cualitativa
Población: Es el conjunto de conceptos que voy a estudiar.
•Variable
Muestra: Es un subconjunto de la población.
•Cuantitativa
•Discreta
Individuo: Es cada uno de los elementos de la población.
•Continua
Tipos de variablesCualitativa
Χ= Color del Pelo
𝑥𝑖
Rubio
Moreno
Pelirrojo
Otro
𝑛𝑖
57
78
36
18
189
𝑓𝑖
0.30
0.41
0.19
0.10
𝑥𝑖
𝑛𝑖
𝑓𝑖
𝑁𝑖
𝐹𝑖
𝛼𝑖
𝛼𝑖
108
147.6
68.4
36
•Diagrama de rectángulos
Diferentes posibilidades de X
Cantidad de 𝑥𝑖
Porcentaje de cada 𝑥𝑖
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
Angulo que representa cada 𝑥𝑖
•Diagrama de sectores
100
10%
Rubio
30%
19%
50
MorenoPelirrojo
0
Rubio
Moreno
Pelirrojo
•Diagrama de Pareto
•Pictograma
100
100
50
50
0
0
Moreno
Otro
41%
Otro
Rubio
Cristina Varela Roa
Pelirrojo
Otro
Moreno
Rubio
Pelirrojo
Otro
Página 2
Cuantitativa
Discreta
𝑥𝑖
17
18
19
20
21
𝑛𝑖
33
44
66
55
77
275
𝑁𝑖
33
77
143
198
275
𝑓𝑖
0.12
0.16
0.24
0.2
0.28
1
Χ= Edad
𝐹𝑖
0.12
0.28
0.52
0.72
1
𝑥𝑖
𝑛𝑖
𝑓𝑖
𝑁𝑖
𝐹𝑖
•Diagrama de barras
Diferentesposibilidades de X
Cantidad de 𝑥𝑖
Porcentaje de cada 𝑥𝑖
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
•Polígono de frecuencias
100
100
50
50
0
0
Cuantitativa
Continua
𝐼𝑖
𝑥𝑖
𝑛𝑖
𝑓𝑖
𝑁𝑖
𝐹𝑖
𝑎𝑖
𝑑𝑖 =
[150-160]
]160-170]
]170-180]
]180-190]
]190-200]
155
165
175
185
195
5
8
10
12
8
43
0,11
0,19
0,23
0,28
0,19
1
5
13
23
35
43
0,11
0,30
0,53
0,81
1
10
10
10
10
10
2
0,8
11,2
0,8
X=Altura
•Histograma
𝑛𝑖
𝑎
𝐼𝑖
𝑥𝑖
𝑛𝑖
𝑓𝑖
𝑁𝑖
𝐹𝑖
𝑎𝑖
𝑑𝑖
Intervalo
Marca de Clase
Cantidad de 𝑥𝑖
Porcentaje de cada 𝑥𝑖
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
Amplitud del Intervalo
Densidad del Intervalo
•Polígono de frecuencias
100
100
50
50
0
0
Descripción Numérica de una Variable
Medidas de posición
La media
La media (𝑥 ) es un valor que se calcula con lasiguiente expresión,𝑥 =
𝑛 𝑖 𝑥𝑖
𝑁
=
𝑓𝑖 𝑥𝑖 , y es un valor
que puede representar por si solo a todo el conjunto.
La mediana
La Mediana (𝑀𝑒 ) es el valor que deja por debajo de él a el 50% de los datos, y por tanto también es
el que deja por encima al 50%.
Cristina Varela Roa
Página 3
La moda
La moda es el valor más frecuente de mis datos.
Cuantiles: deciles, cuartiles y percentiles.
Son valoresque dividen al conjunto en un determinado
número de partes iguales.
Los deciles (D) dividen al conjunto en 10 partes iguales, y
por lo tanto en cada parte encontramos un 10% de los datos
Los cuartiles (Q) dividen al conjunto en 4 partes iguales, y
por lo tanto en cada parte encontramos un 25% de los
datos
Los percentiles (P) dividen al conjunto en 100 partes
Explicación gráfica de los Cuartilesiguales, y por lo tanto en cada parte encontramos un 1% de
los datos.
Nota: La Mediana es el mismo valor que el cuartil 2 y que el percentil 50
Medidas de dispersión
Rango
El rango (R) es la diferencia entre el dato más alto y el más bajo. También es conocido como
recorrido
El Rango Intercuartílico (𝑅𝐼 = 𝑄3 − 𝑄1 ) soluciona el problema que presenta el rango cuando hay
algunos datos muy dispersos delresto.
Varianza y Desviación Típica
La Varianza (σ2 ) mide la desviación de los datos respecto a la media.
Se calcula con la siguiente expresión: σ2 =
(𝑥 𝑖 −𝑥 )2
𝑁
=
𝑥 𝑖 𝑛 𝑖2
𝑁
− 𝑥2
A la raíz cuadrada de la varianza se la conoce como desviación típica (σ)
Nota: Si en vez de dividir por N dividimos por N- 1, obtenemos la cuasivarianza (S) y la
cuasidesviación típica
Coeficiente devariación
El coeficiente de variación (CV), soluciona el problema que surge al comparar las varianzas de
distintos experimentos que estén en diferentes unidades. La calculamos de la siguiente forma:
𝐶𝑉 =
σ
|𝑥 |
Medidas de Forma
El Coeficiente de Fisher (𝛾) nos muestra numéricamente si la representación gráfica de nuestros
datos es simétrica o no.
Se calcula de la siguiente forma: 𝛾 =
𝑛 𝑖 (𝑥 𝑖 −𝑥 )3
𝑁𝜎...
Regístrate para leer el documento completo.