Probabilidad
Si tenemos la opción de poder agrupar los datos en intervalos, lo primero que debemos plantearnos (independientemente de lo que más arriba comentábamos) es la cuestiónde cuantos y cuales intervalos elegir.
Previamente daremos algunas definiciones. Si los intervalos o clases, como a veces se denominan, son:
[x 0 , x 1) , [x 1 , x 2) , ... , [x j-1 , x j) , ..., [x k-1 , x k]
llamaremos amplitud del intervalo j-ésimo a xj - xj-1, j=1,...,k, hablando de intervalos de amplitud constante o variable según tengan o no todos la misma amplitud.
Llamaremosextremos de la clase j-ésima a xj-1 y a xj, y por último, llamaremos centro o marca de clase correspondiente al intervalo j-ésimo al punto medio del intervalo, es decir, a cj= (xj + xj-1)/2.
A lo largode la página consideraremos que el dato xj pertenece al intervalo j+1, j=1, ..., k-1 , siendo el x k del k-ésimo. Hacemos notar también que el primer y último intervalo generalmente tienen,respectivamente, el extremo inferior y superior indeterminados con objeto de incluir observaciones poco frecuentes.
Respecto a la cuestión que nos planteábamos al comienzo de este apartado, podemos considerarcomo regla general la de construir, siempre que sea posible, intervalos de amplitud constante, sugiriendo sobre el número k de intervalos a considerar el propuesto por Sturges
k = 1 + 3'322 log 10n
siendo n el número total de datos.
Una vez determinado el número k de intervalos a considerar, y si es posible tomarlos de igual amplitud, esta será:
en donde x(n) es el dato mayor y x(1)el menor.
Ejemplo 1: "Niveles de Colinesterasa"
Se midieron los niveles de colinesterasa en un recuento de eritrocitos en μmol/min/ml de 34 agricultores expuestos a insecticidas agrícolas,obteniéndose los siguientes datos:
Individuo Nivel Individuo Nivel Individuo Nivel
1 10,6 13 12,2 25 11,8
2 12,5 14 10,8 26 12,7
3 11,1 15 16,5 27 11,4
4 9,2 16 15,0 28 9,3
5...
Regístrate para leer el documento completo.