macro
Construcción de los intervalos de clases
De la tabla anterior, es la primera columna de la que poco hemos hablado de su construcción. Debemos resolver dos interrogantes: ¿cómo formamos estas clases? y ¿cuántas clases formamos?
Para la formación de las clases, en general, deberán seguirse los siguientes criterios en función del tipo de variable que estaremos usando:
a) Cuando estemostrabajando con variables cualitativas se considerará que los propios valores nominales o cualitativos serán las propias clases.
b) En el caso de variables cuantitativas: Si la variable es discreta y finita, de tamaño pequeño, entonces cada observación en sí será una propia clase. Ahora si el tamaño de los resultados discretos es muy grande o infinito las clases se constituirán por subconjuntos notraslapados y exhaustivos. Y finalmente si la variable es continua, entonces las clases serán intervalos de recta real.
RANGO (R)
Vamos a estudiar entonces el caso de datos cuantitativos de tipo continuo. Supongamos que tenemos las siguientes observaciones, donde ellas, a pesar del subíndice, no están ordenadas de menor a mayor. Pues bien, lo que tenemos que hacer es encontrar el menor valor y elmayor valor. Para comodidad en la explicación que viene a continuación, denotemos estos valores, respectivamente por
Ahora hagamos la diferencia entre estos dos valores y llamemos a su resultado rango, y lo denotamos por la letra R.
Este valor indicará la longitud de la recta real donde se ubicarán todas las observaciones. De modo que esta longitud la vamos a dividir en "pequeños intervalos"que no se traslapen. Estos "pequeños intervalos" deberán tener igual longitud de tal manera que la suma de sus longitudes sea igual al rango R.
NÚMERO DE CLASES (C)
Cuando se trabaja con distribuciones de frecuencias uno de los problemas es la determinación del número apropiado de clases. Aunque no existe una regla precisa para el número de clases, generalmente tratamos de no tener ni muchasni muy pocas en la distribución de frecuencias. El uso de demasiadas clases tiende a producir irregularidades en las frecuencias de las clases y obscurece la concentración de valores. Por el contrario, si usamos un número excesivamente pequeño de clases, estas tienden a resumir y cierta información valiosa se pierde en el proceso. En la práctica, trataremos de no tener una distribución defrecuencias con menos de 5 y más de 15 clases. Según este criterio general, elijamos un número C entre 4 y 20 (por lo general se considera C = 8).
Para determinar el número aproximado de clases, se puede hacer uso de la Regla de Sturges:
C = 1 + 3,3 log N
C= numero de clases,
N= numero total de observaciones de la muestra (datos),
log= logaritmo común base 10.
Se debe dejar en claro que la Regla deSturges es una aproximación del numero de clases, siempre es posible tomar una mas o una menos de lo que la formula nos da.
Por ejemplo, si tenemos 142 observaciones N = 142, tenemos entonces C = 1 + 3,3 · log 142 = 8
Con los dicho anteriormente podemos tomar 7, u 8 o 9 clases, sin problemas.
Otro ejemplo, con N=40, tenemos C = 1 + 3,3 log 40 = 6,29
El sentido común acepta de buen agrado 6, 7 o8 clases.
El uso de esta formula puede dar resultados irrazonables cuando el numero de observaciones es muy grande o muy pequeño. Por esta razón la Regla de Sturges no es un sustituto del buen juicio.
También hay otros autores que toman como sugerencia para hallar el número de clases log N o raíz cuadrad de N con “N” numero de datos.
AMPLITUD DE CLASE (A)
Si elegimos construir k intervalos deigual longitud, la suma de la longitud de estos intervalos debe resultar R, y si llamamos A a la amplitud o longitud de estos intervalos entonces deberá ocurrir necesariamente que R= A. C por lo tanto la amplitud de cada intervalo es A = R/C. La construcción de estos C intervalos de amplitud A es en extremo sencillo. Para asegurarnos que no se pasen en los puntos extremos donde se contactan...
Regístrate para leer el documento completo.