Tareea
Una simple lista de un conjunto grande de datos (variables continuas) no manifiesta información suficiente a un lector. Algunas veces se desea condensar los datos en una forma más manejable. Esto puede lograrse con la ayuda de una “ distribución de frecuencias”. Para analizar este caso debemos cumplir con una serie de etapas que llevan a laformación de tablas y gráficos condensadores de información. Estas etapas serán explicadas en función del siguiente Planteamiento: En E.U.A., se desarrollan casi 145 000 casos de cáncer colorrectal cada año. Para enfermedad avanzada o metastásica, las únicas opciones son cirugía paliativa o quimioterapia, debido a que la radioterapia no se emplea por lo general en abdomen. Las tasas desupervivencia a cinco años oscilan desde 90% en personas cuyo padecimiento se detecta en una edad temprana a sólo casi 5% en pacientes con enfermedad avanzada. Por la magnitud de este problema la American Society for Cancer recomienda un examen preliminar como rastreo en personas de 50 años. Para valorar el progreso en la lucha contra el cáncer y ayudar a determinar la necesidad de establecer programas derastreo, varios estados y centros regionales contra el cáncer han desarrollado bancos de datos computarizados de personas a las que se ha diagnosticado cáncer. En el cuadro 3-5 se presentan los datos de un año de todos los pacientes a los que se diagnosticó cáncer colorrectal y que viven en un estado del oeste medio en E.U.A. En qué forma puede desplegarse la información de la edad de los pacientesal tiempo de diagnóstico en cuadros y gráficas?
Los pasos para construir una tabla de frecuencia son los siguientes:
1. Identificar las observaciones mayor y menor 2. Restar la observación menor de la mayor para obtener límites, extensión o rango de los datos. Simbólicamente se lo expresa como R (el recorrido). 3. Determinar el número de clases o intervalos. Se dispone de varias reglas paraplantearlas, pero en general, el sentido común basta para tomar esa decisión y también los lineamientos siguientes ayudan: a. Para la mayor parte de las aplicaciones; la experiencia ha mostrado que entre seis y catorce clases es un número adecuado para proporcionar información suficiente sin excederse en detalles. b. El número de clases deberá ser suficiente para mostrar la forma de distribución perono excesivo para registrar demasiadas fluctuaciones menores. Una regla práctica para determinar cuántos intervalos van a incluirse es el uso de una fórmula dada por Sturges. Esta fórmula es k = 1 + 3,322 (log n), donde: k: número de intervalos de clase, n: número de valores en el conjunto de datos bajo consideración
La respuesta obtenida bajo la fórmula de Sturges no debe considerarse comodefinitiva, sino solo como una guía.
4. Otra cuestión que debe decidirse se refiere a la amplitud de los intervalos (w) de clase. Aunque a veces es imposible los intervalos de clase deberían,
1
en general, tener la misma amplitud. Esta amplitud puede determinarse dividiendo el recorrido entre el valor de k, el numero de intervalos de clase. Simbólicamente, la amplitud del intervalo de claseestá dada por
w=R/k
Algunas de las indicaciones siguientes son útiles para determinar la amplitud de los intervalos: a. los límites de clases (cifra inicial y final) no deben trasladarse. Por ejemplo, deben establecerse como “40 a 49” o “40 hasta 50”, no como “40 a 50”, “50 a 60”, etc. De otro modo, no será posible decir en una observación a que clase pertenece 50. b. Si es posible, losintervalos de clases deben ser iguales; las desiguales ofrecen problemas al graficarlas, deberán usarse sólo cuando hay faltantes grandes o espacios grandes en los datos. c. Si es posible, se evitarán las clases con extremo abierto debido a que no comunican con exactitud el rango o extensión de las observaciones. Ejemplos de clases de extremo abierto son “49 años o menos” y “90 años o más”. d. Si es...
Regístrate para leer el documento completo.