Diagrama de caja

Solo disponible en BuenasTareas
  • Páginas : 6 (1451 palabras )
  • Descarga(s) : 0
  • Publicado : 26 de febrero de 2011
Leer documento completo
Vista previa del texto
Diagrama de caja


Diagrama de caja (Box-Plot).
Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y lasimetría de la distribución.
Cómo expresarlo graficamente [editar]
+-----+-+
* o |-------| | |---|
+-----+-+

+---+---+---+---+---+---+---+---+---+---+---+---+
0 1 2 3 4 5 6 7 8 9 10 11 12
• Ordenar los datos y obtener el valor mínimo, el máximo,los cuartiles Q1, Q2 y Q3 y el Rango Inter Cuartilico (RIC)
En el ejemplo:
• Valor 7: es el Q1 (25% de los datos)
• Valor 8.5: es el Q2 o mediana (el 50% de los datos)
• Valor 9: es el Q3 (75% de los datos)
• Rango Inter Cuartilico RIC (Q3-Q1)=2
• Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana (Q2) mediante una línea.
• Para dibujar los bigotes,las líneas que se extienden desde la caja, hay que calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos.
Para ello se calcula cuándo se consideran atípicos los valores. Son aquellos inferiores a Q1-1.5*IQR o superiores a Q3+1.5*IQR.
En el ejemplo:
• inferior: 7-1.5*2=4
• superior: 9+1.5*2=12
Ahora se buscan los últimos valores que NO son atípicos, queserán los extremos de los bigotes.
• En el ejemplo: 5 y 10
• Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
En el ejemplo: 0.5 y 3.5
• Además, se pueden considerar valores extremadamente atípicos aquellos que exceden Q1-3*IQR o Q3+3*IQR.
De modo que, en el ejemplo:
• inferior: 7-3*2=1
• superior: 9+3*2=15
El valor 0.5 seria atípico extremo y el 3.5sería atípico
Utilidad
• Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana no está en el centro del rectángulo, la distribución no es simétrica.

• En 1977 John Tukey (citado por Hildebrand, 1997) publicó un tipo de gráfico estadístico para resumir información utilizando 5 medidas estadísticas: el valor mínimo, el primer cuartil, la mediana, eltercer cuartil y el valor máximo. Este tipo de gráfico recibe el nombre de gráfico de caja (boxplot).
• Un gráfico de este tipo consiste en un rectángulo (caja), donde los lados más largos muestran el recorrido intercuartílico (RIC). Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero (recordemos que el segundo cuartil coincide con la mediana).
• Este rectángulo se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Estos segmentos que quedan a izquierda y a derecha de la caja se llaman bigotes. ( Freund, Williams y Perles, 1992).
Los bigotes tienen un límite de prolongación, de modo que aquellos valores atípicos que se separan delcuerpo principal de datos se indican individualmente. A diferencia de otros métodos de presentación de datos, los gráficos de caja muestran los valores atípicos de la variable. Llamaremos valores atípicos de la variable a aquellos que están tan apartados del cuerpo principal de los datos que bien pueden representar los efectos de causas extrañas, como algún error de medición o registro. Sueliminación no se justifica, ya que el propósito del gráfico de caja consiste en brindarnos un mayor conocimiento de la forma en que se distribuyen los datos.
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo...
tracking img