etapa 3 estadística

Páginas: 15 (3543 palabras) Publicado: 31 de octubre de 2013
III.0 Corrección etapa 2
II.1 Box Plot para valores atípicos
Como ya sabemos los valores atípicos son valores que se encuentran lejos que a mayoría de los otros valores es por eso que lo que se muestra a continuación es un diagrama de caja que se hizo con la variable de respuesta.










Como se puede observar los valores atípicos de nuestra base de datos son80,35,25,25,25,25,25,20,15 y 15. Estos valores se quitaron de la base de datos original para que más delante no presenten algún problema y la nueva base de datos es la siguiente:



Nueva base de datos
No. de Orden de Trabajo
Y
X1
X2
X3
X4
X5
2078
10
2
6
100
1
1
2079
10
1
1
12,000
15
10
2080
5
1
1
80,000
2
4
2081
10
1
1
20,000
2
4
2083
8
1
1
638
9
4
2090
10
2
6
300
11
2091
3
1
2
1,000
1
1
2092
10
1
8
2,000
1
1
2093
6
1
3
1,000
1
1
2094
9
3
5
500
1
1
2095
10
7
8
72
3
1
2096
7
2
6
12
2
1
2097
7
2
6
6
1
1
2098
6
1
1
1,500
4
3
2099
4
2
3
250
1
1
2100
3
1
2
21
1
1
2101
4
1
1
10,000
2
3
2102
6
2
3
2,000
1
1
2103
10
6
7
1,000
2
2
2104
6
4
5
11
1
1
2105
13
2
37,000
2
2
2106
6
1
1
1,500
4
3
2107
4
1
2
2,000
2
2
2109
4
1
1
10,000
2
3
2110
8
2
6
2,000
1
1
2111
3
1
1
220
4
3
2112
7
2
6
250
1
2
2113
10
2
9
500
1
1
2114
8
2
6
500
1
1
2116
5
2
3
500
1
1
2117
5
2
3
1
1
1
2118
6
2
2
1,000
3
1
2119
10
1
7
27
2
1
2120
10
5
6
1,000
4
2
2121
8
1
4
6,000
4
3
2122
3
11
16
1
1
2123
4
1
1
10,000
2
3
2124
6
1
1
1,500
4
3
2125
10
2
3
1
4
3

II.2 Descripción y análisis de las variables con distribución de frecuencias y graficas adecuadas

De la tabla arriba expuesta después de remover los valores atípicos, se obtiene lo siguiente:
Variable Y:
n = 39
k = √n = 6.24 ≈ 7
Amplitud = (DM - dm) / k = 1.43 ≈ 1.5

Y
FrecuenciaFrecuencia Relativa
Frecuencia Porcentual
3.0 - 4.4
9
0.23
23.08%
4.5 - 5.9
3
0.08
7.69%
6.0 - 7.4
10
0.26
25.64%
7.5 - 8.9
4
0.10
10.26%
9.0 - 10.4
12
0.31
30.77%
10.5 - 11.9
0
0.00
0.00%
12.0 - 13.5
1
0.03
2.56%
Total
39
1
100.00%



Como se puede apreciar en la gráfica de frecuencia, la variable Y tiene un ligero sesgo hacia la derecha. Quizá con una muestra mayor dedatos se podría aproximar la distribución de frecuencia a una distribución normal.
La media muestral de la variable es 7.2, la mediana 7 (después de quitar los datos atípicos) y la desviación estándar de la muestra es 2.67.
Aproximadamente el 56% de los datos se encuentra por debajo de la media de la muestra y aproximadamente 46% de los datos se encuentra a una desviación estándar o menos de lamedia muestral. Esto podría denotar una variabilidad media-alta de los datos de la muestra.

Variable X1:
n=39
k= √n = 6.24 ≈ 7
Amplitud = (DM - dm) / k = 0.86 ≈ 0.9

X1
Frecuencia
Frecuencia Relativa
Frecuencia Porcentual
1.0 - 1.8
19
0.49
48.72%
1.9 - 2.7
15
0.38
38.46%
2.8- 3.6
1
0.03
2.56%
3.7 - 4.5
1
0.03
2.56%
4.6 - 5.4
1
0.03
2.56%
5.5 -6.3
1
0.03
2.56%6.4 -7.8
1
0.03
2.56%
Total
39
1
100.00%



La gráfica muestra un gran sesgo a la derecha para la variable X1. El comportamiento de la misma en la gráfica pareciera asemejar una distribución exponencial.
La media muestral de la variable es 1.9, la mediana 2 y la desviación estándar de la muestra es 1.39.
Aproximadamente el 49% de los datos se encuentra por debajo de la media de lamuestra y aproximadamente 90% de los datos se encuentra a una desviación estándar o menos de la media muestral lo que nos indica que la variabilidad de los datos se podría considerar baja.
Variable X2:
n=39
k= √n = 6.24 ≈ 7
Amplitud = (DM - dm) / k = 1.14 ≈ 1.2

X2
Frecuencia
Frecuencia Relativa
Frecuencia Porcentual
1.0 - 2.1
16
0.41
41.03%
2.2 - 3.3
7
0.18
17.95%
3.4 - 4.5
1...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • etapas de la estadistica
  • Etapa 3
  • Etapa 3
  • Etapa 3
  • biologia 3 etapa 3
  • Pema.actividad.3 etapa 3
  • etapa 3 matematicas 3
  • etapa 3 tarea 3

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS