Analisis de variables

Solo disponible en BuenasTareas
  • Páginas : 6 (1414 palabras )
  • Descarga(s) : 0
  • Publicado : 24 de mayo de 2010
Leer documento completo
Vista previa del texto
SOLUCIÓN EJERCICIO 1-7 MONTGOMERY


Primero debemos cargar los datos en el programa, para esto usamos las funciones copiar y pegar de Windows y además el comando “scan” de R. Luego verificamos que los datos estén cargados en el programa y procedemos entonces al tratamiento estadístico de los datos.

> x=scan()
1: 88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 96.5 93.3
11: 94.7 91.1 91.0 94.287.8 89.9 88.3 87.6 84.3 86.7
21: 84.3 86.7 88.2 90.8 88.3 98.8 94.2 92.7 93.2 91.0
31: 90.1 93.4 88.5 90.1 89.2 88.3 85.3 87.9 88.6 90.9
41: 89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
51: 89.8 89.6 87.4 88.4 88.9 91.2 89.3 94.4 92.7 91.8
61: 91.6 90.4 91.1 92.6 89.8 90.6 91.1 90.4 89.3 89.7
71: 90.3 91.6 90.5 93.7 92.7 92.2 92.2 91.2 91.0 92.2
81: 90.0 90.7
83:
Read 82 items

a.Determine con R, la media, mediana y moda de los datos.

> mean(x) ‘Calculamos la media estadística
[1] 90.52561

> median(x) ‘Calculamos la mediana
[1] 90.4

Debido que no existe un comando específico en R para calcular la moda, se utilizó la distribución de frecuencias, para estos datos podemos decir que son multimodales, es decir que tienen varias modas.
b. Obtenga la mediarecortada al 10%, 20% y 50%. ¿Qué conclusión se puede obtener comparando estos resultados con la moda?

> mean(x,0.1) ‘Calculamos la media recortada al 10%
[1] 90.44091

> mean(x,0.2) ‘Calculamos la media recortada al 20%
[1] 90.41

> mean(x,0.5) ‘Calculamos la media recortada al 50%
[1] 90.4

La moda es una medida de tendencia central y se puede decir que la media tendrá una tendenciahacia la moda, debido a que es el dato que más se repite. La media recortada al 50% coincide con la mediana.

c. Encuentre todas las medidas de variabilidad disponibles en R para indicar la variabilidad de los datos. ¿Explique porque existe variabilidad en estos datos? Para responder esta pregunta, documéntese en internet sobre el número de octano en gasolinas.

> var(x) ‘Calculamos la varianza[1] 8.4402

> sd(x) ‘Calculamos la desviación estándar
[1] 2.905202

> max(x)-min(x) ‘Calculamos el rango
[1] 16.9

> IQR(x) ‘Calculamos el rango intercuatílico
[1] 3.6
El octanaje es una escala que mide la resistencia de un combustible a detonar prematuramente cuando se comprime dentro del cilindro de un motor. La gasolina puede tener diferentes índices de octano según el procesode producción y las normas del país en donde se utiliza. Para este ejercicio tenemos datos de varias mezclas de gasolina, por esta razón es normal encontrar una alta variabilidad en los datos, debido a que cada mezcla tendrá su propio índice de octanos.

d. Construya un diagrama de tallo y hoja para estos datos con R. ¿Qué información le da este diagrama?

> stem(x,2) ‘Hacemos el diagrama detallo y hojas

83 | 4
84 | 33
85 | 3
86 | 777
87 | 456789
88 | 23334556679
89 | 0233678899
90 | 0111344456789
91 | 0001112256688
92 | 22236777
93 | 023347
94 | 2247
95 |
96 | 15
97 |
98 | 8
99 |
100 | 3

Este diagrama muestra los valores numéricos divididos en dos partes. Los dígitos principales forman el tallo y los dígitos secundarios las hojas, de esta forma podemosver una distribución rápida y corta de todos los datos que tenemos.

e. Obtenga una distribución de frecuencia de los datos con ayuda de R. ¿Qué le dice esta distribución de frecuencia de los datos?

> table(x) ‘Obtenemos la distribución de frecuencias

83.4 84.3 85.3 86.7 87.4 87.5 87.6 87.7 87.8 87.9 88.2 88.3
1 2 1 3 1 1 1 1 11 1 3

88.4 88.5 88.6 88.7 88.9 89 89.2 89.3 89.6 89.7 89.8 89.9
1 2 2 1 1 1 1 2 1 1 2 2

90 90.1 90.3 90.4 90.5 90.6 90.7 90.8 90.9 91 91.1 91.2
1 3 1 3 1 1 1 1 1 3 3 2

91.5 91.6 91.8 92.2 92.3 92.6 92.7 93...
tracking img