Varianza
Datos no agrupados
Datos agrupados
Media ponderada de las variaciones
Corrección Sheppard
La varianza se define como
nótese que la varianza tiene las unidades que tiene los datos al cuadrado. Sin embargo, si obtenemos la raíz cuadrada positiva tendremos
Éste último se conoce como desviación estándar. Debido a que ladesviación estándar tiene las mismas unidades que la media, la desviación estándar es más utilizada que la varianza.
Esta notación de se utiliza para denotar la media y la desviación estándar de una muestra, sin embargo, si la muestra es toda la población se utilizara , para la media y desviación estándar de una población. Estas dos medidas junto con la media, seguramente, son las más utilizadasen todo análisis estadístico.
Otra expresión útil de ver la desviación varianza es encuentra en el siguiente teorema.
Teorema. Se dice que la varianza se puede expresar como:
Demostración.
A partir de la definición de la varianza tenemos:
Un teorema que nos permite cambiar de una variable a otra variable lineal es el siguiente.
Teorema 2. Si entonces la desviaciónestándar .
Demostración.
La desviación estándar para la variable y es dada por
como entonces , por consiguiente
el resultado anterior nos muestra que si un valor es trasladado una cantidad no tiene por que aumentar, como se observa en el hecho de realizar el cambio a sin embargo, al multiplicar por a, es decir, las características de la concentración de datos se modificara dependiendo de a, por ejemplo, si a<1 la información se concentrara alrededor de la media, es decir tendrá menor varianza pero si por el contrario se a>1 la concentración de datos tendera a dispersarse, es decir, tendrá una mayor varianza.
Una de la interrogantes es como saber si el considerar la suma de los cuadrados de la diferencia con respecto a al media es mínima, es decir, no existeotro parámetro, r, que cumpla lo cual es formulado en el siguiente teorema presentando su respectiva demostración
Teorema. La relación considerada para la desviación estándar es mínima, es decir no existe otro parámetro diferente a al media para el cual la suma de los cuadrados sea mínima.
Demostración.
Considérese la diferencia
elevemos al cuadrado lo que nos conduce a larelación
considerando la sumatoria
tenemos
consideremos que en la segunda sumatoria es una constante y que , pero que además es constante por lo que, suponiendo que la suma es con respecto a n datos tendremos:
recordamos además el siguiente teorema
entonces tendremos:
como todas las sumas son positivas por tratarse de suma de cuadrados entonces
lo que demuestra el teorema.Esta generalidad de las desviaciones queda expresada como una propiedad propia de la desviación típica
donde a expresa cualquier promedio aritmético, sin embargo, en el caso en que dicho promedio es la media, como se demostró, este valor es mínimo, es decir, . Debido a esta generalidad es común llamarle a la desviación típica como desviación estándar.
Ejemplo:
Obtener la varianza ydesviación estándar de la siguiente muestra, que nos indica el número de cigarros que son consumidos en promedio al día por un conjunto de 20 encuestados.
2 | 4 | 10 | 6 | 0 | 4 | 1 | 0 | 3 | 6 |
10 | 2 | 4 | 2 | 3 | 2 | 5 | 5 | 8 | 0 |
La media es igual a
a continuación reportamos la tabla de la diferencia de cuadrados :
3.4225 | 0.0225 | 37.8225 | 4.6225 | 14.8225 | 0.0225 |8.1225 | 14.8225 | 0.7225 | 4.6225 |
37.8225 | 3.4225 | 0.0225 | 3.4225 | 0.7225 | 3.4225 | 1.3225 | 1.3225 | 17.2225 | 14.8225 |
Por lo que
por lo para determinar la desviación estándar basta con obtener la raíz cuadrada, con lo que finalmente la desviación estándar es igual a:
cigarros.
5.2 LA VARIANZA
Otra forma para asegurar que las diferencias entre la media y los...
Regístrate para leer el documento completo.