Distribuciones Weibull
1. Introducción
El objetivo de esta práctica es asignar un modelo de probabilidad a un conjunto de datos, de forma que el modelo elegido pueda interpretarse como la población de la que proceden esos datos. A esta búsqueda de un modelo de probabilidad apartir de una muestra de datos se le denomina ajuste de una distribución. Para que un modelo de probabilidad pueda considerarse que es un modelo razonable para explicar los datos, han de realizarse pruebas estadísticas. La realización de estas pruebas se denomina diagnosis o crítica del modelo. Por tanto, diremos que un modelo tendrá un buen ajuste a nuestros datos si supera con éxito la diagnosis. Laforma habitual para hacer ajuste de modelos es la siguiente. A partir del análisis de la muestra se comparará su distribución con la de algún modelo conocido (Normal, Poisson, Exponencial, etc) . Para evaluar si un modelo tiene un buen ajuste realizaremos el test de la Chi cuadrado. Se utilizarán dos ficheros: TiempoaccesoWeb.sf3 y AlumnosIndustriales.sf3. Empezaremos analizando la variableOrdenador_Uni del fichero TiempoaccesoWeb.sf3. Esta variable tiene 55 medidas del tiempo, en segundos, que se tarda en acceder a la página Web de la Universidad desde un ordenador de su biblioteca. Veremos, como a partir de esta muestra, podemos encontrar un modelo de probabilidad que se ajuste a esos datos y que sirva como modelo poblacional del tiempo que tardamos cada vez que abrimos la página Webde la Universidad con ordenadores de su biblioteca. En segundo lugar analizaremos la variable Tiempo del fichero AlumnosIndustriales.sf3. Esta variable contiene el tiempo que tardan unos estudiantes en llegar a la Universidad.
2. Ajuste del modelo. Variable Ordenador_Uni 2.1 Análisis descriptivo de los datos
Lo primero que haremos, será un estudio descriptivo de los datos (Medidascaracterísticas, histograma). Así podemos hacernos una idea de la distribución de los datos. Nos vamos a DESCRIBE/NUMERIC DATA/ONE VARIABLE ANALYSIS. Hacemos click en Summary Statistics y Frecuency Histogram. En Summary Statistics seleccionamos las medidas características más habituales (en Pane Options –botón derecho del ratón-)
Vemos que el histograma se parece a una Normal. Es unimodal y bastantesimétrico (Skewness=0.08) aunque menos apuntado que la normal (Kurtosis=-0.29). Esto nos conduce a pensar que una normal podría proporcionar un ajuste suficientemente bueno a estos datos y ser utilizada para explicar las distribuciones de tiempos de acceso. 2.2 Diagnosis del modelo elegido Para evaluar el ajuste de un modelo vamos a DESCRIBE/DISTRIBUTION FITTING/UNCESORED DATA
Se abre entonces laventana para introducir la variable a la que queremos ajustar una distribución. Seleccionamos Ordenador_Uni.
Seleccionamos ahora el modelo de distribución escogido. Para eso nos colocamos en cualquier ventana y pulsamos el botón derecho, y pulsamos Analysis Options.
Aparece entonces la ventana para seleccionar el modelo de probabilidad. Seleccionamos la Normal (es la que aparece seleccionada pordefecto)
La estimación de los parámetros del modelo la enconrtamos en las Opciones Tabulares Analysis Summary.
,
ˆ ˆ Los parámetros de la normal estimados son entonces μ = 1.42; σ 2 = 0.125 2 que corresponden con los obtenidos anteriormente al describir las variables. El modelo estimado es por tanto X ∼ N (1.42, 0.1252 )
Este ejercicio de estimación no nos informa de si la normal es ono un modelo apropiado. Para hacer la diagnosis del modelo seleccionamos primeramente Frequency Histogram entre las Opciones Gráficas. El resultado obtenido es
Este gráfico nos presenta nuestro histograma junto con la función de densidad del modelo teórico. Cuánto más se aproxime la curva a nuestros datos, mejor será el ajuste. Esta figura es muy útil pues nos permite visualizar el ajuste....
Regístrate para leer el documento completo.