Deteccion de datos atipicos, datos ausentes y transformaciones de variables

Solo disponible en BuenasTareas
  • Páginas : 6 (1295 palabras )
  • Descarga(s) : 0
  • Publicado : 27 de febrero de 2011
Leer documento completo
Vista previa del texto
UNIVERSIDAD AUTONOMA DE YUCATAN

ESPECIALIDAD EN ESTADÍSTICA

TALLER DE ANÁLISIS EXPLORATORIO DE DATOS

LICENCIATURA EN ACTUARÍA

ARTURO J. LARA ALVA

M.C SALVADOR MEDINA PERALTA

HACIENDA SOTUTA DE PÉON
El estado de Yucatán se caracteriza por ser uno de los mas turísticos de toda la Republica Mexicana, ya que posee un amplio repertorio de lugares que visitar, ya sea dentro de sucapital Mérida o a lo largo de toda la extensión del estado, teniendo como zona arqueológica más importante a Chichen-Itzá, así como esta existen muchas otras zonas arqueológicas que nos muestran la cultura Maya que hace miles de años habito en estas tierras, sin embargo el estado de Yucatán también cuenta con otros atractivos turísticos. Uno de estos son las haciendas henequeneras que pertenecían alas familias ricas y poderosas de antaño, la llamada casta divina. Entre ellas tenemos a la Hacienda Sotuta de Peón, localizada al sur de Mérida en el municipio de Tecoh; esta hacienda consta de un recorrido guiado por las instalaciones de la casa principal, la maquinaria utilizada para procesar el henequén, (prensa, raspadora, corona, etc.), recorrido en truck por los plantíos de henequén yfinalmente se ofrece un servicio de restaurant.
Los dueños de esta hacienda están altamente interesados en realizar predicciones, análisis de los datos y obtener conclusiones con bases estadísticas sobre las personas que ingresan diariamente al tour. De igual forma se interesaron en realizar una proyección de la producción de alimentos y bebidas para el mes de enero del 2011 basándose en el flujo degente al restaurant en diciembre del año pasado. Sin embargo en este trabajo no compete la elaboración de pronósticos sino el analizar los datos proporcionados y asegurar que estos no presentan datos atípicos, datos ausentes y que se ajustan de manera correcta a una distribución normal, ya que como sabemos la gran mayoría de los métodos estadísticos suponen normalidad en las observaciones.CONSIDERACIONES Y RESTRICCIONES
Las entradas mensuales de turistas se consideraron desde el año 2006 hasta el 2010, teniendo en cuenta que a la hacienda los turistas pueden ser calificados de 3 diferentes maneras: Adulto, Niño y Cortesía.
Para efectos de análisis se considera solo a los Adultos y Niños ya que las cortesías no representan un ingreso a la hacienda.
También sabemos que el preciopagado por niño es la mitad del de un adulto por lo que la cantidad de niños la dividiremos entre 2 para manejar unidades “adulto”.
Las entradas de comensales al restaurant están catalogadas en: Comensal, Descuentos y Cortesías. En este caso si consideraremos las 3 categorías ya que se desea saber la producción estimada de comida que se debe tener para el próximo mes.

-Entrada de turistas por año.2006 | 2007 | 2008 | 2009 | 2010 |
434.5 | 332 | 738.5 | 711 | 775 |
170 | 400 | 777 | 816 | 720 |
367 | 430 | 1239 | 792.5 | 877.5 |
136 | 493 | 661.5 | 697.5 | 731.5 |
149 | 300 | 671.5 | 443.5 | 430.5 |
198 | 27 | 0 | 521.5 | 455 |
293 | 610 | 0 | 813.5 | 1039 |
322 | 499 | 0 | 463.5 | 756 |
120 | 225 | 0 | 350.5 | 432 |
424 | 345 | 0 | 669 | 746 |
149 | 523 | 0 | 535 |1141.5 |
340.5 | 721 | 0 | 946 | 1354 |

-Entrada de comensales en el mes de diciembre 2010
Total |
11 |
12 |
29 |
12 |
5 |
15 |
24 |
54 |
25 |
19 |
4 |
10 |
18 |
10 |
10 |
8 |
7 |
91 |
5 |
22 |
20 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |

OBJETIVO
El objetivo de este trabajo será identificar datos atípicos, trabajar condatos ausentes, y realizar alguna transformación sobre datos que no cumplan el supuesto de normalidad, en las bases de datos proporcionadas; con lo cual se podrá garantizar la confiabilidad de los métodos estadísticos a usar para proyectar las variables requeridas.
ANÁLISIS ESTADISTICO Y RESULTADOS
Comenzamos analizando las entradas de turistas. En primera instancia observamos que en el año 2008...
tracking img