Aplicacion olap en encuestas
García Sánchez, Mª Lourdes marial.garcia10@carm.es Vázquez Ronco, Yolanda yolanda.vazquez@carm.es Centro Regional de Estadística de Murcia
Resumen: Desde principios de los noventa es cada vez más frecuente el uso de herramientas de Inteligencia Empresarial (Business Intelligence) y más concretamente desoluciones multidimensionales o cubos OLAP para integrar, analizar y difundir la información estadística. Habitualmente diferentes tipos de medidas dan lugar a diferentes tablas de hechos y a diferentes cubos OLAP. Este hecho dificulta la obtención de ratios, medias u otras medidas que combinen distintos tipos de métricas. Además, en todas aquellas operaciones estadísticas que implican el uso decuestionarios es de gran utilidad tener una visión global de los resultados, lo que permite detectar posibles errores o incoherencias de un solo vistazo. Por todo ello desde el Centro Regional de Estadística de Murcia (CREM) nos planteamos el uso de una dimensión un tanto especial, a la que hemos llamado dimensión encuesta. Esta dimensión engloba todas las medidas del cuestionario, así como posiblesmiembros calculados derivados de las mismas. Planteamos las ventajas e inconvenientes del uso de este tipo de dimensión y su aplicación en encuestas económicas y demográficas.
Palabras Clave: encuesta, multidimensional, OLAP, dimensión, análisis
Aplicación del diseño OLAP al análisis estadístico. La dimensión encuesta: aplicaciones
Datawarehouse y cubos OLAP
Antes de entrar en ladefinición de la dimensión encuesta vamos a recordar brevemente los conceptos básicos de un Datawarehouse. Podemos definir un Datawarehouse (DW) o Almacén de Datos como una base de datos orientada al análisis, suele ser la piedra angular de cualquier proyecto de Business Intelligence y se suelen usar como base para su acceso desde herramientas OLAP 1 ("On Line Analytical Processing"). Para facilitar elacceso a la información y su visualización los DW se diseñan siguiendo el llamado modelado dimensional, que consiste en diseñar bases de datos compuestas por tablas de dos tipos bien diferenciados: • Tablas de dimensión: contienen todos los atributos relacionados con las medidas o variables numéricas que queremos almacenar en el DW. Tendremos una tabla de dimensión por cada uno de los atributos quedefinen los hechos (p.ej. si medimos el nº de personas podríamos tener sexo, edad, nacionalidad,…). Estos atributos se ordenan de forma jerárquica. Tablas de hechos: recogen el conjunto de medidas o variables numéricas (nº personas, importe de las ventas, cifra de negocio,…) junto con las claves de las dimensiones que las definen.
•
Normalmente los hechos que se incluyen en la tabla tienenafinidad entre sí y comparten dimensiones. Así, podríamos tener por ejemplo una tabla de hechos de personal en la que las medidas fueran el número de ocupados y el número de ocupados en equivalencia a jornada completa y que cruzara con dimensiones como el sexo, la ocupación (investigadores, técnicos, auxiliares,…), etc. Y difícilmente podríamos encajar en esa tabla de hechos otra en la quemidiéramos el gasto en I+D o la cifra de negocios de la empresa. Vamos a introducir el concepto de lo que hemos llamado dimensión encuesta mediante un caso práctico, la modelización de la Encuesta Industrial Anual de Empresas (EIAE).
Modelización de la Encuesta Industrial Anual de Empresas
Para modelizar la Encuesta Industrial Anual de Empresas (EIAE) partimos de los datos recogidos en el cuestionario(según el cuestionario de 2007) y analizando los bloques en los que se divide podemos diferenciar claramente distintos tipos de datos: Datos de identificación y perfil de la empresa: NIDENT, provincia, municipio, razón social, naturaleza jurídica, titularidad, tamaño de la empresa, actividad económica, titularidad, pertenece a grupo de sociedades, tiene participación de capital extranjero,...
Regístrate para leer el documento completo.