Informe
Edición 2010
Informe de Creación de Data Marts, comparación de O3 y Pentaho y Presentación de los principales aspectos de Multidimensional Data Models and Aggregation.
| |
|Integrantes|
| | |
|Ismael Dosil |N° 154668 |
|Alejandro Lozdziejski |N° 150887|
| | |
|Docente: |Esther Hochsztain / Nicolás Polti |
| ||
Índice
Fotos de los integrantes 3
1 Ejercicio 1 4
1.1 Procedimiento de Extracción, Transformación y Carga. 4
1.1.1 Pasos del procedimiento 4
1.2 Dimensiones Conformadas 4
1.3 Hechos Conformados y aditividades 5
1.4 Otras Aclaraciones 5
1.5 Granularidad 6
1.5.1 Cubo 1 6
1.5.2 Cubo 2 6
1.6 Tabla de Hechos 6
1.7 Consultas OLAP 81.7.1 Cantidad de hogares en que se realiza algún curso complementario artístico. 8
1.7.2 Caracterización de hogares donde se realiza algún curso complementario artístico. 9
1.7.3 Principales similitudes y diferencias de los hogares según se realice (o no) algún curso complementario artístico 11
1.7.4 Caracterización de los hogares según su Gasto de Consumo en Recreación y Cultura y elporcentaje que representa el mismo en el ingreso total del hogar. 13
1.7.5 Caracterización de los hogares con y sin servicio doméstico. 14
2 Ejercicio 2 15
2.1 Parte 1 15
2.1.1 Configuración y Generación 15
2.1.2 Diseño 15
2.1.3 Visualización 15
2.1.4 Transparencia de funcionamiento 15
2.2 Parte 2 16
2.3 Parte 3 17
2.4 Parte 4 20
2.5 Parte 5 21
Fotos de losintegrantes
| [pic] | [pic] |
|Ismael Dosil |Alejandro Lozdziejski |
Ejercicio 1
1 Procedimiento de Extracción, Transformación y Carga.
1 Pasos del procedimiento
1) Se descubrieron los datos en los archivos dbf de la encuesta ENGIH05-06N de www.ine.gub.uy2) Se extrajeron los datos de los archivos dbf y "transformaron" en un archivo Microsoft Access estableciendo una tabla por cada archivo:
persona.dbf, hogar.dbf, mhogar.dbf y vivienda.dbf.
También se utilizo la metadata publicada en la página asociada para crear las tablas departamentos, tiposDeTenenciaVivienda y tiposDeTenenciaVivienda.
3) Se crearon las tablas respuestasINE yrespuestasBinarias que son utilizadas como tablas de dimensión para las dimensiones booleanas.
Fue necesario crear estas tablas ya que en el formato de datos del INE 1 Representa SI y 2 representa NO.
Por otro lado en muchas de las consultas que realizamos en SQL para alimentar las tabla infoViviendas se usan condiciones booleanas que se representan en formato estándar 0 RepresentaNO y 1 Representa SI. Por lo tanto fue necesario crear estas tablas para que los valores tengan sentido y representen correctamente independientemente de la fuente a la que se consulta.
4) Se crearon las tablas caracteristicasPersonasVivienda y infoViviendas:
Fue necesario crear caracteristicasPersonasVivienda para agrupar los datos de personas individuales bajo un mismo hogar. Es...
Regístrate para leer el documento completo.