Aplicaciones

Solo disponible en BuenasTareas
  • Páginas : 7 (1547 palabras )
  • Descarga(s) : 0
  • Publicado : 7 de junio de 2011
Leer documento completo
Vista previa del texto
|MANUAL DEL ETL DE PENTAHO |
|PDI PENTAHO DATA INTEGRATION PREVIOUS KETTLE |
| |
| |
||
|INTEGRANTES: |
|Collaguazo Adriana |
|Cornejo Grace |
|Pesantez Joffre ||Solis Galo |
| |
| |
| |
||
|01/05/2009 |
| |
➢ ANTECENDENTES

Pentaho es un suite de herramientas de inteligencia de negocios que tiene dos versiones, la versión comercial y la versión de código abierto.

Parael caso de la materia Data warehouse que estamos cursando, solo utilizaremos la herramienta PDI (Pentaho Data Integration) el cual es una ETL que nos permitirá extraer la información de una base de datos OLTP, transformar la información a través de un modelo dimensional y cargar los resultados de la transformación en una base de datos destino tipo Data warehouse, para que luego pueda serconsultada (consultas ad-hoc) y analizada a través de herramientas para desarrollar reportes especializados las cuales Pentaho también posee.

➢ REQUISITOS PREVIOS A LA INSTALACIONDEL PDI

Requisitos mínimos de hardware

– Procesador de arquitectura Pentium de 2.0 GHZ
– 768 MB de memoria RAM
– Disco Duro con al menos 2 GB libres

Requisitos de software

– Java run TimeEnviroment 5 o posteriores
– MySQL version 5 o posteriores

➢ PASOS PARA LA INSTALACION

Los siguientes son los pasos para instalar el PDI en un computador:

– Descargar el archivo .zip del sitio Web de Pentaho que contiene el PDI: pdi-open-3.1.0-826.zip
– Descomprimir el archivo en cualquier ubicación dentro de C:

➢ PASOS PARA LA IMPLEMENTACION DE NUESTRO ETL

Demanera resumida los pasos para la implementación de nuestro ETL son:

▪ Creación de la base de datos que contendrá el repositorio
▪ Creación del repositorio
▪ Extracción de los datos desde Microsoft Access
▪ Creación de una tabla INPUT
▪ Definición de las tablas de dimensiones
▪ Definición de la tabla de hecho
▪ Carga o exportación de la tabla dehecho

Vamos a detallar cada uno de pasos mencionados.

➢ CREACION DE LA BASE DE DATOS DEL REPOSITORIO

Como era de suponer, antes de crear el repositorio debemos crear la base de datos que lo contenga. Para esto ejecutamos MySQL, ingresando a la carpeta bin de MySQL y ejecutamos:
▪ mysqld --console
▪ mysql -u root
▪ create database repositorio;

[pic]Cabe señalar que “repositorio” es el nombre que le pusimos a la base de datos del repositorio.

➢ CREACION DEL REPOSITORIO

▪ Para crear el repositorio entramos a la carpeta donde descomprimimos el archivo pdi-open-3.1.0-826.zip del PDI y ejecutamos el archivo:

✓ spoon.bat o de manera alternativa
✓ kettle.exe

▪ Se presentará un cuadro de diálogo...
tracking img