Sql tutorial etl
TUTORIAL DATA WAREHOUSE SQL Server: ETL – Parte II
Este documento consta de: • • Pasos generales a seguir Pasos específicos a seguir
2
BI – Data Warehouse – SQL Server: ETL – Parte II UTN FRRO - SISTEMAS DE GESTION II
Pasos generales a seguir Parte I 1. Crear la Base de Datos de la Staging Area. 2.Cargar los datos desde las Fuentes de Datos a la Staging Area.
Parte II 3. Crear la Base de Datos del Data Warehouse. 4. Realizar los procesos de Extracción, Transformación y Carga (ETL).
3
BI – Data Warehouse – SQL Server: ETL – Parte II UTN FRRO - SISTEMAS DE GESTION II
Pasos específicos a seguir 3. Crear la Base de Datos del Data Warehouse.
a. Ingresaremos al Enterprise Manager yal área de trabajo.
b. Crearemos la Base de datos del Data Warehouse y le daremos un nombre. Clic con el botón derecho en Databases New Database…. Escribir el
nombre de la base de datos “TDC DW”. Clic en Aceptar.
c. Definiremos la estructura de la Base de Datos. De acuerdo a lo mencionado en la sección Descripción General del Tutorial, vamos a crear las tablas que forman parte de la Basede Datos del Data Warehouse. En Enterprise Manager, doble clic en Databases, doble clic en TDC DW, clic con el botón derecho en Tables New Table…
Se abrirá una pantalla que permitirá definir la estructura de la nueva tabla. Esta pantalla funciona de manera similar al modo diseño de Microsoft Access.
4
BI – Data Warehouse – SQL Server: ETL – Parte II UTN FRRO - SISTEMAS DE GESTION IIDe
esta
forma
crearemos las tablas mencionadas en
la
sección
Descripción General del Tutorial del documento TUTORIAL DATA WAREHOUSE: ETL – Parte I. Estas tablas son Cliente y Ventas, y para ellas escribiremos los siguientes atributos y tipos de datos:
Clientes Cod_cliente (bigint) Nombre (varchar)
Ventas Cod_cliente (bigint) Cod_tiempo (datetime) Cantidad (bigint) Litros(float)
Empezaremos con la tabla Clientes y luego con la de Ventas. Al finalizar el diseño de una tabla, clic en el botón Save, y escribir el nombre correspondiente. Clic en OK. Antes de finalizar con la de Ventas deberemos definir las relaciones entre las tablas:
Para esto, en el Enterprise Manager, doble clic en Databases, doble clic en TDC Staging, clic con el botón derecho en DiagramsDatabase Diagram… New
5
BI – Data Warehouse – SQL Server: ETL – Parte II UTN FRRO - SISTEMAS DE GESTION II
Aparecerá la siguiente ventana, donde seleccionamos las tablas a relacionar:
Seleccionamos Clientes y Ventas, presionamos Siguiente, luego finalizar y se abrirá el diagrama con las tablas elegidas y con las relaciones propuestas por SQL Server (siempre que en las tablas esténdefinidas las claves primarias), las cuales se pueden modificar de ser necesario.
4. Realizar los procesos de Extracción, Transformación y Carga de la Base de Datos del Data Warehouse (ETL). Los procesos ETL son procesos que leen los registros de las Fuentes de Datos, aplican las transformaciones necesarias para prepararlos y los cargan en el Destino de Datos. Como ejemplo, el proceso Copy columnmencionado en el documento TUTORIAL DATA WAREHOUSE: ETL – Parte I es un proceso ETL.
6
BI – Data Warehouse – SQL Server: ETL – Parte II UTN FRRO - SISTEMAS DE GESTION II
a. Ingresaremos en el DTS Package Designer.
b. Abriremos el paquete donde realizamos la carga del Staging Area.
c. Crearemos
la
transformación
para
cargar
la
tabla
Clientes
del
Datawarehouse.1. Utilizaremos una conexión para el origen de los datos basada en otra ya existente, que en nuestro caso es el Staging Area, para ello en DTS Package Designer Provider for SQL Menú Connection Server…. En el menú Microsoft OLE DB desplegable Existing
connection vamos a seleccionar: “TDC Staging”. Clic en Aceptar.
2. Crearemos una conexión para el destino de los datos, que en nuestro...
Regístrate para leer el documento completo.