BI 2 Presentacion
Inteligence
2015
Resumen Clase Pasada
• BI
• Data Warehouse / Data Mart
• OLTP – Online Transaction Processing
• OLAP – Online Analytical Processing
• BSC – Balance ScoreCard
• TM – Text mining
• DM – Data mining
• EIS – Executive Information Systems
• DSS – Decision Support Systems
• CRM
¿Qué es Data Warehousing?
• Es un Proceso, No un producto
• Es una técnica para consolidar yadministrar datos de
variadas fuentes con el propósito de responder
preguntas de negocios y tomar decisiones de una
forma que no era posible hasta ahora
Data Warehouse
• Almacén de datos
• Una base de datos que contiene información histórica y
agregada de la información operacional (transaccional) de una
organización
• Integra información de distintas fuentes dentro de la
organización
• Estadiseñada para favorecer el análisis de los datos
Conceptos Básicos
• Data Warehouse: Base de datos de apoyo a la
decisión, que es mantenida de forma separada de las
bases de datos operacionales
• Por qué separada?
• Rendimiento: Las BD operacionales tienen transacciones y
cargas conocidas, por lo que su diseño (lógico, físico) y
afinamiento es especifico
• Funcionalidad: Un DW maneja datos históricos,datos
consolidados y una calidad de datos distinta a las BD
operacionales
Conceptos Básicos
• Beneficios:
• Mejora el apoyo a la toma de decisiones
• Liberación de recursos en las bases de datos operacionales,
en cuanto a las consultas ad-hoc
• Los usuarios finales pueden acceder la información con
total independencia de los sistemas transaccionales
Datawarehouse
1. Datos: Centralizarinformación de múltiples fuentes en un Data
Warehouse
2. Entendimiento: Herramientas de BI para analizar y mejorar el
entendimiento del negocio
3. Acción: Actuar sobre los hallazgos realizados en el análisis
Comparación de Nivel de
Datos
OLAP
• Permiten representar los datos del problema en términos de dimensiones
• Los OLAPs pueden ser servidores, si almacenan los datos en este modelo
dimensional;o clientes si se conectan a un servidor de base de datos (por
ejemplo Relacional) y transforman los requerimientos dimensionales en
términos relacionales
• La utilización de unos u otros depende del tipo de problema a resolver, no
existiendo un modo que sirva para el 100% de los problemas
MOLAP / ROLAP / HOLAP
MOLAP: Procesamiento Analítico On line, construido sobre bases de
datosmultidimensionales
ROLAP: Procesamiento Analítico OnLine, construidos sobre una base de
datos relacional
HOLAP: Mezcla ROLAP y MOLAP, permite almacenar una parte de los
datos como en un sistema MOLAP y el resto como ROLAP. Se puede
almacenar una sección de los datos, normalmente los más recientes en
modo MOLAP para mejorar la velocidad de las consultas, y los datos más
antiguos en ROLAP
MOLAP
• Se precalculan y almacenan los resultados de todas las
consultas posibles a la base de datos
• Altos requerimientos de espacio, pero consultas muy eficientes
• Retardos en procesos batch de carga, modificaciones y calculo
de agregaciones
• Datos almacenados en archivos con escritura multidimensional
(“array’s multidimensionales”)
• Adecuados hasta para 10 dimensiones y volúmenes de datos
no muy grandes(5 GB o menos)
ROLAP
• Almacena información relativa a datos en detalle, evitando
valores redundantes o agregados
• Minimiza los requerimientos de espacio, pero las consultas son
lentas
• Los procesos batch de carga son rápidos, al igual que las
modificaciones
• Esquema Multidimensional, pero con datos almacenados en
bases de datos relacionales.
• Soportan n dimensiones y son adecuados paragrandes
volúmenes de datos
Data Mart
• Un subconjunto lógico de un Data Warehouse. A menudo, una
porción del Data Warehouse correspondiente a los datos
asociados a un proceso de negocio individual o para un grupo
de procesos de negocios relacionados
• Data Mart: subconjuntos departamentales que se centran en
sujetos específicos.
• Por ejemplo, data mart de Marketing: de clientes, de productos,...
Regístrate para leer el documento completo.