Mineria de datos ii
1. Introducción
PARTE II: ALMACENES DE DATOS
* Transparencias basadas parcialmente en el “tutorial DW” de Matilde Celma
1.1. Finalidades y Evolución de los Sistemas de Información. 1.2. Herramientas para la Toma de Decisiones: diferencias e interrelación. 1.3. Almacenes de Datos, OLAP y Minería de Datos: definición e interrelación.
2. Almacenes de Datos
2.1. Introducción a losAlmacenes de Datos. 2.2. Arquitectura de un Sistema de Almacén de Datos. 2.3. Explotación de un Almacén de Datos: Herramientas OLAP. 2.4. Sistemas ROLAP y MOLAP. 2.5. Carga y Mantenimiento de un Almacén de Datos. 2.6. Diseño de un almacén de Datos. 2.7. Líneas de Investigación Abiertas.
José Hernández Orallo
jorallo@dsic.upv.es
3. Minería de Datos
3.1. Introducción a la Minería de Datos(DM) 3.2. El proceso de KDD 3.3. Técnicas de Minería de Datos 3.4. Web Mining 3.5. Líneas de Investigación Abiertas
Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia
2
Objetivos Parte II
• Conocer las ventajas y casos donde es aconsejable recopilar información interna y externa en un Almacén de Datos. • Conocer el modelo multidimensional de losalmacenes de datos y los operadores de refinamiento asociados: drill, roll, slice & dice, pivot. • Conocer la arquitectura y diferentes implementaciones (ROLAP, MOLAP) de Almacenes de Datos. • Reconocer pautas para el diseño y mantenimiento de ADs.
3
Introducción a los Almacenes de Datos
OBJETIVO: Análisis de Datos para el Soporte en la Toma de Decisiones. • Generalmente, la información que sequiere investigar sobre un cierto dominio de la organización se encuentra en bases de datos y otras fuentes muy diversas, tanto internas como externas. • Muchas de estas fuentes son las que se utilizan para el trabajo diario (bases de datos operacionales).
4
Introducción a los Almacenes de Datos
• Sobre estas mismas bases de datos de trabajo ya se puede extraer conocimiento (visión tradicional).• Uso de la base de datos transaccional para varios cometidos:
• Se mantiene el trabajo transaccional diario de los sistemas de información originales (conocido como OLTP, On-Line Transactional Processing). • Se hace análisis de los datos en tiempo real sobre la misma base de datos (conocido como OLAP, On-Line Analytical Processing).
Introducción a los Almacenes de Datos
• Uso de la base dedatos transaccional para varios cometidos:
• PROBLEMAS:
• perturba el trabajo transaccional diario de los sistemas de información originales (“killer queries”). Se debe hacer por la noche o en fines de semana. • la base de datos está diseñada para el trabajo transaccional, no para el análisis de los datos. Generalmente no puede ser en tiempo real (era AP pero no OLAP).
6
5
1Introducción a los Almacenes de Datos
• Se desea operar eficientemente con esos datos...
• los costes de almacenamiento masivo y conectividad se han reducido drásticamente en los últimos años,
Introducción a los Almacenes de Datos
Almacenes de Datos (AD)
motivació n (data warehouse)
• parece razonable recoger los datos (información histórica) en un sistema separado y específico. NACE ELDATA-WAREHOUSING • Data warehouses (Almacenes o Bodegas de Datos)
7
disponer de Sistemas de Información de apoyo a la toma de decisiones*
disponer de bases de datos que permitan extraer conocimiento de la información histórica almacenada en la organización
objetivos
análisis de la organización
previsiones de evolución
diseño de estrategias
8
* DSS: Decision Support SystemsIntroducción a los Almacenes de Datos
Almacenes de datos
Base de Datos diseñada con un objetivo de explotación distinto que el de las bases de datos de los sistemas operacionales.
Introducción a los Almacenes de Datos Almacenes de Datos
definición
colección de datos diseñada para dar apoyo a los procesos de toma de decisiones
característic as
Sistema Operacional (OLTP) Sistema de Almacén de...
Regístrate para leer el documento completo.