Mineria De Datos
1. Introducción
1.1. Finalidades y Evolución de los Sistemas de Información.
1.2. Herramientas para la Toma de Decisiones: diferencias e interrelación.
1.3. Almacenes de Datos, OLAP y Minería de Datos: definición e interrelación.
PARTE II:
ALMACENES DE DATOS
2. Almacenes de Datos
* Transparencias basadas parcialmente en el “tutorial DW” de Matilde Celma
José HernándezOrallo
jorallo@dsic.upv.es
2.1. Introducción a los Almacenes de Datos.
2.2. Arquitectura de un Sistema de Almacén de Datos.
2.3. Explotación de un Almacén de Datos: Herramientas OLAP.
2.4. Sistemas ROLAP y MOLAP.
2.5. Carga y Mantenimiento de un Almacén de Datos.
2.6. Diseño de un almacén de Datos.
2.7. Líneas de Investigación Abiertas.
3. Minería de Datos
3.1. Introducción a la Mineríade Datos (DM)
3.2. El proceso de KDD
3.3. Técnicas de Minería de Datos
3.4. Web Mining
3.5. Líneas de Investigación Abiertas
Departamento de Sistemas Informáticos y Computación
Universidad Politécnica de Valencia
Objetivos Parte II
2
Introducción a los Almacenes de Datos
• Conocer las ventajas y casos donde es aconsejable
recopilar información interna y externa en un Almacénde
Datos.
OBJETIVO:
Análisis de Datos para el Soporte en
la Toma de Decisiones.
• Conocer el modelo multidimensional de los almacenes de
datos y los operadores de refinamiento asociados: drill,
roll, slice & dice, pivot.
• Generalmente, la información que se quiere
investigar sobre un cierto dominio de la organización
se encuentra en bases de datos y otras fuentes
muy diversas,tanto internas como externas.
• Conocer la arquitectura y diferentes implementaciones
(ROLAP, MOLAP) de Almacenes de Datos.
• Muchas de estas fuentes son las que se utilizan
para el trabajo diario (bases de datos
operacionales).
• Reconocer pautas para el diseño y mantenimiento de ADs.
3
Introducción a los Almacenes de Datos
4
Introducción a los Almacenes de Datos
• Uso de labase de datos transaccional para varios cometidos:
• Sobre estas mismas bases de datos de trabajo ya se puede
extraer conocimiento (visión tradicional).
• PROBLEMAS:
• Uso de la base de datos transaccional para varios cometidos:
• perturba el trabajo transaccional diario de los sistemas de
información originales (“killer queries”). Se debe hacer
por la noche o en fines de semana.
•Se mantiene el trabajo transaccional diario de los sistemas de
información originales (conocido como OLTP, On-Line
Transactional Processing).
• Se hace análisis de los datos en tiempo real sobre la misma base de
datos (conocido como OLAP, On-Line Analytical Processing).
5
• la base de datos está diseñada para el trabajo
transaccional, no para el análisis de los datos.
Generalmente nopuede ser en tiempo real (era AP pero
no OLAP).
6
1
Introducción a los Almacenes de Datos
Introducción a los Almacenes de Datos
Almacenes de Datos (AD)
• Se desea operar eficientemente con esos datos...
(data warehouse)
motivació
n
• los costes de almacenamiento masivo y conectividad se han
reducido drásticamente en los últimos años,
disponer de Sistemas de
Informaciónde apoyo a la
toma de decisiones*
• parece razonable recoger los datos (información
histórica) en un sistema separado y específico.
disponer de bases de datos que permitan extraer conocimiento de
la información histórica almacenada en la organización
NACE EL DATA-WAREHOUSING
objetivos
• Data warehouses (Almacenes o Bodegas de Datos)
análisis de la
organización
7Introducción a los Almacenes de Datos
diseño de
estrategias
previsiones de
evolución
* DSS: Decision Support Systems
8
Introducción a los Almacenes de Datos
Almacenes de Datos
Almacenes de datos
definición
colección de datos diseñada
para dar apoyo a los procesos
de toma de decisiones
Base de Datos diseñada con un objetivo de
explotación distinto que el de las bases de...
Regístrate para leer el documento completo.