Mineria de datos ii

Solo disponible en BuenasTareas
  • Páginas : 30 (7366 palabras )
  • Descarga(s) : 0
  • Publicado : 1 de junio de 2011
Leer documento completo
Vista previa del texto
Temario
1. Introducción

PARTE II: ALMACENES DE DATOS
* Transparencias basadas parcialmente en el “tutorial DW” de Matilde Celma

1.1. Finalidades y Evolución de los Sistemas de Información. 1.2. Herramientas para la Toma de Decisiones: diferencias e interrelación. 1.3. Almacenes de Datos, OLAP y Minería de Datos: definición e interrelación.

2. Almacenes de Datos
2.1. Introducción a losAlmacenes de Datos. 2.2. Arquitectura de un Sistema de Almacén de Datos. 2.3. Explotación de un Almacén de Datos: Herramientas OLAP. 2.4. Sistemas ROLAP y MOLAP. 2.5. Carga y Mantenimiento de un Almacén de Datos. 2.6. Diseño de un almacén de Datos. 2.7. Líneas de Investigación Abiertas.

José Hernández Orallo
jorallo@dsic.upv.es

3. Minería de Datos
3.1. Introducción a la Minería de Datos(DM) 3.2. El proceso de KDD 3.3. Técnicas de Minería de Datos 3.4. Web Mining 3.5. Líneas de Investigación Abiertas

Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia

2

Objetivos Parte II
• Conocer las ventajas y casos donde es aconsejable recopilar información interna y externa en un Almacén de Datos. • Conocer el modelo multidimensional de losalmacenes de datos y los operadores de refinamiento asociados: drill, roll, slice & dice, pivot. • Conocer la arquitectura y diferentes implementaciones (ROLAP, MOLAP) de Almacenes de Datos. • Reconocer pautas para el diseño y mantenimiento de ADs.
3

Introducción a los Almacenes de Datos
OBJETIVO: Análisis de Datos para el Soporte en la Toma de Decisiones. • Generalmente, la información que sequiere investigar sobre un cierto dominio de la organización se encuentra en bases de datos y otras fuentes muy diversas, tanto internas como externas. • Muchas de estas fuentes son las que se utilizan para el trabajo diario (bases de datos operacionales).
4

Introducción a los Almacenes de Datos
• Sobre estas mismas bases de datos de trabajo ya se puede extraer conocimiento (visión tradicional).• Uso de la base de datos transaccional para varios cometidos:
• Se mantiene el trabajo transaccional diario de los sistemas de información originales (conocido como OLTP, On-Line Transactional Processing). • Se hace análisis de los datos en tiempo real sobre la misma base de datos (conocido como OLAP, On-Line Analytical Processing).

Introducción a los Almacenes de Datos
• Uso de la base dedatos transaccional para varios cometidos:

• PROBLEMAS:
• perturba el trabajo transaccional diario de los sistemas de información originales (“killer queries”). Se debe hacer por la noche o en fines de semana. • la base de datos está diseñada para el trabajo transaccional, no para el análisis de los datos. Generalmente no puede ser en tiempo real (era AP pero no OLAP).
6

5

1 Introducción a los Almacenes de Datos
• Se desea operar eficientemente con esos datos...
• los costes de almacenamiento masivo y conectividad se han reducido drásticamente en los últimos años,

Introducción a los Almacenes de Datos
Almacenes de Datos (AD)
motivació n (data warehouse)

• parece razonable recoger los datos (información histórica) en un sistema separado y específico. NACE ELDATA-WAREHOUSING • Data warehouses (Almacenes o Bodegas de Datos)
7

disponer de Sistemas de Información de apoyo a la toma de decisiones*

disponer de bases de datos que permitan extraer conocimiento de la información histórica almacenada en la organización
objetivos

análisis de la organización

previsiones de evolución

diseño de estrategias
8

* DSS: Decision Support SystemsIntroducción a los Almacenes de Datos
Almacenes de datos
Base de Datos diseñada con un objetivo de explotación distinto que el de las bases de datos de los sistemas operacionales.

Introducción a los Almacenes de Datos Almacenes de Datos
definición

colección de datos diseñada para dar apoyo a los procesos de toma de decisiones
característic as

Sistema Operacional (OLTP) Sistema de Almacén de...
tracking img