Informatica
Temario
1. Introducción
1.1. Herramientas para la Toma de Decisiones: diferencias e interrelación. 1.2. Almacenes de Datos, OLAP y Minería de Datos: definición e interrelación.
2. Almacenes de Datos
2.1. Introducción a los Almacenes de Datos. 2.2. Arquitectura de un Sistema de Almacén de Datos. 2.3. Líneas de Investigación Abiertas.
2
1Herramientas para la Toma de Decisiones
¿Qué interrelaciones existen entre todas estas herramientas? Fuentes
Internas Base de Datos Transaccional
Herramientas EIS Herramientas de consultas e informes
ETL
Fuente de Datos 1
texto
Almacén de Datos
Interfaz y Operadores
Herramientas OLAP
Fuente de Datos 3
HTML
Fuente de Datos
Fuentes Externas
Herramientas de Minería de Datos
• Laaparición de algunas de ellas han hecho cambiar la manera de trabajar de otras herramientas.
5
Data Warehouse (DW)
El DW es ahora el “sistema de información central” en todo este proceso.
Un DW es una colección de datos: • orientada a un dominio (Caso de Data Marts) • integrada • no volátil • variante en el tiempo para ayudar en la toma de decisiones [Immon 1992, 1996]
6
3Finalidad
Actualmente, Los almacenes de datos y las técnicas OLAP son las maneras más efectivas y tecnológicamente más avanzadas para integrar, transformar y combinar los datos para facilitar al usuario BI o a otros sistemas el análisis de la información. • La tecnología OLAP generalmente se asocia a los almacenes de datos, aunque:
• Podemos tener Almacenes de Datos sin OLAP y viceversa.
7
Mineríade Datos
La Minería de Datos es un conjunto de técnicas de análisis de datos que permiten: • Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. • Extraer patrones y tendencias para predecir comportamientos futuros. Debido al gran volumen de datos este análisis ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sinoque ha de ser (semi-)automático.
8
4
Minería de Datos
La Minería de Datos se diferencia claramente del resto de herramientas en el sentido de que: • no transforma y facilita el acceso a la información para que el usuario la analice más fácilmente.
la minería de datos “analiza” los datos
9
Almacenes de Datos y Minería de Datos
¿Es necesario tener almacenes de datos pararealizar minería de datos? • Los almacenes de datos no son imprescindibles para hacer extracción de conocimiento a partir de datos.
• se puede hacer minería de datos sobre un simple fichero de datos.
• Las ventajas de organizar un almacén de datos para realizar minería de datos se amortizan sobradamente a medio y largo plazo cuando:
• • • • tenemos grandes volúmenes de datos, o éstos aumentan conel tiempo, o provienen de fuentes heterogéneas o se van a combinar de maneras arbitrarias y no predefinidas.
10
5
Introducción a Data Warehouse
OBJETIVO: Análisis de Datos para el Soporte en la Toma de Decisiones. • Generalmente, la información que se quiere investigar sobre un cierto dominio de la organización se encuentra en bases de datos y otras fuentes muy diversas, tanto internascomo externas. • Muchas de estas fuentes son las que se utilizan para el trabajo diario (bases de datos operacionales).
11
Introducción al Data Warehouse
• Sobre estas mismas bases de datos de trabajo ya se puede extraer conocimiento (visión tradicional). • Uso de la base de datos transaccional para varios cometidos:
• Se mantiene el trabajo transaccional diario de los sistemas deinformación originales (conocido como OLTP, On-Line Transactional Processing).
•
Se hace análisis de los datos en tiempo real sobre la misma base de datos (conocido como OLAP, On-Line Analytical Processing).
12
6
Introducción al Data Warehouse
• Uso de la base de datos transaccional para varios cometidos:
• PROBLEMAS:
• perturba el trabajo transaccional diario de los sistemas de...
Regístrate para leer el documento completo.