Mineria de datos i
1. Introducción
PARTE I: INTRODUCCIÓN
José Hernández Orallo
jorallo@dsic.upv.es
1.1. Finalidades y Evolución de los Sistemas de Información. 1.2. Herramientas para la Toma de Decisiones: diferencias e interrelación. 1.3. Almacenes de Datos, OLAP y Minería de Datos: definición e interrelación.
2. Almacenes de Datos
2.1. Introducción a los Almacenes de Datos. 2.2. Arquitecturade un Sistema de Almacén de Datos. 2.3. Explotación de un Almacén de Datos: Herramientas OLAP. 2.4. Sistemas ROLAP y MOLAP. 2.5. Carga y Mantenimiento de un Almacén de Datos. 2.6. Diseño de un Almacén de Datos. 2.7. Líneas de Investigación Abiertas.
3. Minería de Datos
3.1. Introducción a la Minería de Datos (DM) 3.2. El proceso de KDD 3.3. Técnicas de Minería de Datos 3.4. Web Mining 3.5.Líneas de Investigación Abiertas
Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia
2
Objetivos Parte I
• Distinguir los sistemas de información para la gestión y los sistemas de información para la toma de decisiones. • Conocer la evolución de las herramientas para el análisis de sistemas de información para la toma de decisiones. • Distinguir laspropiedades y finalidades de las diferentes herramientas DSS (soporte a la toma de decisiones): EIS, OLAP, consultas & informes, minería de datos.
3
Finalidad de los Sistemas de Información
La información reduce nuestra incertidumbre (sobre algún aspecto de la realidad) y, por tanto, nos permite tomar mejores decisiones
4
Finalidad de los Sistemas de Información
• Inicialmente la finalidadde los sistemas de información era recopilar información sobre un parcela del mundo para ayudar en la toma de decisiones:
• • • • recuentos de cereales en Babilonia, de cacao por los pipiles, censos civiles y militares romanos o chinos, libros contables de árabes o sefardíes, ...
Interés Renovado por la Finalidad “Prístina”
Una vez satisfecha la necesidad de tener un soporte informático paralos procesos básicos de la organización (sistemas de información para la gestión).
• Actualmente, con la informatización de las organizaciones y la aparición de aplicaciones software operacionales sobre el sistema de información, la finalidad principal de los sistemas de información es dar soporte a los procesos básicos de la organización (ventas, producción, personal...). 5
Lasorganizaciones exigen nuevas prestaciones de los sistemas de información (sistemas de información para la toma de decisiones).
6
1
Evolución
• 60’s: Informes batch:
• la información es difícil de encontrar y analizar, poco flexible, se necesita reprogramar cada petición.
Herramientas para la Toma de Decisiones
Han aparecido diferentes herramientas de negocio o DSS que coexisten: EIS, OLAP,consultas & informes, minería de datos, ... • ¿Cuál es la diferencia entre EIS y OLAP? • ¿Cuál es la diferencia entre “informes avanzados” y OLAP? • ¿Cuál es la diferencia entre OLAP y Minería de Datos? • ¿Qué interrelaciones existen entre todas estas herramientas?
• 70’s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems):
• basados en terminal, no integrados con elresto de herramientas.
• 80’s: Acceso a datos y herramientas de análisis integradas (conocidas como intelligent business tools):
• Herramientas de consultas e informes, hojas de cálculo, interfaces gráficos e integrados, fáciles de usar. • Acceden a las bases de datos operacionales (“killer queries”).
• 90’s: Almacenes de Datos y herramientas OLAP. • 00’s: Herramientas de Minería de Datosy Simulación.
7
8
Herramientas para la Toma de Decisiones
¿Cuál es la diferencia entre EIS y OLAP?
• Un EIS (Executive Information System) es un sistema de información y un conjunto de herramientas asociadas:
Herramientas para la Toma de Decisiones
¿Cuál es la diferencia entre “informes avanzados” y OLAP?
• Los sistemas de informes o consultas avanzadas:
• están basados,...
Regístrate para leer el documento completo.