mineria
2
El proceso de extracción de
conocimiento
Objetivo: El alumno conocerá las técnicas y métodos
propios del proceso de extracción de conocimiento.
MINERÍA DE DATOS
Objetivo: El alumno conocerá las técnicas y métodos
propios del proceso de extracción de conocimiento.
2.1 Las fases del proceso de extracción de conocimiento
El KDD es un proceso iterativo einteractivo.
El proceso de KDD se organiza en torno a 5 fases:
Fase de Integración y recopilación
Fase de selección, limpieza y transformación
Fase de minería de datos
Fase de evaluación e interpretación
Fase de difusión
Objetivo: El alumno conocerá las técnicas y métodos
propios del proceso de extracción de conocimiento.
MINERÍA DE DATOS
Datos iniciales
1. Integración yrecopilación
Almacén de datos
2. Selección, limpieza y
transformación
Datos seleccionados
(vista minable)
3. Minería de datos
Patrones
+ +
+
- -
4. Evaluación e
interpretación
Conocimiento
5. Difusión y uso
Decisiones
MINERÍA DE DATOS
Objetivo: El alumno conocerá las técnicas y métodos
propios del proceso de extracción de conocimiento.
Fase de Integración yrecopilación
Determinar las fuentes de información
Transformar los datos a un formato común
Fase de Selección, Limpieza y Transformación
Corregir o eliminar datos incorrectos o incompletos
Proyectar los datos para considerar ciertas variables o atributos
Fase de Minería de Datos
Decidir que tarea realizar (clasificar, agrupar, etc.)
Elige el método que se va a utilizarMINERÍA DE DATOS
Objetivo: El alumno conocerá las técnicas y métodos
propios del proceso de extracción de conocimiento.
Fase de Evaluación e Interpretación
Evaluar y analizar los patrones obtenidos
Si es necesario se vuelve a fases anteriores
Resuelven posibles conflictos con el conocimiento
Fase de Difusión
Se hace uso del conocimiento obtenido
Se involucra a todos los posiblesusuarios para su aplicación
Además de las fases descritas, frecuentemente se incluye una fase
previa de análisis de las necesidades de la organización y definición del
problema.
MINERÍA DE DATOS
Objetivo: El alumno conocerá las técnicas y métodos
propios del proceso de extracción de conocimiento.
2.2 Fase de integración y recopilación
Dependiendo de la aplicación, lo normal es quelos datos necesarios
para poder llevar a cabo un proceso de KDD pertenezcan a diferentes
organizaciones, a distintos departamentos de una misma entidad.
Incluso puede ocurrir que algunos datos necesarios para el análisis
nunca hayan sido recolectados en el ámbito de la organización por no
ser necesarios para sus aplicaciones.
En muchos casos se tendrán que adquirir datos externos desde basesde datos públicas (censo, datos demográficos o climatológicos) o
desde bases de datos privadas (seguros, bancarias, electrónicas, etc.)
Esto representa un reto, ya que cada fuente de datos usa diferentes
formatos de registro, agregación de datos, claves primarias, etc.
MINERÍA DE DATOS
Objetivo: El alumno conocerá las técnicas y métodos
propios del proceso de extracción de conocimiento.A
B
C
Integración
Almacenamiento
Limpieza
Almacén de Datos
Data Warehouse
MINERÍA DE DATOS
Objetivo: El alumno conocerá las técnicas y métodos
propios del proceso de extracción de conocimiento.
La integración de múltiples bases de datos ha dado lugar a la
tecnología de almacenes de datos DW. Este término, tan popular
actualmente, hace referencia a la tendenciaactual en las empresas e
instituciones de colectar información de las bases de datos
transaccionales y otras fuentes diversas para hacerlos accesibles para
su análisis.
Un almacén de datos es un repositorio de información coleccionada
desde diferentes fuentes, almacenada bajo un esquema unificado que
normalmente reside en un único emplazamiento.
Un sistema OLTP se puede definir como una...
Regístrate para leer el documento completo.