Clase 05 Fundamentos De Miner A De Datos
ICA082
Sesión 05 – Fundamentos de minería
de datos
© Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
1
Fundamentos de minería de
datos
Introducción
Ejemplos de algoritmos
© Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
2
Indicadores en las slides
Definición o concepto
Tema importante o concepto clave
Ejemplo
©Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
3
Fundamentos de minería de
datos
Introducción
Ejemplos de algoritmos
© Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
4
Business Intelligence
Introducción
Minería de datos
Archivos de datos
Bases de datos
ETL
OLAP
Data warehouse
Internet
Reporting
© Antonio De la Barra C. -an.delabarra@uandresbello.edu
Data Mining – ICA082
5
Minería de datos
Introducción
Extracción de patrones (“conocimiento”)
de grandes volúmenes de datos.
El conocimiento se puede manifestar como:
patrones,
reglas
de
conocimiento,
restricciones, tendencias, etc.
•
Datos de los sistemas transaccionales:
–
–
–
•
Competidores:
–
•
Productos y servicios: datos de producción,
inventario y venta.Clientes: necesidades y su proceso de toma de
decisiones.
Transacciones de negocios.
Presiones competitivas y condiciones de la industria.
Información general:
–
tendencias económicas, tecnológicas y culturales.
© Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
6
Técnicas de minería de datos
Introducción
Reglas de asociación
• Se utilizan para descubrir hechos queocurren en común dentro de un determinado conjunto de datos.
Árboles de decisión
• Diagramas de construcciones lógicas, que sirven para representar y categorizar una serie de condiciones que suceden de
forma sucesiva, para la resolución de un problema.
Naive Bayes
• Basado en el teorema de Bayes: la probabilidad condicional de un evento aleatorio A dado B expresado en términos de la
distribuciónde probabilidad condicional del evento B dado A y la distribución de probabilidad marginal de A.
Clustering
• Procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia.
© Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
7
Aprendizaje de Máquina
Introducción
• Algoritmos que mejoran su rendimiento en una tarea a
través de laexperiencia.
Buscar la solución más adecuada en el
espacio
de
hipótesis
usando
conocimiento previo y datos de
entrenamiento para guiar la búsqueda.
© Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
8
Tareas del Aprendizaje de Máquina
Introducción
Predicción
Clustering
Clasificación
Detección de anormalidades (outliers)
Asociaciones
Descripción
Visualización
©Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
9
Ejemplos Aprendizaje de Máquina
Introducción
Predecir la factibilidad que un
paciente sufra de cáncer basado en
información demográfica, exámenes
clínicos y su historial familiar
Identificar el monto escrito en un
cheque bancario basado en una
imagen digitalizada
• Clasificación
• Predicción
Determinar grupos conrasgos
comunes
en
clientes
de
supermercado
Identificar si la entrega de cierto
crédito bancario es riesgoso basado
en información financiera del cliente
• Clustering
• Clasificación
Identificar cuerpos celestes poco
usuales basado en información de
catálogos astronómicos
• Anomalías
© Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining – ICA082
10
Tipos de aprendizajeIntroducción
Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en
supervisados y no supervisados (Weiss y Indurkhya, 1998):
Algoritmos supervisados
• Predicen un dato desconocido a priori, a partir de otros conocidos.
Algoritmos no supervisados
• Se descubren patrones y tendencias en los datos.
© Antonio De la Barra C. - an.delabarra@uandresbello.edu
Data Mining –...
Regístrate para leer el documento completo.