Mineria De Datos
Automático y a la Minería de Datos
con Weka
HERRAMIENTAS DE LA INTELIGENCIA
ARTIFICIAL
INGENIERÍA INFORMÁTICA
Índice
MINERÍA DE DATOS
INTRODUCCIÓN A LA MINERÍA DE DATOS
TAREAS EN MINERÍA DE DATOS
FASES EN MINERÍA DE DATOS
TIPOS DE ALGORITMOS PARA PREDICCIÓN (CLASIFICACIÓN Y
REGRESIÓN)
EVALUACIÓN DEL CONOCIMIENTO MINADO
SELECCIÓN DE ATRIBUTOS
MINERÍADE TEXTOS
2
INTRODUCCIÓN A LA MINERÍA DE DATOS
3
SKYCAT: Clasificación automática de
objetos del firmamento
4
Minería de Datos. Justificación
Nuevas posibilidades: disponibilidad de
grandes cantidades de datos (bancos, la
web, tarjetas fidelización, ...), potencia de
cómputo
Nuevas necesidades: Es complicado analizar
los datos de manera manual. Necesidad de
técnicasautomáticas: resúmenes (BBDD),
inferencias (estadística, aprendizaje
automático)
5
Minería de Datos. Objetivos
Convertir datos en conocimiento para tomar
decisiones
Es importante la inteligibilidad del
conocimiento obtenido (los modelos
estadísticos no son siempre sencillos de
entender)
MD = BBDD + estadística + aprendizaje
automático
6
TAREAS EN MINERÍA DE DATOS
7Minería de Datos. Tareas
Predicción:
—
—
Clasificación
Regresión
Asociación
Agrupación (clustering)
8
Ejemplo1. Créditos bancarios (clasificación)
Un banco por Internet desea obtener reglas
para predecir qué personas de las que
solicitan un crédito no van a devolverlo.
La entidad bancaria cuenta con una gran
base de datos correspondientes a los
créditos concedidos (o no) aotros clientes
con anterioridad.
9
Ejemplo1. Datos (instancias, patrones, …)
IDC
Años
Euros
Salario
Casa
propia
Cuentas
morosas
...
Devuelve el
crédito
101
15
60000
2200 Si
2
...
No
102
2
30000
3500 Si
0
...
Si
103
9
9000
1700 Si
1
...
No
104
15
18000
1900 No
0
...
Si
105
1024000
2100 No
0
...
No
...
...
...
...
...
...
...
10
Ejemplo 1. Conocimiento obtenido
SI (cuentas-morosas > 0) ENTONCES Devuelvecrédito = no
SI (cuentas-morosas = 0) Y ((salario > 2500) O
(años > 10)) ENTONCES devuelve-crédito = si
11
Ejemplo 2. Determinar las ventas de
un producto (Regresión)
Una gran cadena de tiendas de
electrodomésticos deseaoptimizar el
funcionamiento de su almacén manteniendo
un stock de cada producto suficiente para
poder servir rápidamente el material
adquirido por sus clientes.
12
Ejemplo 2. Datos
Producto
Mes-12
...
Mes-4
Mes-3
Mes-2
Mes-1
Televisor
plano
20
...
52
14
139
74
Video
11
...
43
32
26
59
Nevera
50
...
61
14
528
Microondas
3
...
21
27
1
49
Discman
14
...
27
2
25
12
...
...
...
...
...
...
...
13
Ejemplo 2. Conocimiento obtenido
Modelo que prediga lo que se va a vender
cada mes a partir de lo que se vendió en los
meses anteriores (serie temporal)
Y
DVDs a vender
12
10
8
6
Y
4
2
0
0
2
4
6
8
10Mes 12
14
Ejemplo 3. Análisis de la cesta de la
compra (Asociación)
Un supermercado quiere obtener
información sobre el comportamiento de
compra de sus clientes.
Se piensa que de esta manera se puede
mejorar el servicio, colocando ciertos
productos juntos, etc.
15
Ejemplo 3. Datos de las cestas
Id
Huevos
Aceite
Pañales
Vino
Leche
Manteq
uilla
SalmónLechugas
...
1
Si
No
No
Si
No
Si
Si
Si
...
2
No
Si
No
No
Si
No
No
Si
...
3
No
No
Si
No
Si
No
No
No
...
4
No
Si
Si
No
Si
No
No
No
...
5
Si
Si
No
No
No
Si
No
Si
...
6
Si
No
No
Si
Si
Si
Si
No
...
7
No
No
No...
Regístrate para leer el documento completo.