Mineria De Datos

Páginas: 9 (2081 palabras) Publicado: 26 de junio de 2012
Introducción al Aprendizaje
Automático y a la Minería de Datos
con Weka
HERRAMIENTAS DE LA INTELIGENCIA
ARTIFICIAL
INGENIERÍA INFORMÁTICA

Índice
MINERÍA DE DATOS
INTRODUCCIÓN A LA MINERÍA DE DATOS
TAREAS EN MINERÍA DE DATOS
FASES EN MINERÍA DE DATOS
TIPOS DE ALGORITMOS PARA PREDICCIÓN (CLASIFICACIÓN Y
REGRESIÓN)
EVALUACIÓN DEL CONOCIMIENTO MINADO
SELECCIÓN DE ATRIBUTOS
MINERÍADE TEXTOS

2

INTRODUCCIÓN A LA MINERÍA DE DATOS

3

SKYCAT: Clasificación automática de
objetos del firmamento

4

Minería de Datos. Justificación
Nuevas posibilidades: disponibilidad de
grandes cantidades de datos (bancos, la
web, tarjetas fidelización, ...), potencia de
cómputo
Nuevas necesidades: Es complicado analizar
los datos de manera manual. Necesidad de
técnicasautomáticas: resúmenes (BBDD),
inferencias (estadística, aprendizaje
automático)

5

Minería de Datos. Objetivos
Convertir datos en conocimiento para tomar
decisiones
Es importante la inteligibilidad del
conocimiento obtenido (los modelos
estadísticos no son siempre sencillos de
entender)
MD = BBDD + estadística + aprendizaje
automático

6

TAREAS EN MINERÍA DE DATOS

7 Minería de Datos. Tareas
Predicción:



Clasificación
Regresión

Asociación
Agrupación (clustering)

8

Ejemplo1. Créditos bancarios (clasificación)
Un banco por Internet desea obtener reglas
para predecir qué personas de las que
solicitan un crédito no van a devolverlo.
La entidad bancaria cuenta con una gran
base de datos correspondientes a los
créditos concedidos (o no) aotros clientes
con anterioridad.

9

Ejemplo1. Datos (instancias, patrones, …)
IDC

Años

Euros

Salario

Casa
propia

Cuentas
morosas

...

Devuelve el
crédito

101

15

60000

2200 Si

2

...

No

102

2

30000

3500 Si

0

...

Si

103

9

9000

1700 Si

1

...

No

104

15

18000

1900 No

0

...

Si

105

1024000

2100 No

0

...

No

...

...

...

...

...

...

...

10

Ejemplo 1. Conocimiento obtenido
SI (cuentas-morosas > 0) ENTONCES Devuelvecrédito = no
SI (cuentas-morosas = 0) Y ((salario > 2500) O
(años > 10)) ENTONCES devuelve-crédito = si

11

Ejemplo 2. Determinar las ventas de
un producto (Regresión)
Una gran cadena de tiendas de
electrodomésticos deseaoptimizar el
funcionamiento de su almacén manteniendo
un stock de cada producto suficiente para
poder servir rápidamente el material
adquirido por sus clientes.

12

Ejemplo 2. Datos
Producto

Mes-12

...

Mes-4

Mes-3

Mes-2

Mes-1

Televisor
plano

20

...

52

14

139

74

Video

11

...

43

32

26

59

Nevera

50

...

61

14

528

Microondas

3

...

21

27

1

49

Discman

14

...

27

2

25

12

...

...

...

...

...

...

...

13

Ejemplo 2. Conocimiento obtenido
Modelo que prediga lo que se va a vender
cada mes a partir de lo que se vendió en los
meses anteriores (serie temporal)
Y

DVDs a vender
12
10
8
6

Y

4
2
0
0

2

4

6

8

10Mes 12

14

Ejemplo 3. Análisis de la cesta de la
compra (Asociación)
Un supermercado quiere obtener
información sobre el comportamiento de
compra de sus clientes.
Se piensa que de esta manera se puede
mejorar el servicio, colocando ciertos
productos juntos, etc.

15

Ejemplo 3. Datos de las cestas
Id

Huevos

Aceite

Pañales

Vino

Leche

Manteq
uilla

SalmónLechugas

...

1

Si

No

No

Si

No

Si

Si

Si

...

2

No

Si

No

No

Si

No

No

Si

...

3

No

No

Si

No

Si

No

No

No

...

4

No

Si

Si

No

Si

No

No

No

...

5

Si

Si

No

No

No

Si

No

Si

...

6

Si

No

No

Si

Si

Si

Si

No

...

7

No

No

No...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos
  • Mineria de datos
  • mineria de datos
  • Mineria de dato
  • Mineria de datos
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS