Data Mining UnivG

Páginas: 5 (1111 palabras) Publicado: 12 de enero de 2015
Introducción al Data Mining
© Fernando Berzal, berzal@acm.org

Introducción al Data Mining
¿Qué es la minería de datos?
Aplicaciones
KDD (Knowledge
(Knowledge Discovery in Databases)
Databases)
El proceso de extracción de conocimiento
Carácter multidisciplinar

Técnicas de minería de datos
Modelos descriptivos y modelos predictivos
Clasificación de las técnicas de minería de datosFuentes de datos
Evaluación de resultados
Sistemas de minería de datos
1

¿Qué es la minería de datos?
Extracción de patrones (“conocimiento”)
en grandes bases de datos.

2

¿Qué es la minería de datos?
Extracción de conocimiento
en grandes bases de datos.

Requisitos
No trivial
Implícito
Previamente desconocido
Potencialmente útil
3

¿Qué es la minería de datos?Definiciones
“Non-trivial extraction of implicit, previously unknown
“Nonand potentially useful information from data.”
Frawley, Piatetsky
Frawley,
Piatetsky--Shapiro & Matheus
Matheus::
Knowledge Discovery in Databases: An Overview.
MIT Press, 1991.

“Exploration and analysis, by automatic or
semi--automatic means, of large quantities of data in
semi
order to discover meaningful patterns.”Berry & Linoff
Linoff::
Data Mining Techniques.
Wiley, 1997

4

¿Qué es la minería de datos?
How can I analyze this data?

Knowledge

“Data rich,
Information poor”

Conocimiento
(patrones interesantes)
5

Aplicaciones
Market basket analysis (compras)
Perfiles de usuario en la Web
Segmentación de clientes
Detección de fraudes / intrusos


6

KDD

(KnowledgeDiscovery in Databases)
Databases)

Extracción de conocimiento en bases de datos
7

KDD

(Knowledge Discovery in Databases)
Databases)

El proceso de extracción de conocimiento
Limpieza de datos
(eliminación de ruido e inconsistencias)

Integración de datos
(combinación de múltiples fuentes de datos)

Reducción/Selección de datos
(identificación de datos relevantes para el problema)Transformación de datos
(preparación de los datos para su análisis)

Minería de datos
(técnicas de extracción de patrones y medidas de interés)

Presentación de resultados
(técnicas de visualización y de representación del conocimiento)
8

KDD

(Knowledge Discovery in Databases)
Databases)

Extracción de conocimiento en bases de datos:

9

KDD

(Knowledge Discovery inDatabases)
Databases)

Carácter multidisciplinar
Evaluación de resultados
Resumen de datos

Gestión de grandes cantidades de datos

Bases de datos

Estadística

Data Mining

IA
Aprendizaje
Representación del conocimiento

KDD

Visualización
Presentación de resultados

10

(Knowledge Discovery in Databases)
Databases)

“I keep saying the sexy job in the next ten years will bestatisticians. People think I’m joking, but who would’ve
guessed that computer engineers would’ve been the sexy
job of the 1990s? The ability to take data—
data—to be able to
understand it, to process it, to extract value from it, to
visualize it, to communicate it—
it—that’s going to be a hugely
important skill in the next decades…
Because now we really do have essentially free andubiquitous data. So the complimentary scarce factor is the
ability to understand that data and extract value from it.”
Hal R. Varian
Google’s Chief Economist
Professor of Information Sciences, Business, and Economics
at the University of California at Berkeley

11

KDD

(Knowledge Discovery in Databases)
Databases)

Extracción de conocimiento en bases de datos:

12

Técnicas deminería de datos
Modelos de minería de datos

13

Técnicas de minería de datos
Clasificación de los modelos de minería de datos
En función de su propósito general:
Modelos descriptivos
(describen el comportamiento de los datos de forma
que sea interpretable por un usuario experto).
Modelos predictivos
(además de describir los datos, se utilizan para
predecir el valor de algún atributo...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Data mining
  • Data Mining
  • Data Mining
  • data mining
  • Data mining
  • Data Mining
  • DATA MINING
  • Data Mining

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS