Data Mining

Páginas: 61 (15169 palabras) Publicado: 19 de noviembre de 2012
Definición y aplicaciones (I)
Data Mining (minería de datos): técnicas para la extracción de información oculta en grandes bases de datos.
Grandes cantidades de información recopiladas en los últimos años (ámbitos financiero, metereológico, telefonía, medicina, investigación, supermercados, etc.).
Fácil y barato recopilar información.
Se piensa que la información puede ser útil.
Pero el granvolumen la hace inmanejable, es imposible extraer la información útil y descartar la irrelevante.
Definición y aplicaciones (II)
Dos posibles enfoques para el problema:
1 Tradicional:
• Análisis manual realizado por un estadístico o un programador.
• Se requiere personal muy experimentado.
2 Actual:
• Análisis automático o semi-automático mediante herramientas de fácil uso.
• No esnecesario personal experto.
• DATA MINING.
Origen del término DATA MINING
Minería de datos: es necesario remover muchos datos (tierra) para extraer algo de información (metal).6
Definición y aplicaciones (III)
* Relación con el aprendizaje automático:
* Se busca un modelo que explique o se ajuste a los ejemplos recopilados, igual que en aprendizaje automático.
* Se utilizan modelossimilares:
• Árboles de decisión.
• Listas de reglas.
• Métodos bayesianos.
• Redes neuronales.
* Principal diferencia: los algoritmos están adaptados para poder trabajar sobre grandes bases de datos.
Definición y aplicaciones (IV)
* Principales aplicaciones:
- Marketing: estudio del comportamiento de consumidores a partir de datos recopilados
(compra con tarjetas de crédito).
-Finanzas: estudio de mercados, de productos, de clientes, de préstamos, etc.
- Medicina: diagnóstico automático a partir de bases de datos con historias clínicas de
pacientes.
- Distribución de energía: pervisiones de demanda a partir de datos históricos.
- Redes de telefonía o datos: previsiones de demanda, de ocupación de líneas, de anchos
de banda utilizados a lo largo del día, etc.
-Detección de fallos: en cadenas de producción, en centrales de producción de energía,
etc.
GRUPOS DE TÉCNICAS
Grupos de técnicas (I)
* 3 grupos de técnicas principales:
1 Visualización.
• Ayudas para el descubrimiento manual de información.
• Se muestran tendencias, agrupamientos de datos, etc.
• Funcionamiento semi-automático.
2 Verificación.
• Se conoce de antemano un modelo y se deseasaber si los datos disponibles se ajustan a
él.
• Se establecen medidas de ajuste al modelo.
3 Descubrimiento.
• Se busca un modelo desconocido de antemano.
• Descubrimiento descriptivo: se busca modelo legible.
• Descubrimiento predictivo: no importa que el modelo no sea legible.
Grupos de técnicas (II)
1 Técnicas de visualización:
2 Visualización en 2D de datos multidimensionales.3 Problema con múltiples atributos:
• Vibraciones.
• Temperatura.
• Horas funcionamiento.
• Meses desde revisión…
* Se calculan las distancias entre cada 2 instancias de entrenamiento.

* Se crea un gráfico 2D en el que cada instancia corresponde a un punto y en el que las distancias
entre instancias son lo más parecidas posible a las distancias reales.

Grupos de técnicas (IV)
*Técnicas de verificación:
* Se conoce de antemano un modelo y se desea verificar si es un buen modelo para el conjunto de
instancias disponible.
* Medidas utilizadas: soporte y precisión.
• Soporte: dada una regla, porcentaje de instancias que cumplen sus condiciones.
• Precisión: dada una regla, porcentaje de casos en los que la regla se cumple.

* Interesan soporte y precisión altos.Grupos de técnicas (V)
* Técnicas de descubrimiento.
* Descriptivo: se busca un modelo legible.
• Clustering (agrupamiento).
• Resumen.
• Generación de reglas en cualquier formato.
• Justifican la clase (ej. árboles de decisión).
• Justifican cualquier relación (ej. reglas de asociación).
* Predictivo: no importa si el modelo no es legible.
• Clasificación.
• Análisis de series...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Data Mining
  • Data Mining
  • data mining
  • Data mining
  • Data Mining
  • DATA MINING
  • Data Mining
  • Data Mining

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS