Data Mining

Páginas: 31 (7679 palabras) Publicado: 19 de marzo de 2013
Capítulo V

Introducción al Data Mining

Business Intelligence

197

Motivación
l De una manera u otra, en toda empresa

encontramos grandes cantidades de datos.
l Los datos encierran información histórica del
comportamiento del negocio y de las variables
que influyen en su éxito.
l Las formas tradicionales de extraer
información a partir de los datos (consultas
estilo SQL)solucionan el problema en un 80%
l Como en todo en la vida, tal vez el 20%
restante marque la diferencia.
Business Intelligence

198

1

Un ejemplo clásico
l ¿Cómo se relacionan en un supermercado a las 18:00

de un día viernes los pañales con las cervezas?
l A través de consultas tradicionales, no hay
respuesta.
l A través de técnicas de data mining, encontramos
una posible respuestaque debe ser interpretada por
un experto.

Business Intelligence

199

Data Mining: Definición
l Técnicas de extracción de información a partir

de los datos.
l A través del descubrimiento y cuantificación
de relaciones predictivas en los datos, permite
transformarlos en información, que con la
ayuda de un experto pasa a ser conocimiento
útil de negocio.
l Lo anterior se logracuando se cuenta con una
cantidad razonable de datos, la que depende
del ámbito del negocio.

Business Intelligence

200

2

Problemas a enfrentar
l Análisis de retrospectiva. Analizar hechos

pasados para buscar causas de éxito o fracasos.
l Análisis Predictivo. A partir de hechos pasados
“predecir” un comportamiento futuro, por ejemplo
la demanda de un producto.
l Clasificación.Reglas de clasificación en base a
criterios.
l Clustering y Segmentación.
Segmentar una
base de datos en subconjuntos o clusters,
basados en atributos. Ejemplos de atributos
pueden ser: Tipo de colegio, religión, tipo de
vacaciones, número de hijos, etc.
Business Intelligence

201

Problemas a enfrentar (2)
l Secuenciamiento.

Técnica para ayudar a
identificar patrones en distintasinstancias de
tiempo. Por ejemplo: Un cliente compra en una
visita a tienda una máquina de aceite y filtro, en
otra visita compra gasolina.

Business Intelligence

202

3

Factores que promueven su uso
♦ Costo de procesamiento, está decreciendo al

punto donde hoy es posible su uso
personalizado
♦ Las metodologías más recientes hacen que el
uso del Data Mining sea más potente ysencillo.
♦ Oferta de software cada vez más amplia
disponible para el usuario final
♦ El usuario final, cuenta con herramientas que le
permiten desarrollar sus propios modelos de
análisis.
Business Intelligence

203

Integración con bases de datos

Business Intelligence

204

4

Descubriendo el conocimiento
Requerimientos
de Información

Selección
De datos

LimpiezaEnriquecimiento Codificación Data Mining

Reporting

1.1.1.1

Datos
Operacionales

Datos
externos

Retroalimentación

Business Intelligence

205

Técnicas de Data mining
♦ Herramientas Query
♦ Técnicas Estadísticas
♦ Visualización
♦ OLAP (Procesamiento analítico en línea)
♦ K-ésimo vecino más cercano
♦ Arboles de decisión
♦ Reglas de decisión
♦ Reglas de asociación
♦ Redesneuronales
♦ Algoritmos genéticos
Business Intelligence

206

5

Herramientas Query
♦ Primero que todo, las consultas SQL no son

excluyentes a las técnicas de data mining, son
complementarias.
♦ A través de consultas sql, sólo se pueden
descubrir datos poco profundos.
♦ El 80% de la información relevante, se
establece de esta forma.
♦ Una buena manera de empezar es extraer algosimple, puede ser información estadísticas
desde los datos, por ejemplo, promedio de
edad, promedio de ingresos, etc.
Business Intelligence

207

Técnicas de Visualización
l Se

despliega la información en un espacio
cartesiano, cuyo diagrama puede servir para
identificar sub-conjuntos de datos interesantes
que se pueden enfocar al resto del proceso Data
Mining
l Se trata de...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Data Mining
  • Data Mining
  • data mining
  • Data mining
  • Data Mining
  • DATA MINING
  • Data Mining
  • Data Mining

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS