Data Mining
Introducción al Data Mining
Business Intelligence
197
Motivación
l De una manera u otra, en toda empresa
encontramos grandes cantidades de datos.
l Los datos encierran información histórica del
comportamiento del negocio y de las variables
que influyen en su éxito.
l Las formas tradicionales de extraer
información a partir de los datos (consultas
estilo SQL)solucionan el problema en un 80%
l Como en todo en la vida, tal vez el 20%
restante marque la diferencia.
Business Intelligence
198
1
Un ejemplo clásico
l ¿Cómo se relacionan en un supermercado a las 18:00
de un día viernes los pañales con las cervezas?
l A través de consultas tradicionales, no hay
respuesta.
l A través de técnicas de data mining, encontramos
una posible respuestaque debe ser interpretada por
un experto.
Business Intelligence
199
Data Mining: Definición
l Técnicas de extracción de información a partir
de los datos.
l A través del descubrimiento y cuantificación
de relaciones predictivas en los datos, permite
transformarlos en información, que con la
ayuda de un experto pasa a ser conocimiento
útil de negocio.
l Lo anterior se logracuando se cuenta con una
cantidad razonable de datos, la que depende
del ámbito del negocio.
Business Intelligence
200
2
Problemas a enfrentar
l Análisis de retrospectiva. Analizar hechos
pasados para buscar causas de éxito o fracasos.
l Análisis Predictivo. A partir de hechos pasados
“predecir” un comportamiento futuro, por ejemplo
la demanda de un producto.
l Clasificación.Reglas de clasificación en base a
criterios.
l Clustering y Segmentación.
Segmentar una
base de datos en subconjuntos o clusters,
basados en atributos. Ejemplos de atributos
pueden ser: Tipo de colegio, religión, tipo de
vacaciones, número de hijos, etc.
Business Intelligence
201
Problemas a enfrentar (2)
l Secuenciamiento.
Técnica para ayudar a
identificar patrones en distintasinstancias de
tiempo. Por ejemplo: Un cliente compra en una
visita a tienda una máquina de aceite y filtro, en
otra visita compra gasolina.
Business Intelligence
202
3
Factores que promueven su uso
♦ Costo de procesamiento, está decreciendo al
punto donde hoy es posible su uso
personalizado
♦ Las metodologías más recientes hacen que el
uso del Data Mining sea más potente ysencillo.
♦ Oferta de software cada vez más amplia
disponible para el usuario final
♦ El usuario final, cuenta con herramientas que le
permiten desarrollar sus propios modelos de
análisis.
Business Intelligence
203
Integración con bases de datos
Business Intelligence
204
4
Descubriendo el conocimiento
Requerimientos
de Información
Selección
De datos
LimpiezaEnriquecimiento Codificación Data Mining
Reporting
1.1.1.1
Datos
Operacionales
Datos
externos
Retroalimentación
Business Intelligence
205
Técnicas de Data mining
♦ Herramientas Query
♦ Técnicas Estadísticas
♦ Visualización
♦ OLAP (Procesamiento analítico en línea)
♦ K-ésimo vecino más cercano
♦ Arboles de decisión
♦ Reglas de decisión
♦ Reglas de asociación
♦ Redesneuronales
♦ Algoritmos genéticos
Business Intelligence
206
5
Herramientas Query
♦ Primero que todo, las consultas SQL no son
excluyentes a las técnicas de data mining, son
complementarias.
♦ A través de consultas sql, sólo se pueden
descubrir datos poco profundos.
♦ El 80% de la información relevante, se
establece de esta forma.
♦ Una buena manera de empezar es extraer algosimple, puede ser información estadísticas
desde los datos, por ejemplo, promedio de
edad, promedio de ingresos, etc.
Business Intelligence
207
Técnicas de Visualización
l Se
despliega la información en un espacio
cartesiano, cuyo diagrama puede servir para
identificar sub-conjuntos de datos interesantes
que se pueden enfocar al resto del proceso Data
Mining
l Se trata de...
Regístrate para leer el documento completo.