Matket Baskete Analisys
Luis Aburto Lafourcade
Data Analysis for Decision Support (DADS) luaburto@dads.cl
Agenda
Introducción al Problema Data Mining y KDD Market Basket Analysis DEMO de Análisis de Canasta Usos y Aplicaciones de la Herramienta Beneficios para el Supermercado Desarrollos Futuros Herramienta deData Mining como Service Conclusiones
El Negocio del Retail
Gran Cantidad de Productos 5.000 SKU’s Gran Cantidad de Clientes (muchas veces no identificables) Gran Cantidad de Datos: POS Industria de Supermercados en fuerte competencia Variables claves del negocio
Retener al cliente actual Manejo de la Sala Control de existencias Generación de Promociones atractivas para losclientes - Descuentos - Packs de Productos
¿En base a qué información realizo las promociones?
De manera Instintiva
Visión sesgada de la realidad Pierdo oportunidades de negocio al desconocer la evolución del comportamiento de los clientes Solución rápida al problema
En base a los datos transaccionales
Analizar los millones de boletas que se originan en la cadena Estudiar lascombinaciones entre productos Problema de gran tamaño con tiempos de solución altísimos. Soluciones confiables y dinámicas en el tiempo.
Data Mining y KDD
Data Mining es el proceso no trivial de identificación de patrones entendibles, válidos y potencialmente útiles para el negocio, desde grandes bases de datos. (Fayyad, 1996)
Patrones como:
Ciclos de Vida de Clientes Tipos deClientes Comportamientos de Compra Fraude
Data Mining y KDD
6. Apoyo a la Toma de Decisiones 5. Visualización del conocimiento
4.Interpretación y Evaluación 3.Data Mining
Knowledge
2.Selección y Preprocesamiento
p(x)=0.02
Conocimiento
1.Consolidación de los Datos
Warehouse DW
Patrones y Modelos Datos preparados
Datos Consolidados
Análisis de Canasta (Market BasketAnalysis)
Los hábitos de compra de los clientes pueden ser representados a través de asociaciones o correlaciones entre los diferentes productos que compran en sus “canastas”.
Cliente 1:
Cliente 2:
Cliente 1:
Arroz, puré, bebida
Arroz, helado, pan
Arroz, bebida, cerveza
Amazon y Barnes&Nobles
Asociación de Productos
Asociación de Productos
Análisis de Canasta:Indicadores Las relaciones entre productos se miden por:
Importancia Relativa (support):indica el porcentaje de transacciones que
llevan el antecedente y el consecuente, con respecto al total de transacciones analizadas Ej: {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Importancia Relativa(arroz cerveza)= 2/3=66% Este indicador señala que tan frecuente es la relación entreproductos con respecto al universo de boletas. Pero no indica si existe vínculo entre ambos productos.
Análisis de Canasta: Indicadores
Confiabilidad (confidence):indica el porcentaje de transacciones que llevan
el antecedente y el consecuente juntos, con respecto al total de transacciones que llevan el antecedente. Ej: {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza}Confianza (cerveza puré)= 1/2=50% Esta relación señala el vínculo o sinergia entre ambos productos (probabilidad condicional). Pero, qué pasa en el siguiente caso: Confianza(helado arroz)=1/1= 100% ¿Quiere decir que hay una fuerte relación entre estos productos?
Análisis de Canasta: Indicadores
Ganancia (gain or Improvement): puntaje que representa el aumento en la
probabilidad de seleccióndel consecuente, al ser comprado en conjunto con el antecedente Ganancia (AB)=Confianza(AB)/Importancia Relativa(B) Ej: {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Ganancia(helado arroz)=1/1= 1 Ganancia(bebida puré)=0,5/0,3= 1,5 Con estos indicadores podemos entender las relaciones entre clientes
Algoritmo APRIORI
Algoritmo de Búsqueda de Asociaciones de...
Regístrate para leer el documento completo.