Clustering
¿Qué es clustering?
Es la partición del conjunto de individuos en subconjuntos lo más homogéneos posibles. El objetivo de la técnica es agrupar los individuos demanera de maximizar su similitud dentro del cluster y maximizar las diferencias entre clusters. Aplicaciones de la técnica: segmentación de clientes, detección de fraudes, agrupamiento de defectos, etc.30
Tipos de segmentaciòn
Market driven : se eligen a priori las características significativas para el negocio y se definen reglas de partición para ubicar a los individuos en los segmentosData driven: El algoritmo (clustering) agrupa automáticamente los individuos en grupos de comportamiento homogéneo de acuerdo al valor de sus indicadores.
31
Problema: Cómo se agrupan estas caras?La tabla de minerìa
case 1 2 3 4 5 6 7 8 9 10 11 12 sex m f m m m m m m m f m f glasses y n y n n n y n y n n n moustache n n n n n y n n y n y n smile y y n n y n y y y n n n hat n n n n n y n n nn n n
La visión de negocio
Definición del problema Selección, extracción, consolidación y organización de los datos
32
Què hace el software de minería
Asigna cada individuo a un únicocluster Determina el número óptimo de clusters o proporciona varias soluciones para que el analista elija la mejor Evalúa el impacto de las variables en la formación del cluster Proporciona informes yreportes que permiten describir el “perfil” de cada cluster
33
El problema
La gerencia comercial de un banco necesita identificar al segmento (grupo) más valioso de clientes de una tarjeta decrédito para optimizar sus gastos de promociones y campañas de marketing directo
34
Los datos disponibles
Frecuencia de uso de la tarjeta : calculada como media de días entre transacciones.Saldo promedio mensual en $$ Posesión de tarjeta Gold Monto promedio por transacción Cantidad de servicios por débito automático Datos sociodemográficos : sexo, edad, estado civil, ocupación, hijos...
Regístrate para leer el documento completo.