Mercadeo
ANÁLISIS DE CONGLOMERADOS
Autor: Manuel Terrádez Gurrea (mterradez@uoc.edu).
ESQUEMA DE CONTENIDOS_______
________________________
Análisis de conglomerados (cluster)
Interpretación de dendogramas
INTRODUCCIÓN
___________________
El análisis de conglomerados (cluster) es una técnica multivariante que busca agrupar elementos (o variables) tratandode lograr la máxima homogeneidad en cada grupo y la mayor diferencias entre los grupos. Nos basaremos en los algoritmos jerárquicos acumulativos (forman grupos haciendo conglomerados cada vez más grandes), aunque no son los únicos posibles. El dendograma es la representación gráfica que mejor ayuda a interpretar el resultado de un análisis cluster. El análisis de conglomerados se puede combinarcon el Análisis de Componentes Principales, ya que mediante ACP se puede homogeneizar los datos, lo cual permite realizar posteriormente un análisis cluster sobre los componentes obtenidos.
OBJETIVOS
• • •
________________________
Entender por qué es importante agrupar elementos parecidos en bloques diferentes. Saber aplicar el análisis de conglomerados, con ayuda de Minitab. Interpretarel dendograma resultante del análisis.
Proyecto e-Math Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
1
Análisis de conglomerados
CONOCIMIENTOS PREVIOS
___________________________________
Aparte de estar iniciado en el uso del paquete estadístico Minitab, resulta muy conveniente haber leído con profundidad los siguientes math-blocks: • • Estadísticadescriptiva. Correlación y regresión lineal múltiple.
CONCEPTOS FUNDAMENTALES
Medidas de disimilitud
______________________________
Partimos de una matriz de información que contiene las observaciones de todas las variables sobre los diferentes elementos considerados (ver Tabla 1), y calculamos las diferencias entre dichos elementos mediante alguna de las medidas de disimilitudhabituales: la distancia euclidiana (
∑ ( X rj − X sj ) 2 ), su cuadrado, la distancia de City-Block ( ∑ X rj − X sj ),
j =1 j =1
J
J
la de Mahalanobis, la de Minkowski, la de Tchebychef, etc. Todas ellas proporcionan ordenaciones muy similares de las distancias en casi todos los casos. Tabla 1 X2 X12 X22 ... XK2
Elementos 1 2 ... K
X1 X11 X21 ... XK1
... ... ... ... ...
XJ X1J X2J... XKJ
Algoritmos de clasificación
Para clasificar los elementos en clusters utilizaremos algoritmos jerárquicos, que pueden ser acumulativos (se forman grupos haciendo clusters cada vez más grandes) o disminutivos (partiendo de un solo grupo se separan los elementos en clusters cada vez más pequeños). Entre los algoritmos jerárquicos acumulativos destacan los siguientes métodos: • • • Métodode las distancias mínimas: se busca la mayor semejanza entre los elementos o grupos más cercanos. Método de las distancias máximas: se calcula la mínima distancia entre los elementos más alejados. Método de las distancias medias: se calcula la media de las distancias entre elementos.
Proyecto e-Math Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
2
Análisis deconglomerados
Presentación de los resultados
Para representar la estructura jerárquica de la formación de los conglomerados se utiliza el dendograma, un gráfico que tiene forma de árbol invertido. Así, a partir de los K elementos observados podemos identificar desde 1 hasta K clusters, según el número de grupo que queramos obtener, sin más que realizar la segmentación horizontal adecuada. Esrecomendable trabajar con datos estandarizados, para eliminar el efecto de la escala de medida, y así poder aplicar el análisis sobre variables que presentan similares valores medios y desviaciones estándar, lo cual facilita la interpretación.
Proyecto e-Math Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
3
Análisis de conglomerados
CASOS PRÁCTICOS CON...
Regístrate para leer el documento completo.