CLUSTERS

Páginas: 6 (1473 palabras) Publicado: 26 de octubre de 2015
SPSS Tutorial
Ángel M. Ramos Domínguez
Curso de Doctorado
Análisis Conjunto

Análisis Cluster
Guía
• Análisis Cluster
• Ejemplo de análisis cluster
• Trabajo sobre asignación

Análisis Cluster
• Es una clase de técnicas utilizadas
para clasificar casos en grupos que
son relativamente homogéneos
dentro de si mismos y
heterogéneos entre ellos, sobre la
base de un conjunto definido de
variables.Estos grupos se llaman
Clusters o Conglomerados.

Análisis Cluster e
Investigación de mercados
• Segmentación de Mercados. Agrupamiento de
consumidores de acuerdo a sus preferencias de
atributos
• Comprender el comportamiento de los
compradores. Los consumidores con similares
comportamientos/características son agrupados
juntos.
• Identificar oportunidades de nuevos
productos. Los clusters desimilares
marcas/productos pueden ayudar a identificar
competidores/oportunidades de mercado
• Reducción de los datos. En mapas de
preferencias

Etapas de un Análisis
cluster
1. Seleccionar una medida de
distancia
2. Seleccionar un algoritmo de
agrupamiento
3. Determinar el número de
clusters
4. Validar el análisis

3

REGR factor score 1 for analysis

1

2

1

0

-1

-2

-3
-4
-3

-2

-1

0

REGRfactor score 2 for analysis

1

2

1

3

4

Definición de la
distancia: La distancia Euclídea

Dij 

n

 x
k 1

ki

 xkj 

2

Dij distancia entre los casos i y j
xki valor de la variable Xk para el caso j
Problemas:
• Diferentes medidas = diferentes
ponderaciones
• Correlación entre variables
(redundancia)
Solución: Análisis de componentes

Procedimientos de
Clustering
• Procedimientosjerarquicos
– Aglomerativo (comienza desde n
clusters, hasta llegar a obtener 1
cluster)
– Divisivo (comienza desde 1 cluster,
hasta obtener n cluster)

• Procedimientos no jerarquicos
– Cluster de K-medias

Agrupamiento aglomerativo

Agrupamiento
aglomerativo
Métodos de enlace



Enlace simple (distancia mínima)
Enlace Completo (distancia máxima)
Enlace promedio







Método de Ward
1.
2.

•Calcular la suma de las distancias al cuadrado
dentro de los clusters
Agregar clusters con incremento mínimo en la
suma de cuadrados total

Método del centroide
–.

La distancia entre dos clusters se define como la
distancia entre los centroides (medias de los
cluster)

Cluster de K-medias
1.
2.

El número k de clusters es fijo
Se proporciona un conjunto inicial de k
“semillas” (centros deagregación)



3.

K primeros elementos
Otras semillas

Dado un cierto umbral, todas unidades son
asignadas a la más cercana semilla del grupo
4. Se calculan nuevas semillas
5. Volver a la etapa 3 hasta que no sea necesaria
una reclasificación
Las unidades pueden ser reasingnadas en etapas
sucesivas (partición óptima)

Métodos jerarquicos vs no
jerarquicos
Agrupamiento
jerarquico
• No hay decisiónacerca del número
de clusters
• Existen problemas
cuando los datos
contienen un alto
nivel de error
• Puede ser muy lento
• La decisión inicial
influye mucho (una
etapa única)

Agrupamiento no
jerarquico
• Más rápido, más fíable
• Es necesario especificar
el número de clusters
(arbitrario)
• Es necesario establecer
la semilla inicial
(arbitrario)

Método sugerido
1. Primero ejecutar un métodojerárquico para definir el número
de clusters
2. Luego utilizar el procedimiento kmedias para formar los clusters

Definición del número de
clusters: regla del codazo (1)
Agglomeration Schedule

n
Stage Number of clusters
0
12
1
11
2
10
3
9
4
8
5
7
6
6
7
5
8
4
9
3
10
2
11
1

Stage
1
2
3
4
5
6
7
8
9
10
11

Cluster Combined
Cluster 1 Cluster 2 Coefficients
4
7
.015
6
10
.708
8
9
.974
4
8
1.042
1
61.100
4
5
3.680
1
4
3.492
1
11
6.744
1
2
8.276
1
12
8.787
1
3
11.403

Stage Cluster First
Appears
Cluster 1 Cluster 2 Next Stage
0
0
4
0
0
5
0
0
4
1
3
6
0
2
7
4
0
7
5
6
8
7
0
9
8
0
10
9
0
11
10
0
0

Regla del codazo (2): El
diagram scree

12
10

Distance

8
6
4
2
0
11

10

9

8

7

6

5

Number of clusters

4

3

2

1

Validación del análisis
• Impacto de las semillas iniciales /
orden de los...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Clusters
  • clusters
  • Clusters
  • Los clusters
  • Clusters
  • Clústers
  • Clusters
  • Clusters

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS