cluster

Páginas: 11 (2502 palabras) Publicado: 24 de septiembre de 2014
Se desea encontrar patrones de comportamiento entre las distintas actividades de Hungría, en relación con las ratios PROD_EMP, VAB_EMP y CONS_PROD.
Para ello, se aplica la técnica multivariante del Análisis Cluster, con objeto de agrupar a dichas actividades en 5 conglomerados lo más homogéneas posible, atendiendo a la similitud en las ratios señaladas. En concreto, se pide resolver lassiguientes cuestiones:

El Análisis cluster o de conglomerados es una técnica de análisis multivariantes de interdependencia. No distingue entre variables dependientes e independientes, sino que, dado un conjunto de variables analiza la información contenida en ellas para clasificar a los elementos según su similitud en conglomerados. Su finalidad es dividir un conjunto de objetos de forma que losperfiles de los objetos de un mismo grupo sean lo más similares posible entre sí (exista la menor distancia posible) y lo de los objetos de cluster diferentes sean distintos (exista la mayor distancia).

Se trata de un análisis meramente descriptivo, que no tiene bases estadísticas sobre las que se puedan deducir inferencias para la población a partir de una muestra.

En cluster existen dos tiposde procesamientos, los cuáles aplicaremos a lo largo del trabajo, se dominan:
Procesamiento jerárquico.
Procesamiento no-jerárquico.

1. DETERMINAR LA COMPOSICIÓN DE LOS 5 CONGLOMERADOS INDICADOS MEDIANTE LA APLICACIÓN DEL MÉTODO JERÁRQUICO DE VINCULACIÓN INTER-GRUPOS Y UTILIZANDO LA DISTANCIA EUCLÍDEA AL CUADRADO COMO MEDIDA DE PROXIMIDAD. MOSTRAR ASIMISMO GRÁFICAMENTE, A TRAVÉS DELDENDOGRAMA, EL PROCESO DE FORMACIÓN DE ESTOS CONGLOMERADOS.

En primer lugar aplicaremos el procesamiento jerárquico. Este procesamiento intenta identificar grupos relativamente homogéneos basándose en las características que hemos seleccionado previamente, mediante un algoritmo que comienza con cada caso en un conglomerado diferente y combina éstos hasta solo quedar uno. Las medidas de clasificación ydistancia a considerar se aplican según los datos considerados en el análisis. En nuestro caso utilizaremos "inter-grupos” que es un método de clasificación, (se basa en valores medios, la distancia entre 2 conglomerados se calcula tomando la media de las distancias entre cada elemento de uno y otro conglomerado los dos grupos que se encuentran a una menos distancia se funcionan para formar unnuevo cluster o conglomerado) y " distancia euclídea al cuadrado" que es un método de distancia.

Tenemos la opción de estandarizar las variables pero en este caso no es necesario porque dichas variables no hay que pasarlas a unidades adimensionales porque están expresadas en escala (opción de escala en vista de datos).




Existen dos tipos de conglomerados jerárquicos:
-El aglomerativo (unconglomerado distinto para cada observación, se van fusionando para alcanzar un único).
-El de divisas (conglomerado que engloba a todas las observaciones y se va subdividiendo hasta que cada observación pertenece a un cluster diferente).

En nuestro caso usaremos el aglomerativo.

Resumen del procesamiento de los casos
Casos
Válidos
Perdidos
Total
N
Porcentaje
N
Porcentaje
NPorcentaje
59
100,0
0
,0
59
100,0





Historial de conglomeración
Etapa
Clúster combinado
Coeficientes
Primera aparición del clúster de etapa
Etapa siguiente

Clúster 1
Clúster 2

Clúster 1
Clúster 2

1
340
352
,139
0
0
19
2
334
350
,236
0
0
4
3
307
308
,268
0
0
10
4
297
334
1,071
0
2
9
5
332
333
1,335
0
0
16
6
338
353
1,524
0
0
42
7322
329
1,861
0
0
21
8
327
331
2,232
0
0
11
9
297
328
2,813
4
0
18
10
307
335
2,868
3
0
25
11
303
327
4,490
0
8
38
12
317
324
5,254
0
0
19
13
302
330
5,339
0
0
20
14
306
318
6,476
0
0
27
15
339
351
7,383
0
0
24
16
332
349
7,729
5
0
25
17
299
300
7,881
0
0
23
18
297
325
8,095
9
0
28
19
317
340
9,440
12
1
30...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Cluster
  • cluster
  • Cluster
  • Cluster
  • Cluster
  • CLUSTER
  • Cluster
  • Cluster

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS