Tareas

Solo disponible en BuenasTareas
  • Páginas : 6 (1390 palabras )
  • Descarga(s) : 0
  • Publicado : 27 de marzo de 2011
Leer documento completo
Vista previa del texto
CLUSTER ANALYSIS El Análisis Cluster en la investigación de mercados es usado para la segmentación de mercados; comprensión del comportamiento del comprador (identificación de grupos de compradores homogéneos para analizar el comportamiento de cada grupo por separado); identificar oportunidades para nuevos productos, seleccionar mercados de prueba, reducción de datos con el fin de facilitar elmanejo de la información. El análisis Cluster es un conjunto de técnicas utilizadas para clasificar los objetos o casos en grupos homogéneos llamados conglomerados (clusters) con respecto a algún criterio de selección predeterminado. Los objetos dentro de cada grupo (conglomerado), son similares entre sí (alta homogeneidad interna) y diferentes a los objetos de los otros conglomerados o clusters(alta heterogeneidad externa). Es decir, que si la clasificación hecha es óptima, los objetos dentro de cada cluster estarán cercanos unos de otros y los cluster diferentes estarán muy apartados. Por ello, es también conocido como análisis de clasificación o taxonomía numérica. Pasos del Análisis de Conglomerados: a) Formulación del problema: Lo más importante de la formulación del problema, es laselección de las variables en las que se basará la agrupación. El conjunto de variables seleccionado debe describir la similitud entre los objetos en términos relevantes para el problema de investigación de mercados. Estas variables se seleccionan en base a investigaciones anteriores, la teoría o una consideración de las hipótesis que se prueban. b) Selección de una medida de similitud Como elconglomerado agrupa objetos similares, se necesita una medida para evaluar las diferencias y similitudes entre objetos. La Similaridad (similitud) es una medida de correspondencia o semejanza entre los objetos que van a ser agrupados. Lo más común es medir la equivalencia en términos de la distancia entre los pares de objetos. Así, los objetos con distancias reducidas entre ellos son más parecidosentre sí que aquellos con distancias mayores y se agruparán por lo tanto, dentro del mismo cluster. Los tres métodos usados en la medición de la similitud son: las medidas de correlación y las medidas de distancia (usadas cuando se tienen variables métricas) y las medidas de asociación (usadas para variables categóricas). c) Estandarización de datos Como las medidas de distancia son sensibles a ladiferencia de escalas o de magnitudes hechas entre variables es necesaria la estandarización de datos para evitar que las variables con una gran dispersión tengan un mayor efecto en la similaridad.

La forma de estandarización más común es restarle a cada observación la media de la variable y este resultado dividirlo entre su desviación estándar. Lo que se consigue con ello es eliminar lasdiferencias introducidas por la diferencias de escalas de las distintas variables (atributos) usados en el análisis. Luego de seleccionar las variables y calcular las similaridades, se empieza con el proceso de agrupación, lo primero es seleccionar el algoritmo de agrupación para formar los grupos (clusters) y luego determinar el numero de grupos que se van a formar. Estos dos procedimientos dependeránde los resultados que se obtengan y la interpretación derivada de ellos. Los dos tipos de procedimientos de agrupación son los jerárquicos y los no jerárquicos. El conglomerado jerárquico se caracteriza por el desarrollo de una jerarquía o estructura de árbol (dendograma). De este modo, los clusters están formados solamente por la unión de los grupos existentes, así cualquier miembro de un clusterpuede trazar su relación en un irrompible sendero que comenzaría con una simple relación. Los métodos jerárquicos pueden ser por Aglomeración o por División. Los métodos de conglomerados más usados en la investigación de mercados son el método de Enlace, método de varianza y el método Centroide. Entre los métodos de conglomerados no jerárquicos más usados se conocen como Agrupación K medias e...
tracking img