Combinación De Métodos Factoriales Y De Análisis De Conglomerados En R: El Paquete Factoclass

Páginas: 14 (3335 palabras) Publicado: 31 de mayo de 2012
Revista Colombiana de Estadística Diciembre 2007, volumen 30, no. 2, pp. 231 a 245

Combinación de métodos factoriales y de análisis de conglomerados en R: el paquete FactoClass
Combination of Factorial Methods and Cluster Analysis in R: The Package FactoClass Campo Elías Pardo a , Pedro César Del Campo b
Departamento de Estadística, Facultad de Ciencias, Universidad Nacional de Colombia,Bogotá, Colombia

Resumen Se presenta el paquete de R FactoClass, donde se implementa la estrategia descrita en Lebart et al. (1995), que combina métodos factoriales con análisis de conglomerados, en la exploración multivariada de tablas de datos. Se utilizan funciones de ade4 (Chessel et al. 2004) para realizar el análisis factorial de los datos y de stats para el análisis de conglomerados. Secrean funciones para tareas específicas y se modifican algunas de las existentes. Se describen los pasos para crear FactoClass en ambiente Windows y se ilustra el uso del paquete con un ejemplo. Palabras clave: software estadístico, análisis multivariado, análisis en componentes principales, análisis de correspondencias, K-medias, clasificación A jerárquica, L TEX. Abstract The new R packageFactoClass to combine factorial methods and cluster analysis is presented. This package is implemented in order to perform a multivariate exploration of a data table according to Lebart et al. (1995). We use some ade4 functions (Chessel et al. 2004) to perform the factorial analysis of the data and some stats functions in R to perform cluster methods. Some new functions are programmed to make specifictasks and another old ones are modified. We describe the implementation of FactoClass in the Windows environment and illustrate its use with an example. Key words: Statistical software, Multivariate analysis, Principal components analysis, Correspondence analysis, K-means clustering, Hierarchical A clustering, L TEX.
a Profesor b Estadístico.

asociado. E-mail: cepardot@unal.edu.co E-mail:pcdelcampon@unal.edu.co

231

232

Campo Elías Pardo & Pedro César Del Campo

1. Introducción
En este documento el término clasificación se utiliza como sinónimo de análisis o formación de conglomerados o clasificación no supervisada. En ningún momento hace referencia a la clasificación supervisada o discriminación, la cual no está incluida en el paquete construido. Para el análisis de una tablade datos haciendo uso de métodos multivariados, Lebart et al. (1995) presentan una estrategia que consiste en realizar primero un análisis factorial según la naturaleza de los datos y luego una clasificación basada en un algoritmo mixto: clasificación jerárquica con el método de Ward y agregación alrededor de centros móviles (K-medias). Finalmente se obtiene una partición del conjunto de datos y lacaracterización de cada una de las clases, según las variables activas e ilustrativas, ya sean cuantitativas o cualitativas. Para la caracterización de las clases se utilizan los valores test, que son índices descriptivos construidos siguiendo la metodología de pruebas de hipótesis, pero sin el objetivo de hacer inferencias. La ordenación de los valores test dentro de cada clase permite obtenerlas variables continuas que la caracterizan positivamente, en el sentido de que la media de la clase es suficientemente mayor de la media global, o negativamente cuando la media de la clase es inferior. Para las categorías de variables nominales, la ordenación permite obtener aquellas categorías cuya proporción dentro de la clase se diferencia lo suficiente de la proporción global, ya sea porque esmayor (valor test positivo) o menor (valor test negativo). Para la puesta en práctica de la estrategia mencionada utilizando el lenguaje R (R Development Core Team 2007a) se programa el paquete denominado FactoClass, el cual utiliza funciones de ade4 (Chessel et al. 2004) para realizar el análisis factorial de los datos y de stats para los métodos de clasificación. Se programan las funciones...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Metodo De Analisis Factorial
  • Analisis factorial y de conglomerados
  • ANÁLISIS DE CONGLOMERADOS
  • metodo factorial
  • Analisis factorial
  • Analisis factorial
  • Analisis factorial
  • Análisis factorial

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS