CLAFISICACIÓN DE SISTEMAS
INTRODUCCIÓN: El sistema de clasificación informática de ACM (CCS) es un sistema de clasificación jerárquico principal utilizado para indexar y clasificar la ACM publica literatura. La versión actual de CCS de la ACM es la versión de 1998. Su marco básico fue fundado en 1982, con revisiones en 1983, 1987, 1991 y 1998. La jerarquía de CCS son seleccionados y organizados por expertos dedominio. Reflejan las principales áreas y temas del campo de la informática, y pueden ser utilizados como un resumen y guía de navegación para el campo.
La CCS ACM original fue diseñada para cumplir con la clasificación y la indización necesidad del entorno de la biblioteca tradicional en papel. Mientras que la ACM ha trasladado con éxito a la ambiente de biblioteca digital, su CCS sigue siendouna simple lista jerárquica de términos tema predefinido que no aprovechan el entorno digital y en red. El Comité de actualizado 1998 CCS ha reconocido esta limitación e informó que alguna estructura CCS "no coincide bien la literatura y temas principales de la disciplina hoy". Esto es en parte debido a que la lista de términos de CCS está completamente aislada de la literatura y la estructurajerárquica era estática y no directamente reflejen el contenido de la ACM publica literatura. Estamos tratando de explorar nuevos roles y nuevas aplicaciones de la ACM en el entorno digital. Hacia esta meta, tenemos permiso para descargar un conjunto de datos 10 años ACM digital library, incluyendo las categorías de clasificación y las descripciones bibliográficas de todos los documentos publicadosentre 1999 y 2009, diez años después de la versión actual de CCS está en uso. Los datos descargados están en formato XML y roto en 31 archivos diferentes. Hay un total de 333.923 expedientes bajo análisis, y se utilizaron los descriptores primarios y secundarios de CCS en el análisis de los términos de sujeto y de sus usos. Para cada término de la asignatura, contamos cuantas veces ha sido asignado alos documentos, con qué frecuencia se ha utilizado como descriptor principal de un documento, con qué frecuencia ha ocurrido conjuntamente con otros términos, etc..
Análisis de términos de CCS de ACM El esquema de clasificación de la CCS incluye un árbol jerárquico de tres niveles de cifrado conceptos o categorías más un cuarto nivel de descriptores de asunto sin codificar. El nivel superiorincluye 11 categorías codificadas de la A K. A través de algunos análisis de frecuencia y co-ocurrencia del término, observamos que: CCS la estructura de árbol es un árbol jerárquico relativamente simple, no balanceado. Algunas categorías (es decir, categoría A, E y J) tienen un limitado número de subnodos (4, 7 y 9 respectivamente) y no han sido utilizados a menudo en los últimos 10 años. Las...
Regístrate para leer el documento completo.