Corpus De Diagramas Uml Para La Solución De Problemas De Completitud En Ingeniería De Software
Rala
REVISTA Universidad EAFIT
Vol. 44. No. 151. 2008. pp. 93-106
UNC-Corpus
Corpus de diagramas UML para la solución de
problemas de completitud en ingeniería de software*
Carlos M. Zapata J.
Ph. D. en Ingeniería de Sistemas. Profesor Asociado,
Escuela de Sistemas, Facultad de Minas, Universidad
Nacional de Colombia, Sede Medellín.
Integrante del Grupo de investigación enLenguajes
Computacionales de la misma institución.
cmzapata@unal.edu.co
Juan C. Hernández P.
Ingeniero de Sistemas e Informática, Universidad Nacional de
Colombia, Sede Medellín.
Integrante del Grupo de investigación en Lenguajes
Computacionales de la misma institución.
jcherna0@unalmed.edu.co
Raúl A. Zuluaga
Ingeniero de Sistemas e Informática, Universidad Nacional de
Colombia, SedeMedellín.
Integrante del Grupo de investigación en Ingeniería de
Software de la misma institución.
razulua0@unalmed.edu.co
Recepción:
*
10
de
abril
de
2008
I
Aceptación:
18
de
junio
de
2008
Este artículo se elaboró en el marco del proyecto “Un modelo de diálogo para la generación automática de especificaciones en
UN-Lencep”, financiado por la DIME(División de Investigación de la Sede Medellín-Universidad Nacional de Colombia.
94
REVISTA Universidad EAFIT. Vol. 44. No. 151 | julio, agosto septiembre 2008
Resumen
Los corpus computacionales se utilizan como apoyo en el
procesamiento del lenguaje natural (PLN) para resolver problemas
de desambiguación, traducción y generación automática de textos,
entre otras funciones. Paraello, se explota la característica principal
de los corpus (el hecho de que poseen usos comprobados de un
lenguaje) y se combina con análisis estadísticos y métodos
de
extracción de información basados en redes neuronales o algoritmos
genéticos. En ingeniería de software, no existe evidencia del uso de
corpus computacionales de diagramas. Un uso similar lo constituyen
los repositorios dediagramas, que suelen manejar ejemplos reales
Palabras Clave
de diagramas, especialmente para reutilización, pero sin usar la
Corpus anotado
estadística o los métodos heurísticos para la extracción de información.
Diagramas UML
En este artículo, se propone UNC-Corpus, una herramienta para
XMI
el manejo de un corpus de diagramas construidos en el Lenguaje
RepositorioUnificado de Modelado UML, que aplica técnicas tradicionales de
Metamodelado
PLN en la solución de problemas de completitud en la ingeniería de
PLN
software.
Extracción de información
UNC-Corpus: a UML-diagram corpus to solve
completeness problems in software engineering*
Abstract
Computational corpora are used as tools in Natural Language
Processing (NLP) to solve disambiguation,translation and automated
text generation problems. In order to complete these tasks, the main
feature of computational corpora (the fact that they have proven uses of
a language) is combined with statistical analysis along with information
extraction methods based on neural networks or genetic algorithms. In
software engineering, there is no evidence supporting the use of diagramcomputational corpora. Diagram repositories have a similar application
working with real examples of diagrams (mainly for reuse purposes), but
without using neither statistics nor heuristic methods for information
extraction. In this paper, the UNC-Corpus, a tool for managing a
corpus of UML (Unified Modelling Language) diagrams, which applies
NPL traditional techniques in order to solve completenessproblems in
software engineering, is proposed.
*
Key words
Annotated corpus
UML diagrams
XMI
Repository
Metamodelling
NLP
Information extraction
T his article was prepared in the framework of the project “A dialogue model for the automated generation of specifications in UNLencep”, funded by DIME (Research Division, Branch Medellin-National University of Colombia).
ZAPATA J.,...
Regístrate para leer el documento completo.