Un Recurso Para La Resolución De La Anáfora
Montserrat Arévalo
CLiC
montse@clic.fil.ub.es
La resolución de la anáfora es uno de los problemas más importantes en PLN. Entre losdistintos tipos de expresiones anafóricas existentes, nosotros nos centraremos en los sintagmas nominales definidos. Presentaremos el MICE, Módulo de Identificación y Clasificación de Entidades, unagramática implementada en TACAT, compuesta por una serie de reglas sintácticas que reconocen sintagmas definidos referidos a entidades con nombre (EN). Expondremos el formalismo utilizado para laconstrucción de la gramática, explicando la metodología llevada a cabo para su creación de las reglas; las líneas de trabajo futuras y las contribuciones que un módulo como éste puede aportar a la resolución dela anáfora.
MICE forma parte del sistema de tratamiento de información textual de CLiC-TALP[1]. Actúa con posterioridad al análisis morfológico y resuelve, de cara al análisis sintácticosuperficial, el tratamiento de sintagmas nominales definidos que hacen referencia a EN. La gramática identifica y recategoriza EN que han sido detectadas sólo parcialmente en los procesos anteriores,ampliando el marco de análisis al sintagma nominal completo que hace referencia a una EN[2].
En nuestro sistema tenemos en cuenta información morfológica y semántica. Los sintagmas que se van areconocer con MICE se caracterizan por contener un nombre propio, ya detectado en procesos anteriores, o una palabra disparadora. Las palabras disparadoras son aquellas que suelen aparecer en el contexto delas entidades con nombre y que indican que a continuación, probablemente, haya un candidato a EN Hemos asociado estas palabras a una clasificación tipológica de entidades, organizada de formajerárquica, por lo que a la vez que facilitan la detección de EN, también permiten asignarles un tipo semántico.
A partir de esta clasificación de entidades, estamos llevando a cabo un estudio de...
Regístrate para leer el documento completo.