14
Patrones lingüísticos para
la búsqueda
de información
conceptual en
el corpus textual especializado de la cerámica TXTCerama
Autora
Victoria SOLER PUERTES
Patrones lingüísticos para la búsqueda de información conceptual en el corpus
textual especializado de la cerámica TXTCerama
1. INTRODUCCIÓN
A lo largo de estas últimas décadas se ha producido unaumento de la necesidad del estudio de la
lingüística de corpus con fines investigadores. Por eso, los corpus se han convertido en un elemento
de referencia que permite estudiar de manera empírica el comportamiento de la lengua basándose en
datos reales. La tecnología también ha tenido un papel importante en el desarrollo de esta disciplina
ya que, gracias a ella, es posible tratar grandes volúmenes deinformación de manera objetiva y precisa. Estas ventajas electrónicas para el tratamiento de corpus afectan tanto a su constitución como a
su procesamiento y explotación.
Este trabajo se enmarca en el proyecto de investigación TXTCeram: Extracción semiautomática y
análisis conceptual formal de términos de la cerámica a partir de un corpus electrónico. Su eficacia y
utilidad en la mediaciónlingüística cuya finalidad es la creación de un corpus electrónico del campo
de la cerámica industrial para su posterior extracción terminológica.
Nuestro principal objetivo es encontrar patrones lingüísticos que ayuden a localizar las relaciones
semánticas que expresen metonimia en el corpus de la cerámica TXTCeram. Gracias a dichos patrones,
se podrá automatizar la búsqueda de relaciones conceptuales enel corpus para la creación de bases de
conocimiento. Es decir, al introducir en un corpus textual electrónico una serie de estructuras lingüísticas, estas estructuras nos dan información sobre las relaciones semánticas (hiponimia e hiperonimia,
metonimia, sinonimia, etc.) que existen entre los conceptos del corpus.
1.1. LOS CORPUS ELECTRÓNICOS: UNA HERRAMIENTA PARA LA INVESTIGACIÓN
Según Sinclair(1991: 171), un corpus es «a collection of naturally-occurring language text, chosen
to characterize a state or variety of a language». Sin embargo, esta definición puede resultar hoy en
día un tanto obsoleta porque un corpus implica algo más que simplemente una colección de textos
auténticos. Por esto mismo, a esta definición cabría añadirle una serie de aspectos fundamentales que
determinan lavalidez del corpus con el que se va a trabajar. En primer lugar, en la creación de un
corpus hay que tener en cuenta la representatividad de los textos elegidos con respecto a la lengua que
se quiere investigar y, en segundo lugar, aunque no menos importante, es muy relevante indicar si el
corpus está disponible en formato electrónico.
Sánchez Gijón (2003: 187-193) en su tesis doctoral realiza unadetallada clasificación de los distintos tipos de corpus según las diferentes características y finalidades para las que hayan sido creados.
Así, adoptamos la siguiente tipología de Sánchez Gijón según:
- Su modalidad → oral o escrito.
- El etiquetado → no etiquetado o etiquetado.
- Aspectos cronológicos → sincrónico/diacrónico, periódico o cronológico.
- Aspectos temáticos → general yespecializado.
- La cantidad de información y su distribución → textuales, de referencia, equilibrados, extensos o
monitor.
- La información extralingüística → documentado o no documentado.
- Las lenguas implicadas → monolingüe, bilingüe o multilingüe.
- La relación entre las lenguas → comparable, paralelo/alineado o de traducciones libres.
- Su especialidad → con finalidad especial o ad hoc.
Patroneslingüísticos para la búsqueda de información conceptual en el corpus
textual especializado de la cerámica TXTCerama
La principal razón por la que la lingüística de corpus se ha convertido en una herramienta indispensable es por su capacidad de aplicación en distintos campos de estudio como son la terminología,
la lexicografía o la traducción automática, entre otros. Esto se debe a que no existe...
Regístrate para leer el documento completo.