BASES DE DATOS DOCUMENTALES
DOCUMENTALES
Los Sistemas de Gestión Documental (SGD) - Text
Retrieval Systems, en inglés- son un tipo de
programas muy conocidos en el ámbito de la
información y documentación, ya queestán
especialmente pensados para la gestión de
información textual y de documentos cognitivos.
Sus principales características se pueden sintetizar
en lo siguiente: disponen de un modelo deregistro
flexible (campos de longitud variable, campos
multivalor, etc.), facilitan el acceso a los registros a
través del fichero inverso, contienen un conjunto de
variadas prestaciones de recuperación dela
información,
y
están
dotados
de
diversos
instrumentos para el control terminológico.
Los sistemas de recuperación de textos se
desarrollaron, originalmente, para facilitar el
manejo de la grancantidad de información
científica que se produjo en la ultima mitad del
siglo XX. La necesidad de utilizar bases de
datos para acceder a libros, revistas, artículos,
nació en las bibliotecas.Inicialmente la información se guardaba como
en cualquier base de datos, entidades (libros,
revista, articulo), con un conjunto de atributos,
entre los cuales se incluye uno con palabras
clave sobre la materia otema tratado por la
entidad.
De esta manera no se podía acceder al
contenido del documento.
SOLUCIONES
ORACLE desarrollo el Context Catridge e
INFORMIX el Excalibur Databes.
Los textos se almacenancomo valores de una
columna de una tabla, como direcciones de
memoria física, o ubicaciones remotas (URL).
Clausula CONTAINS: En esta clausula se
pregunta si el texto asociado a la columna de
unatabla contiene una cierta palabra o
conjuntos de palabras ligadas entre si .
THESAURUS : Agrupación de palabras. Puede
ser por significado (sinónimos), relacionadas,
lematización.
Ejemplo:
Auto.Automóvil
Autómata
Automatismo
Automático
THESAURUS EN ORACLE
Broader term operators (BTO) ( operadores más amplios):
Se utilizan para ampliar una consulta que incluya
términos que se ha...
Regístrate para leer el documento completo.