Legislacion documental

Solo disponible en BuenasTareas
  • Páginas : 6 (1350 palabras )
  • Descarga(s) : 7
  • Publicado : 24 de agosto de 2010
Leer documento completo
Vista previa del texto
2. LOS DOCUMENTOS DE TEXTO Y SU ESTRUCTURA

2.1 INTRODUCCIÓN Todo proceso del conocimiento, de alguna forma, necesita ser comunicado o transmitido y el texto es precisamente la principal manera en que esto puede ser logrado [1]. Pero antes de definir lo que es un texto, se hace necesario introducir el concepto de documento, en la medida que son los documentos quienes pueden contener un textoespecífico. En definitiva, un documento se considera aquí como una unidad de información digitalizada, con un contenido específico; normalmente contiene texto codificado digitalmente, aunque también es usual referirse a documentos que contienen otro tipo de medios como audio y video [1]. Un documento tiene una estructura y una sintaxis específica que es definida por la aplicación o por la personaque lo crea. También contiene una semántica determinada y adicionalmente, puede tener asociado un estilo de presentación el cual define la manera en que un documento puede ser mostrado en pantalla o en papel [1]. La siguiente gráfica (fig 2.1.) resume los conceptos anteriores:

Sintaxis

Texto + Estructura + otros medios

Estilo de presentación

Semántica
Fig 2.1. Características de undocumento [1]

Luego de introducir el concepto de documento se define un texto como un conjunto de símbolos consecutivos con una sintaxis determinada que comunica algún conocimiento (semántica) y se presenta con algún estilo específico. Ahora bien, de acuerdo a los conceptos definidos, se puede notar que un documento puede contener o no una estructura asociada, es aquí donde se habla de “documentosestructurados” para el primer caso y “Documentos no estructurados” para el segundo caso.

Se puede encontrar semiestructurados”.

incluso

otra

clasificación

intermedia:

“Los

documentos

Los documentos normalmente hacen uso de los “metadatos” para definir su estructura. Un metadato es en esencia un conjunto de datos que describen el propio documento de texto al que estánasociados (ver sección 2.3). Los metadatos son expresados en lo que se conoce como “lenguajes de marcado ”, aunque no siempre estos lenguajes de marcado se utilizan para describir metadatos. En este capitulo se exponen entonces las características de los documentos estructurados y no estructurados, más tarde se amplía el concepto de metadato y al final se exponen los lenguajes de marcado que son unaherramienta para la aplicación de metadatos.

2.2 LA ESTRUCTURA DE LOS DOCUMENTOS DE TEXTO Los documentos en general se pueden tratar como unidades con cierta información que debe ser transmitida. Un documento puede contener diferentes tipos de datos como texto, audio o video; y cada uno de estos tipos de datos puede ser manipulado de diferentes formas, pero en este documento solo se pretendeexponer las características de los documentos que contienen texto. Un documento de texto puede presentar la información en distintas formas. Como lo expresa S. Abitebou [2]: “Los datos pueden residir de diferentes maneras, desde datos no estructurados en sistemas de archivos hasta datos altamente estructurados en los sistemas de bases de datos relacionales”. Esta referencia a la estructura de un textoexpone la existencia de un grado de “orden” para contener la información. Este “orden” o estructura es inherente a todo documento y permite efectuar una clasificación de los documentos de texto en estructurados, semiestrucurados y no estructurados. Se definen entonces los diferentes tipos de documentos de texto en cuanto a su estructura: Estructurados: Contienen información tabulada o delimitadanaturalmente, está grabada en un archivo o en una tabla de una base de datos. [3] Semiestructurados: Datos que carecen de rigidez, esquema regular, o cambios constantes en el esquema. [2] No estructurados: Cualquier tipo de texto que esté en una representación tabular o formato delimitado. [3] Esta primera definición de los diferentes tipos de documentos de texto deja entrever una serie de...
tracking img