ingeniero industrial

Páginas: 6 (1275 palabras) Publicado: 4 de junio de 2013
1

INTRODUCCIÓN

En la actualidad debido a la creciente disponibilidad de documentos en
formato electrónico, surge la necesidad de crear mecanismos que ayuden a su correcta
clasificación, lo que permitiría un mejor manejo de los mismos facilitando el proceso
de búsqueda y recuperación. Básicamente el concepto de clasificación de documentos
refiere al problema de encontrar para cadadocumento la clase a la que pertenece,
teniendo como criterio de agrupamiento la similitud existente entre cada uno de ellos.
Es por esta razón que se han creado diversas técnicas de aprendizaje automático que
permiten la generación de soluciones adaptadas a cada caso específico, facilitando la
tarea de clasificación.

El propósito de esta investigación es el desarrollo de un modelo que permita lacategorización automática de documentos, mediante el uso de técnicas de aprendizaje
no supervisado adaptadas a la clasificación de los trabajos de aplicación profesional,
que se encuentran alojados en el sistema de la biblioteca de la Universidad Nacional
Experimental del Táchira. Para esto se realizaron pruebas con dos tipos de algoritmos
de aprendizaje no supervisado por lo que fuenecesario el estudio de la naturaleza de
los datos con que se contaba para el desarrollo del modelo.

Para el desarrollo de esta investigación fue necesario el estudio de las
diferentes técnicas que han sido previamente validadas para la solución de problemas
de este tipo. Se implementó la metodología SEMMA que permitió un desarrollo
mediante fases que facilitó el entendimiento del comportamientode los datos en
determinados casos.

La presente investigación consta de cuatro capítulos que describen de una
forma más específica todos los aspectos de la misma. En el Capítulo 1, se plantea la
problemática en cuestión, los objetivos de la investigación, la justificación y el

2

alcance de la misma. En el Capítulo 2, se exponen los antecedentes que sirvieron de
soporte en esteproyecto y las bases teóricas necesarias para el entendimiento y
desarrollo del mismo. En el Capítulo 3, se plantean los aspectos generales de la
investigación y la metodología elegida para su desarrollo. El Capítulo 4, describe
todo el proceso de desarrollo y los resultados obtenidos en cada fase. El Capítulo 5 se
exponen los resultados arrojados en la investigación junto con las conclusiones y lasrecomendaciones planteadas por el autor

3

CAPÍTULO 1
FORMULACIÓN DEL PROBLEMA

1.1

Planteamiento del problema

En la actualidad las tecnologías de la información han facilitado de gran forma
el manejo de la misma, es por ello que en los últimos años se ha observado un rápido
crecimiento en la digitalización de documentos, por lo que se hace cada vez más
necesario que existanmecanismos eficientes para optimizar el proceso de búsqueda y
administración de estos recursos. Según un estudio realizado por la International
Data Corporation (IDC) se estima que “en la actualidad, menos de 10% de la
información de una organización es "clasificada", o calificada según su valor” [1].

La categorización de documentos es un proceso que consume mucho tiempo
debido al gran volumende información que se puede llegar a manejar, de allí surge la
necesidad de desarrollar tecnologías para una categorización automática. También se
debe tener en cuenta que el hecho de no tener los documentos agrupados de una
forma eficiente, genera cierta demora en el momento de realizar una búsqueda; esto
sin garantizar la localización del documento deseado, por lo que se hace necesario
unacorrecta organización de la información, de manera que su búsqueda y
recuperación se realice de la forma más correcta posible.

La categorización automática de documentos se comenzó a estudiar dentro del
área de “Recuperación de Información”, que es la rama de la informática que
investiga la búsqueda eficiente de información relativa, a un tema en particular en
grandes volúmenes de...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Ingeniero Industrial
  • Ingeniero Industrial
  • Ingeniero Industrial
  • Ingeniero Industrial
  • Ingeniero Industrial
  • Ingeniero Industrial
  • Ingeniero Industrial
  • Ingeniero Industrial

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS