Estudio de textos - caso de ejemplo discursos presidenta

Solo disponible en BuenasTareas
  • Páginas : 20 (4861 palabras )
  • Descarga(s) : 4
  • Publicado : 27 de octubre de 2009
Leer documento completo
Vista previa del texto
CARTOGRAFIADO DE TEXTOS. PROTOCOLO DE EXPLORACIÓN Y VISUALIZACIÓN DE DATOS TEXTUALES APLICADOS A LA MINERÍA DE TEXTOS
Césari, Matilde Inés1. 1. Cátedra de Inteligencia Artificial, Universidad Tecnológica Nacional – Facultad Regional Mendoza, http://ai.frm.utn.edu.ar/micesari/indexweb.html, matilde.cesari@speedy.com.ar

RESUMEN. Trabajo de Tesis de Magíster en Ingeniería del software eIngeniería del Conocimiento. El análisis clásico de datos textuales no es económico y consume muchos recursos en especialistas y tiempo. Esta situación ha motivado el desarrollo de nuevas estrategias metodológicas con técnicas y paradigmas existentes, y la integración de los métodos de análisis que faciliten el proceso de exploración de datos textuales. A lo largo del tiempo distintos métodos han surgidocon el objeto de explotar la información de tipo textual. Algunos como la ordenación alfabética, las ediciones de concordancias, índices y glosarios son muy antiguos. Otros mas recientes han aparecido gracias al desarrollo de técnicas estadísticas como el análisis de datos multivariado. Los métodos presentados en este trabajo facilitan la exploración, la gestión y la descripción de corpus de grantamaño, permiten derivar información de ellos desde un punto de vista estadístico y poner de manifiesto sus rasgos estructurales. En objetivo de este trabajo es definir un marco teórico-metodológico que presente en forma sistemática la integración de las distintas técnicas estadísticas de análisis léxico y técnicas estadísticas de exploración multivariada; y utilizarlas en el trazado de unprotocolo o guía para la exploración y diagnóstico por imagen de datos textuales. Además, experimentar con las estrategias metodológicas que implican la construcción del Cartografiado de Texto, a Casos de Ejemplo. Palabras clave: minería de texto, infometría, lexicomtría, análisis Multivariado

1 Introducción
En otros trabajos [1] se exhibió estrategias metodológicas para la exploración y visualizaciónde datos estructurados de tipo cuantitativo y cualitativo para descubrir conocimiento a partir de la información contenida en ellos, también a través de casos de ejemplos se demostró que el Cartografiado de datos es una herramienta clave para la minería e datos. En este trabajo la atención se centra en datos no estructurados de tipo textuales que provienen de documentos1 generalmente escritos enlenguaje natural.

1

Entre los textos se encuentran las opiniones de respuestas abiertas de encuestas, el tratamiento de estos tipos de texto, se enriquece con la información complementaria obtenida con las respuestas al cuestionario estructurado.

Estos tipos de datos representan un tesoro muy valioso por su abundancia en conocimiento, difícil de encontrar por su naturaleza noestructurada2 . La minería de texto provee dos grandes fases (Fig.1) para el descubrimiento de conocimiento de grandes volúmenes de datos no estructurados: la “exploración de la información” y la “interpretación de la información”.

Fig. 1. Exploración y diagnóstico de datos textuales La primera es la parte objetiva, el procesamiento casi automático de grandes volúmenes de datos textuales para extraerinformación y transformarla en un formato adecuado para su análisis. Recopilar datos, organizarlos e incluso analizarlos requiere el análisis de hechos estadísticos, existe la necesidad de procesos sistemáticos que permitan obtener la información estructurada para su fácil análisis. La segunda es la parte subjetiva y manual, es el análisis de la información en la perspectiva de los conocimientos deldominio, de que dispone el analista sobre el problema que estudia, determina la presentación de los resultados. Identificar, estructurar y utilizar la información, requiere aplicar la intuición y la sabiduría propia del ser humano. La capacidad de interpretar esos datos es lo que provoca que la información se convierta en Conocimiento [2]. Existe la necesidad de una mejor visualización de la...
tracking img