La web

Solo disponible en BuenasTareas
  • Páginas : 26 (6321 palabras )
  • Descarga(s) : 0
  • Publicado : 12 de febrero de 2012
Leer documento completo
Vista previa del texto
Pág. 113-126, ISSN impreso: 1666-244X, ISSN electrónico: 1852-7310

Subjetividad y ProceSoS cognitivoS, Vol. 14, Nº 2, 2010

NUEVOS RETOS EN LA WEB 2.0* TExT SuMMARIES: NEW ChALLENgES IN WEb 2.0
Elena Lloret y Manuel Palomar** Resumen Este artículo presenta un estudio preliminar de los fenómenos presentes en la Web 2.0, concretamente en blogs y cómo se reflejan en los correspondientesresúmenes generados. El principal objetivo es cuantificar en qué medida dichos fenómenos están presentes tanto en los blogs como en los resúmenes. La presencia de estos fenómenos en los resúmenes tiene como consecuencia directa la disminución de la calidad de estos, en criterios como la corrección gramatical o la coherencia de los resúmenes. Los resultados preliminares obtenidos muestran que los nuevosgéneros textuales derivados de la Web 2.0 contienen un alto número de rasgos lingüísticos típicos que es necesario tratar con métodos y herramientas adecuadas para que dichos rasgos no se propaguen a otras tareas del Procesamiento del Lenguaje Natural, en concreto, en este estudio, a los resúmenes de textos. Además, se proponen posibles soluciones para abordar el problema, con la finalidad de ayudara que la calidad de los resúmenes no se vea afectada debido a la presencia de estos fenómenos. Palabras clave: resúmenes de texto, corrección gramatical, rasgos lingüísticos. Summary This article presents a preliminary study of the phenomena present in Web 2.0, specifically in blogs and how they are reflected in the corresponding generated summaries. The main objective is to provide a measure ofthe occurrence of these phenomena in both blogs and summaries. The presence of these phenomena in the summaries has as a direct consequence in their diminishing quality in terms of grammar accuracy or coherence. Preliminary results obtained show that the new
* Esta investigación ha sido financiada a través de una beca FPI (BES-2007-16268) concedida por el Ministerio de Ciencia e Innovación delGobierno de España, que a su vez está adscrita al proyecto TEXT-MESS (TIN2006-15265-C06-01) también financiado por el Gobierno de España. Además, ha sido parcialmente financiada por el proyecto PROMETEO “Desarrollo de Técnicas Inteligentes e Interactivas de Minería de Textos” (2009/119) de la Generalitat Valenciana. ** Grupo de Investigación “Procesamiento del Lenguaje Natural y Sistemas deInformación”, Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Dirección: Apartado de correos 99, E03080, Alicante, España. E-mail: a elloret@dlsi.ua.es, mpalomar@dlsi.ua.es.

RESúMENES DE TExTOS:

“2010, 14”

113

Subjetividad y ProceSoS cognitivoS, Vol. 14, Nº 2, 2010

Pág. 113-126, ISSN impreso: 1666-244X, ISSN electrónico: 1852-7310

text genres derived from Web2.0 contain a great quantity of linguistic typical traits which need to be tackled with appropriate tools for these traits not to propagate to other tasks of Natural Language Processing, in particular, in this study, to the text summaries. In addition, possible solutions to address the problem are proposed, in order that the quality of the summaries might remain unaffected by the occurrence ofthese phenomena. Key words: text summaries, grammar accuracy, linguistic traits. 1. Introducción Con el nacimiento de la Web 2.0 (o Web social) aparece una serie de aplicaciones en las que el usuario es el principal protagonista y cuyo papel es esencial. Dichas aplicaciones, como por ejemplo las redes sociales, los blogs, foros, o las wikis, fomentan la colaboración y el intercambio de informaciónentre comunidades de usuarios. Por otro lado, el Procesamiento del Lenguaje Natural (PLN) agrupa una serie de tareas (recuperación de información, búsqueda de respuestas, clasificación de textos, etc.) que ofrecen al usuario mecanismos computacionalmente efectivos para facilitar la interrelación hombre-máquina y que permiten una comunicación menos rígida que los lenguajes formales (Moreno...
tracking img