Modelo De Clasificación De Tópicos Para Comparación De Contenidos Entre Microblogs Y Medios De Prensa Online

Páginas: 21 (5212 palabras) Publicado: 7 de agosto de 2012
pontificia universidad CATÓLICA de VALPARAÍSO
facultad de INGENIERÍA
escuela de INGENIERÍA INFORMÁTICA

modificación y mejora de un modelo de clasificación de tópicos para comparación de contenidos entre microblogs y medios de Prensa online

bruno chandía sEPúLveda

Profesor Guía: Rodrigo Alfaro Arancibia
Profesor Co-Referente: Cristian Rusu Alexandru

Carrera: Ingeniería Civil enInformática.

20 de Abril del 2012
Índice
Resumen ii
Lista de Figuras iii
Lista de Tablas iv
1. Introducción 1
1.1 Descripción del Problema 2
1.1.1 Twitter: Nuevo Medio Periodístico 2
1.1.2 Estadísticas 2
1.1.3 Factibilidad de la Investigación e Implementación 4
1.2 Metodología del Trabajo 4
2. Definición de Objetivos 6
2.1 Objetivo General 6
2.2 Objetivos Específicos 63. Plan de Trabajo 7
4. Antecedentes 8
4.1 Twitter 8
4.1.1 Características Principales de Twitter 8
4.1.1.1 Los Seguidores o Followers 8
4.1.1.2 Los Hashtags 8
4.1.1.3 Retweet 8
4.1.1.4 Menciones 9
4.2 Clasificación de Textos 9
4.2.1 Definición de Clasificación de Textos 9
4.2.2 Preparación de los Datos (Pre-procesamiento) 10
4.2.3 Palabras Vacías 10
4.2.4 Steamming 10
i.Asignación de pesos 11
ii. Resumen Proceso 11
4.3 Modelos de Tópicos (Topic Models) 12
4.3.1 Posibles Aplicaciones 12
4.4 Latent Dirichlet Allocation 14
5. Conclusiones 16
6. Referencias 17


* Resumen

En el presente informe se plantea la problemática y las nuevas oportunidades que presentan los medios de comunicación social en cuanto a que se han convertido en potencialesmedios de comunicación social de noticias rápidas a través de internet, en esto Twitter es una de las redes sociales que lleva la delantera. Es en este contexto que se pretende entonces analizar un modelo de clasificación de tópicos para comparación de contenidos entre Twitter y medios periodísticos de prensa escrita más tradicionales como el diario El Mercurio de Santiago para luego proponer unamodificación y mejora a dicho modelo. Finalmente, en este documento se presenta el marco teórico y marco conceptual relevante de los Modelos de Tópicos y la explicación de alguna de sus técnicas más importantes.

* Lista de Figuras

Figura 1. Los medios de comunicación online han llegado a ser una de las fuentes de noticias favoritas 3
Figura 2. Evolución de los temas en la FísicaTeórica a través del tiempo 13
Figura 3. Evolución de los temas en la Neurociencia a través del tiempo 13
Figura 4. La intuición detrás de la técnica LDA 14

* Lista de Tablas

Tabla 1. Tabla de pros y contras de reportear vía Twitter 4
Tabla 2. Plan de Trabajo 7
Tabla 3. Términos raíces y sus variantes. 11

1. Introducción

El concepto de Modelo de Tópicos o Temas (más conocidocomo Topic Model en inglés) es una de las técnicas probabilísticas e informáticas que ha ido apareciendo con más fuerzas en las últimas décadas, anunciando las diversas aplicaciones útiles que puede tener y los diversos beneficios en el tratamiento de textos en la web para inferir, concluir, analizar y comparar datos e información de distinta índole. Es en este mismo sentido en el que el presenteestudio se embarca en el análisis para mejorar un modelo de tópicos específico enfocado hacia la comparación de los contenidos de Twitter versus los contenidos del diario el Mercurio de Santiago y finalmente evaluar esta mejora de las técnicas utilizadas dentro del mismo modelo.

Twitter es en la actualidad una de las redes sociales más utilizadas y por lo tanto una de las que presenta un campomás fértil para trabajar con Clasificación de Datos y Modelo de Tópicos. Se trata de una red social en la que se escriben mensajes de no más de 140 caracteres los cuáles son mostrados en la página-Twitter de cada seguidor del escritor. La influencia que ha tenido Twitter en los medios de comunicación ha sido realmente importante, es más muchos en la web proponen que Twitter ha revolucionado la...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Comparacion De Topicos
  • Los Contenidos Actitudinales Como Medio Para Reforzar Los Valores
  • Clasificacion de contenidos
  • Medio prensa
  • Clasificación De La Investigación Por Los Medios Utlizados Para Obtener Los Datos.
  • COMPARACION TOPICOS DE GUERRA
  • Clasificación de medios de cultivo para diferenciar comportamiento bacteriano
  • Comparación De Tópicos "Monólogos En La Celda De

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS