pandora media

Páginas: 63 (15608 palabras) Publicado: 12 de mayo de 2014
Desde las Redes de libros, multitudes, y Mercados: RAZONAR Sobre Altamente Mundo ONU Conectado.Por David Easley y Jon Kleinberg. Cambridge University Press, 2010.
 
Pre-impresión completa en línea en http://www.cs.cornell.edu/home/kleinber/networks-book/
 
Capítulo 14
 
Análisis y Enlace Web Buscar
 
14.1               Buscar en la Web: El problema de la Clasificación
 
Cuando usted vaa Google y escriba "Cornell", el primer resultado que muestra que es www.cornell.edu, la página principal de la Universidad de Cornell. Ciertamente es difícil discutir con esto como una primera opción, pero ¿cómo 'know' Google que esta era la mejor respuesta? Los motores de búsqueda determinan cómo clasificar las páginas utilizando métodos automatizados que se ven en la propia Web, no una fuenteexterna de conocimiento, por lo que la conclusión es que debe haber suficiente información intrínseca a la Web y su estructura para resolver esto.
 
Antes de discutir algunas de las ideas detrás de la clasificación de páginas, vamos a empezar por considerar algunas de las razones básicas por las que es un problema difícil. En primer lugar, la búsqueda es un problema difícil para las computadoraspara resolver en cualquier ámbito, no sólo en la Web. De hecho, el campo de la recuperación de la información [36, 360] se ha ocupado de este problema durante décadas antes de la creación de la Web: los sistemas de recuperación de información automatizada a partir de la década de 1960 fueron diseñados para buscar repositorios de artículos de prensa, artículos científicos, patentes, resúmeneslegales , y otras colecciones de documentos en respuesta a los palabra clave consultas.Los sistemas de recuperación de información han tenido siempre que lidiar con el problema de que las palabras clave son una forma muy limitada para expresar una información compleja es necesario; además del hecho de que una lista de palabras clave es corta e inexpresivo, que ff suers de los problemas de sinonimia(múltiples maneras de decir la misma cosa, por lo que su búsqueda de recetas que implican cebolletas falla porque la receta que querías los llamó 'verde cebollas ') y pol-ysemy (múltiples significados para el mismo término, por lo que su búsqueda de información sobre el animal llamado un jaguar vez produce resultados principalmente de automóviles, jugadores de fútbol, ​​y un sistema operativo para elApple Macintosh.)
 
Durante mucho tiempo, a través de la década de 1980, la recuperación de información fue la provincia de bibliotecarios, abogados de patentes, y otras personas cuyo trabajo consistía en buscar colecciones de documentos; estas personas fueron capacitadas en la manera de formular las preguntas ctive ff correos, y los documentos que estaban buscando tendían a ser escrito porprofesionales, utilizando un estilo y vocabulario controlado.Con la llegada de la Web, donde todo el mundo es un autor y todo el mundo es un buscador, los problemas en torno a la recuperación de información explotaron en escala y complejidad.
 
_________________
Borrador: 10 de junio 2010
 
397
398              
 
 
Para empezar, la diversidad de estilos de edición hace que sea mucho másdifícil para clasificar documentos de acuerdo a un criterio común: en un solo tema, uno puede encontrar fácilmente las páginas escritas por expertos, novicios, los niños, los teóricos de la conspiración Ñ y no necesariamente ser capaz de decir cuál es cuál. Érase una vez, el hecho de que alguien tenía el dinero y los recursos para producir un compuesto tipo, documentos de aspecto profesional condestino hizo que fueran muy probable (aunque no siempre) a alguien que podría ser tomado en serio. Hoy en día, cualquier persona puede crear una página web con altos valores de producción.
 
Hay una diversidad correspondientemente rico en el conjunto de personas que emiten consultas, y el problema de múltiples significados se vuelve particularmente grave. Por ejemplo, cuando alguien emite la...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • La Media Pandora
  • Pandora
  • Pandora
  • Pandora
  • pandora
  • Pandora
  • pandora
  • pandora

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS