Busqueda en internet

Solo disponible en BuenasTareas
  • Páginas : 4 (887 palabras )
  • Descarga(s) : 4
  • Publicado : 17 de febrero de 2010
Leer documento completo
Vista previa del texto
Cuestionario

1

Búsqueda de Información en Internet y Web Semántica

1.- Describa brevemente los tipos de términos y sus características principales.
1) OBJETIVOS:

Son extrínsecos alcontenido semántico. Normalmente no suele haber discrepancias en cómo asignarlos
2) NO OBJETIVOS: (Términos de Contenido. Se usan en la indexación web)

Están orientados a reflejar la informaciónmanifiesta en el documento. No hay acuerdo sobre el grado de aplicabilidad de estos términos.

LUIS OLIVARES REQUEJO - 11/2009

1

Cuestionario

1

Búsqueda de Información en Internet y WebSemántica

2.- Considere el conjunto de documentos relevantes Rq={ d3, d5, d9, d25, d39, d56, d71, d89, d123 }. Se recuperan los siguientes documentos en el siguiente orden:
(aparecen con * los que sonrelevantes)

1. d4 6. d40 11. d71 (*) 2. d5 (*) 7. d41 12. d30 3. d89 (*) 8. d42 13. d150 4. d25 (*) 9. d9 (*) 14. d70 5. d1 10. d123 (*) 15. d56 (*) Obtenga la precisión a los 11 niveles de retiradaestándar.

P(rj) = max rj ≤
Relev 9

r ≤ rj+1

P(r),

siendo rj el j-ésimo nivel de retirada estándar.

Doc d5 d89 d25 d9 d123 d71 d56

Relev Relevantes 1 1 1 1 1 1 1 1 2 3 4 5 6 7Docs 2 3 4 9 10 11 15

PRECIS 50,00 66,67 75,00 44,44 50,00 54,55 46,67

RECALL 11,11 11,11 33,33 44,44 55,56 66,67 77,78

PRECIS MAX 50 50 67 75 44 50 55 47 0 0 0

RECALL STD 0 10 20 30 40 5060 70 80 90 100

LUIS OLIVARES REQUEJO - 11/2009

2

Cuestionario

1

Búsqueda de Información en Internet y Web Semántica

3.- De los buscadores que aparecen en [GRGK97], ¿Cuáles reconocenque emplean técnicas tf.idf1?
Lycos y Web Crawler utilizan tf.idf. HotBot utiliza term frecuency, pero no indica que utilice inverse document frecuency.

¿Cuáles existen hoy en día como tales(buscadores independientes)?
Buscador en 1997 AltaVista · www.altavista.digital.com/av/content/about.htm Excite · www.excite.com HotBot · www.hotbot.com IBM InfoMarket · www.infomarket.ibm.com...
tracking img