Busqueda en internet
1
Búsqueda de Información en Internet y Web Semántica
1.- Describa brevemente los tipos de términos y sus características principales.
1) OBJETIVOS:
Son extrínsecos alcontenido semántico. Normalmente no suele haber discrepancias en cómo asignarlos
2) NO OBJETIVOS: (Términos de Contenido. Se usan en la indexación web)
Están orientados a reflejar la informaciónmanifiesta en el documento. No hay acuerdo sobre el grado de aplicabilidad de estos términos.
LUIS OLIVARES REQUEJO - 11/2009
1
Cuestionario
1
Búsqueda de Información en Internet y WebSemántica
2.- Considere el conjunto de documentos relevantes Rq={ d3, d5, d9, d25, d39, d56, d71, d89, d123 }. Se recuperan los siguientes documentos en el siguiente orden:
(aparecen con * los que sonrelevantes)
1. d4 6. d40 11. d71 (*) 2. d5 (*) 7. d41 12. d30 3. d89 (*) 8. d42 13. d150 4. d25 (*) 9. d9 (*) 14. d70 5. d1 10. d123 (*) 15. d56 (*) Obtenga la precisión a los 11 niveles de retiradaestándar.
P(rj) = max rj ≤
Relev 9
r ≤ rj+1
P(r),
siendo rj el j-ésimo nivel de retirada estándar.
Doc d5 d89 d25 d9 d123 d71 d56
Relev Relevantes 1 1 1 1 1 1 1 1 2 3 4 5 6 7Docs 2 3 4 9 10 11 15
PRECIS 50,00 66,67 75,00 44,44 50,00 54,55 46,67
RECALL 11,11 11,11 33,33 44,44 55,56 66,67 77,78
PRECIS MAX 50 50 67 75 44 50 55 47 0 0 0
RECALL STD 0 10 20 30 40 5060 70 80 90 100
LUIS OLIVARES REQUEJO - 11/2009
2
Cuestionario
1
Búsqueda de Información en Internet y Web Semántica
3.- De los buscadores que aparecen en [GRGK97], ¿Cuáles reconocenque emplean técnicas tf.idf1?
Lycos y Web Crawler utilizan tf.idf. HotBot utiliza term frecuency, pero no indica que utilice inverse document frecuency.
¿Cuáles existen hoy en día como tales(buscadores independientes)?
Buscador en 1997 AltaVista · www.altavista.digital.com/av/content/about.htm Excite · www.excite.com HotBot · www.hotbot.com IBM InfoMarket · www.infomarket.ibm.com...
Regístrate para leer el documento completo.