Algoritmos recuperación de datos

Solo disponible en BuenasTareas
  • Páginas : 7 (1706 palabras )
  • Descarga(s) : 0
  • Publicado : 1 de junio de 2011
Leer documento completo
Vista previa del texto
Introducción

La recuperación de datos se ha vuelto muy importante en los últimos años debido a la utilización de la web, catálogos electrónicos, bases de datos, bibliotecas digitales, entre otros.

Existen diversas herramientas de recuperación de datos, conocer y manejar dichas herramientas contribuye a una recuperación de calidad.

En este resumen se analizaran diferentes tipos derecuperación de datos utilizados por los buscadores más importantes de la red. Como lo son Google, Yahoo, y MSN. Llamados algoritmos de posicionamiento, en este resumen se enumeran al menos tres de estos algoritmos.

Objetivos Generales:

Conocer el concepto de algoritmo de recuperación de datos

Describir los diferentes tipos de algoritmos de recuperación de datos que existen y sus definiciones.Objetivos específicos:

Describir los diferentes algoritmos utilizados para la recuperación de datos. Así como diferentes técnicas de recuperación de información.

Describir las maneras en que se evalúa la recuperación de datos de acuerdo a varios aspectos.

Algoritmos de Recuperación de datos

La creciente utilización del internet ha hecho de la recuperación de información un campo muyimportante, debido a esto se han propuesto muchas técnicas de compresión y de algoritmos de recuperación de datos. Estas propuestas son muy utilizadas por buscadores, bases de datos, bibliotecas digitales, entre otros.

La recuperación de datos se lleva a cabo mediante consultas a la base de datos donde se almacena la información. Haciendo las preguntas correctas se logra una óptima recuperaciónde datos. Mediante la recuperación de información se accede a una información previamente almacenada la cual debe de hacer sido antes estructurada de su almacenamiento.

Entre los elementos clave que permiten hacer la búsqueda para un mayor grado de pertinencia y precisión están: los índices, palabras clave, tesauros y los procesos que se pueden dar en el proceso como el ruido y silenciodocumental. El silencio documental son los documentos almacenados en la base de datos pero que no han sido recuperados, debidos a que la búsqueda es demasiado específica o que se han utilizado las palabras clave que no son adecuadas para definir la búsqueda. Esto lo podemos identificar si recuperamos un número reducido de datos. El ruido documental por el contrario lo producen documentos recuperados porel sistema que no son relevantes, esto puede ocurrir si la estrategia de búsqueda es demasiado general.

Los componentes esenciales de la búsqueda de información son:

➢ Documentos estructurados: Establece un proceso donde se establecen las herramientas de indización y control terminológico.

➢ Bases de datos: Donde están almacenados los documentos

➢ Y definir lenguajes deinterrogación y operadores que soportará la base de datos y, establecer que tipo de ecuaciones serán permitidas.

Una de las herramientas más utilizadas por Internet son:

Buscadores: Son herramientas que permiten localizar y recuperar la información almacenada en Internet, el funcionamiento es parecido al de las bases de datos, ya que almacena páginas con determinadas características y luegoutiliza palabras claves que emiten un listado de las páginas más relevantes.

Los buscadores más populares utilizan algoritmos de posicionamiento para la recuperación de datos Dentro de la recuperación y posicionamiento de la información encontramos los algoritmos de posicionamiento. Por naturaleza los buscadores utilizan un algoritmo para la recuperación de la información.

Por ejemplo Googleutiliza dos algoritmos los cuales son:

Algoritmo de relevancia:

En este tipo de algoritmos el buscador entra a una página y se fija en si la palabra clave aparece en el título, y si además aparece dentro del texto significa que probablemente ese sitio se dedique al tema que busque el usuario, por lo que le otorga un mejor posicionamiento.

Para presentar lo anterior en forma matemática...
tracking img