Mineria web

Solo disponible en BuenasTareas
  • Páginas : 12 (2850 palabras )
  • Descarga(s) : 7
  • Publicado : 18 de agosto de 2010
Leer documento completo
Vista previa del texto
Acimed 2007; 16(4)

Minería Web: un recurso insoslayable para el profesional de la información*
Lic. Sady C. Fuentes Reyes1 e Ing. Marina Ruiz Lobaina2

RESUMEN Se estudian los principales conceptos relacionados con la minería Web (Web mining) y se enfatiza en la minería de uso del Web (Web usage mining). Se muestran, además, los resultados obtenidos con la aplicación de la herramientaSawmill V.7.0, utilizada para el procesamiento de ficheros Log. Palabras clave: Minería Web, minería de uso Web, software. ABSTRACT The main concepts related to Web mining are studied, and emphasis is made on the Web usage mining. The results obtained with the application of the Sawmill V.7.0 tool, which is used for processing Log files, are made known.. Key words: Web Mining, Web Usage Mining,software. Copyright: © ECIMED. Contribución de acceso abierto, distribuida bajo los términos de la Licencia Creative Commons Reconocimiento-No Comercial-Compartir Igual 2.0, que permite consultar, reproducir, distribuir, comunicar públicamente y utilizar los resultados del trabajo en la práctica, así como todos sus derivados, sin propósitos comerciales y con licencia idéntica, siempre que se citeadecuadamente el autor o los autores y su fuente original. Cita (Vancouver): Fuentes Reyes SC, Ruiz Lobaina M. Minería Web: un recurso insoslayable para el profesional de la información. Acimed 2007;16(4). Disponible en: http://bvs.sld.cu/revistas/aci/vol16_4_07/aci111007.htm [Consultado: día/mes/año]. “.... en la antigüedad, el hombre occidental quería ser sabio; luego el hombre moderno quiso serconocedor; el hombre contemporáneo parece contentarse con estar informado (y posiblemente el hombre futuro no esté interesado en otra cosa que en tener datos).” Iraset Páez Urdaneta World Wide Web es un medio de difusión económico y de gran importancia en el entorno empresarial. Ante el acelerado crecimiento del World Wide Web y de la competencia entre las organizaciones ha surgido la necesidad demejorar la calidad de los sitios Web, esencialmente sobre la base del comportamiento de los usuarios que lo utilizan. Para el descubrimiento de información útil en el Web, la denominada minería Web es una herramienta útil para el hallazgo de nuevos conocimientos; para eso, emplea la

información obtenida de los documentos y servicios Web (textos, imágenes, videos, hiperenlaces, ficheros Log, etc.).A continuación, se realiza una panorámica sobre la minería Web, con énfasis en la minería de uso Web, y finalmente se exponen los resultados obtenidos en el procesamiento de los ficheros Log de un servidor Web, por medio de Sawmill V.7.0, una herramienta de software para estos fines. MINERÍA WEB En el ámbito del acceso, recuperación y organización de información, la minería Web es un campoimportante de aplicación en Internet. Se utiliza para el estudio del comportamiento de ciertos aspectos esenciales para mejorar la arquitectura de un sitio ayuda a descubrir conocimientos potencialmente útiles a las organizaciones. Etzioni define la minería Web como el empleo de las técnicas de la minería de datos — data mining (DM) — para descubrir y extraer información automáticamente del Web.1 Entresus campos de aplicación principales se encuentran:2
• • • • •

Los motores de búsqueda. El comercio electrónico. El diseño Web. El posicionamiento Web. La seguridad.

La minería Web se subdivide en áreas que abarcan el contenido del sitio, la estructura de navegación y el comportamiento de los usuarios (fig. 1).

FIG. 1. Mapa conceptual de la clasificación minería Web, según Juan CarlosDürsteler.
Clases de minería

En materia de minería Web, existen tres clases fundamentales: 1. Minería Web de contenido. En el Web existen variados documentos, hipertexto, imágenes, vídeos, audio, símbolos, datos, meta-datos, link, textos, pdf y muchos otros, que dificulta su clasificación. La minería de contenido del Web trata de extraer información relevante sobre el contenido del Web, con...
tracking img