Cadenas de markov

Solo disponible en BuenasTareas
  • Páginas : 8 (1801 palabras )
  • Descarga(s) : 4
  • Publicado : 15 de noviembre de 2009
Leer documento completo
Vista previa del texto
XIV Latin Ibero-American Congress on Operations Research (CLAIO 2008) – Book of Extended Abstracts

CADENAS DE MARKOV PARA MODELAR LA NAVEGACIÓN DEL USUARIO WEB: INFERENCIA ESTADÍSTICA
Pablo Román*, Juan D. Velásquez* *Universidad de Chile, Santiago, Chile e-mail: proman@ing.uchile.cl jvelasqu@dii.uchile.cl

1

INTRODUCCIÓN

Este trabajo presenta el análisis del comportamiento denavegación del usuario web basado en cadenas de markov a tiempo continuo. La hipótesis que se plantea, se basa en el supuesto de la propiedad markoviana en la elección de la navegación que realiza un usuario visitando las páginas de un sitio durante su sesión. El modelo de cadenas de markov fue probado en datos originados en un sitio web universitario, obteniéndose varios indicadores de desempeño delsitio. Se calcularon estimadores para las probabilidades de transición, tasas de salida y se efectuaron test de hipótesis para comprobar el ajuste del modelo. Se estableció un algoritmo para el cálculo del orden de la cadena de markov basado en los test de máxima verosimilitud. A la luz de los resultados, se concluye que el modelo probabilístico tiene un buen grado de aproximación al comportamientode navegación de un usuario web, generando perspectivas futuras de análisis posteriores basados en la hipótesis markoviana sobre el comportamiento del usuario en un sitio web determinado.

2

MODELOS DE COMPORTAMIENTO DEL USUARIO WEB

Una industria de mayor desarrollo en los últimos 20 años ha sido el e-commerce, el masivo número de clientes potenciales que pueden visitar un sitio web, hagenerado expectativas y crecimientos nunca antes vistos en la historia. Para efectos de marketing es de una importancia estratégica conocer y estudiar modelos que describan el comportamiento de navegación del usuario web. Los estudios realizados se enfocan a la aplicación de técnicas Data Mining a Internet [1]. Son muchas las estrategias que ajustan modelos de comportamiento de navegación, basándoseen la información contenida en los logs del servidor, los contenidos de texto del sitio y su estructura [1][3][11]. Usando estos enfoques se han desarrollado diversas metodologías que permiten facilitar la búsqueda de información, mejorar la percepción que se tiene del sitio y asegurar la vigencia de los sitios en la Web. El presente trabajo tiene por propósito estudiar el comportamiento denavegación del usuario web desde un punto de vista fenomenológico, de forma de validar modelos probabilísticos relativos a éste. Nuestra hipótesis es que los modelos markovianos tienen un alto grado de ajuste en relación al comportamiento de la navegación del usuario web. Para establecer este hecho nos basamos en el trabajo de Brin y Page en relación al algoritmo PageRank [2], donde se describe la ideade un “Random Surfer” como modelo de usuario web. En este mismo sentido, el modelo HOTness[4] utiliza un modelo basado en la entropía para el cálculo de las probabilidades de transición en el contexto de la obtención del ranking de búsqueda. Otros autores aplican modelos probabilísticos generales de data mining como la metodología MAXENT [3]. Sin embargo, son escasos los trabajos dedicados a darun fundamento estadístico a los supuestos en los cuales se basan estos modelos probabilísticos [5][6]. El aporte de este trabajo consiste en efectuar un test sobre el comportamiento de navegación, en relación a la hipótesis que éstos se comportan como una cadena de markov a tiempo continuo. Estos modelos se describen a través de las probabilidades de transición Pij entre páginas y las tasas desalida vi de cada página web. Para ello, nos basamos en la metodología de inferencia estadística sobre cadenas de markov desarrollada por Anderson y Goodman [7], usando los datos recolectados sobre los usuarios del sitio web del departamento de Ingeniería Industrial de la Universidad de Chile (http://www.dii.uchile.cl).

Pablo Román and Juan Velásquez

3

PROCESAMIENTO DE LOS DATOS

Los...
tracking img