Amazon

Solo disponible en BuenasTareas
  • Páginas : 6 (1297 palabras )
  • Descarga(s) : 0
  • Publicado : 26 de febrero de 2012
Leer documento completo
Vista previa del texto
AMAZON.COM RECOMENDATIONS
Los algoritmos de recomendación son mejor conocidos por su uso en el comercio electrónico Web, en el que usan como input los intereses de clientes para generar una lista de recomendaciones. En Amazon.com, usamos algoritmos de recomendación para personalizar la tienda on-line para cada cliente.
En el E-commerce los algoritmos de recomendación a menudo operan en unentorno difícil por las siguientes razones:
• Un gran retailer podría tener grandes cantidades de de datos, decenas de millones de clientes y millones de artículos distintos en el catálogo.
• Muchas aplicaciones requieren que el conjunto de resultados sea devuelto en tiempo real, en no más de medio segundo, mientras al mismo tiempo entrega una alta calidad de recomendaciones.
• Los nuevosclientes suelen tener muy limitada información, ya que alimentan una base de sólo algunas compras o clasificaciones de productos.
• Los clientes más antiguos pueden tener un exceso de información en su base, con miles de compras y clasificaciones.
• La data del cliente es volátil: Cada interacción proporciona valiosos datos de los clientes, y el algoritmo debe responder de inmediato a la nuevainformación.

Algoritmos de recomendación:

Hay tres métodos comunes para resolver los problemas de recomendación:
Filtrado colaborativo tradicional - Modelos de clúster - Búsqueda basada en métodos.

La mayoría de los algoritmos de recomendación comienzan con buscar un conjunto de clientes cuya compra y clasificación de elementos se solapan con las compras y clasificaciones del usuario.Otros algoritmos – incluyendo el método basado en búsquedas y nuestro propio filtrado colaborativo ítem a ítem - se centran en encontrar similares artículos, no en similares clientes.

Filtrado colaborativo tradicional:

Un algoritmo de filtrado colaborativo tradicional representa a los clientes con un vector M y con N el número de distintos artículos de catálogo. El algoritmo generarecomendaciones sobre la base de algunos clientes que son más similares al usuario. Por lo tanto, el rendimiento final del algoritmo es de aproximadamente S (M + N). Sin embargo, para grandes conjuntos de datos - por ejemplo, 10 millones de clientes y el catálogo de 1 millón o más
elementos - el algoritmo muestra graves problemas de rendimiento y de escala. Es posible abordar parcialmente estosproblemas de escalas mediante la reducción de los datos. Lamentablemente, todos estos métodos también reducen la calidad de la recomendación de varias maneras. En primer lugar, si el algoritmo examina sólo una pequeña muestra de clientes, los clientes seleccionados serán menos similares para el usuario. En segundo lugar, el tema del espacio de partición restringe las recomendaciones para un determinadoproducto o materia. En tercer lugar, si el algoritmo descarta los artículos más populares o impopulares, nunca aparecerán como recomendaciones y, por lo tanto, los clientes que han comprado sólo esos elementos no obtendrán recomendaciones.
Modelos de Clúster:
Para encontrar clientes que son similares al usuario, el modelo de clúster divide la base de clientes en muchos segmentos y trata latarea como un problema de clasificación.
El objetivo del algoritmo es asignar al usuario al segmento que contiene la mayoría de los clientes similares. A continuación, utiliza las compras y valoraciones de los clientes en el segmento para la generación de recomendaciones. Modelos de Clúster tienen mejor escalabilidad on-line comparado con el rendimiento del filtrado colaborativo, porque comparan alusuario a un controlado número de segmentos en lugar de toda la base de datos de clientes. El agrupamiento, complejo en cálculos además de costoso, se ejecuta off-line, sin embargo, la calidad de la recomendación es baja, ya que como los clientes similares que encuentra el modelo de clúster no son los más similares.

Método basado en búsqueda:
Métodos de búsqueda o de contenido basado trata...
tracking img