Systèmes de recommandations : algorithmes de bandits et évaluation expérimentale

Abstract : Les systèmes de recommandation à très grande échelle sont aujourd'hui omniprésents sur internet : ouvrages conseillés à l'achat dans les librairies en ligne, articles recommandés sur les sites d'information, sans parler des cadres publicitaires qui financent l'essentiel de très nombreux sites aujourd'hui. Trouver la meilleure recommandation à faire à un visiteur peut être considéré comme un "problème de bandits" : il faut en même temps apprendre ses préférences, et utiliser les interactions déjà passées pour maximiser le nombre de recommandations suivies, tout en restant capable de gérer des flux de données très importants. Nous présentons ici quelques-uns des algorithmes les plus célèbres pour résoudre ce type de problèmes, et notamment l'algorithme UCB (Upper Confidence Bound), l'algorithme EXP3 (Exponential weights for Exploration and Exploitation) et le Thompson Sampling (du nom de l'inventeur, au début des années trente, de cette méthode d'inspiration bayésienne). Leurs mérites respectifs sont soulignés et discutés, avec la présentation des résultats théoriques les plus importants les concernant. Nous montrons en outre, dans un notebook ipython associé, comment expérimenter l'efficacité de ces méthodes pour la recommandation: ceci pose une difficulté particulière, car des jeux de données statiques rendent peu aisée l'évaluation de méthodes vouées à interagir avec des utilisateurs. Nous montrerons en particulier comment mettre en place des expériences sur deux jeux de données célèbres : movielens et jester.
Liste complète des métadonnées

Cited literature [11 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01671320
Contributor : Open Archive Toulouse Archive Ouverte (oatao) <>
Submitted on : Friday, December 22, 2017 - 10:41:12 AM
Last modification on : Friday, April 12, 2019 - 4:23:07 PM

File

louedec_18751.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01671320, version 1
  • OATAO : 18751

Citation

Jonathan Louëdec, Max Chevalier, Aurélien Garivier, Josiane Mothe. Systèmes de recommandations : algorithmes de bandits et évaluation expérimentale. 47emes Journees de Statistique de la SFdS (JDS 2015), Jun 2015, Lille, France. pp. 1-8. ⟨hal-01671320⟩

Share

Metrics

Record views

65

Files downloads

77