Systèmes de recommandations : algorithmes de bandits et évaluation expérimentale

Les systèmes de recommandation à très grande échelle sont aujourd'hui omniprésents sur internet : ouvrages conseillés à l'achat dans les librairies en ligne, articles recommandés sur les sites d'information, sans parler des cadres publicitaires qui financent l'essentiel de très nombreux sites aujourd'hui. Trouver la meilleure recommandation à faire à un visiteur peut être considéré comme un "problème de bandits" : il faut en même temps apprendre ses préférences, et utiliser les interactions déjà passées pour maximiser le nombre de recommandations suivies, tout en restant capable de gérer des flux de données très importants. Nous présentons ici quelques-uns des algorithmes les plus célèbres pour résoudre ce type de problèmes, et notamment l'algorithme UCB (Upper Confidence Bound), l'algorithme EXP3 (Exponential weights for Exploration and Exploitation) et le Thompson Sampling (du nom de l'inventeur, au début des années trente, de cette méthode d'inspiration bayésienne). Leurs mérites respectifs sont soulignés et discutés, avec la présentation des résultats théoriques les plus importants les concernant. Nous montrons en outre, dans un notebook ipython associé, comment expérimenter l'efficacité de ces méthodes pour la recommandation: ceci pose une difficulté particulière, car des jeux de données statiques rendent peu aisée l'évaluation de méthodes vouées à interagir avec des utilisateurs. Nous montrerons en particulier comment mettre en place des expériences sur deux jeux de données célèbres : movielens et jester.

Mots clés

Algorithmes de bandits Evaluation sur données réelles Système de recommandation

Domaines

Théorie de l'information [cs.IT] Recherche d'information [cs.IR]

Fichier principal

louedec_18751.pdf (172.98 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Open Archive Toulouse Archive Ouverte (OATAO) : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01671320

Soumis le : vendredi 22 décembre 2017-10:41:12

Dernière modification le : lundi 20 novembre 2023-11:44:19

Dates et versions

hal-01671320 , version 1 (22-12-2017)

Identifiants

HAL Id : hal-01671320 , version 1
OATAO : 18751

Citer

Jonathan Louëdec, Max Chevalier, Aurélien Garivier, Josiane Mothe. Systèmes de recommandations : algorithmes de bandits et évaluation expérimentale. 47emes Journees de Statistique de la SFdS (JDS 2015), Jun 2015, Lille, France. pp. 1-8. ⟨hal-01671320⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 CNRS INSA-TOULOUSE IMT SMS UT1-CAPITOLE INSA-GROUPE INSA-TOULOUSE-GEI IRIT IRIT-SIG IRIT-GD IRIT-UT2J IRIT-UT3 TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

159 Consultations

221 Téléchargements