Infinitely many-armed bandits

Yizao Wang 1 Jean-Yves Audibert 2, 3, 4 Rémi Munos 5
2 IMAGINE [Marne-la-Vallée]
LIGM - Laboratoire d'Informatique Gaspard-Monge, CSTB - Centre Scientifique et Technique du Bâtiment, ENPC - École des Ponts ParisTech
4 SIERRA - Statistical Machine Learning and Parsimony
DI-ENS - Département d'informatique de l'École normale supérieure, ENS Paris - École normale supérieure - Paris, Inria Paris-Rocquencourt, CNRS - Centre National de la Recherche Scientifique : UMR8548
5 SEQUEL - Sequential Learning
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe, LAGIS - Laboratoire d'Automatique, Génie Informatique et Signal
Abstract : We consider multi-armed bandit problems where the number of arms is larger than the possible number of experiments. We make a stochastic assumption on the mean-reward of a new selected arm which characterizes its probability of being a near-optimal arm. Our assumption is weaker than in previous works. We describe algorithms based on upper-confidence-bounds applied to a restricted set of randomly selected arms and provide upper-bounds on the resulting expected regret. We also derive a lower-bound which matches (up to a logarithmic factor) the upper-bound in some cases.
Type de document :
Communication dans un congrès
Advances in Neural Information Processing Systems, 2008, Canada. 2008
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00830178
Contributeur : Rémi Munos <>
Soumis le : mardi 4 juin 2013 - 15:19:36
Dernière modification le : jeudi 7 février 2019 - 15:49:51
Document(s) archivé(s) le : jeudi 5 septembre 2013 - 04:23:06

Fichier

many-armed.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00830178, version 1

Citation

Yizao Wang, Jean-Yves Audibert, Rémi Munos. Infinitely many-armed bandits. Advances in Neural Information Processing Systems, 2008, Canada. 2008. 〈hal-00830178〉

Partager

Métriques

Consultations de la notice

801

Téléchargements de fichiers

175