3328 documents avec fichiers associés – 6106 références bibliographiques  [english version]
HAL : hal-00595695, version 3

Fiche détaillée  Récupérer au format
Versions disponibles :
Robust approachability and regret minimization in games with partial monitoring
Shie Mannor 1, Vianney Perchet 2, Gilles Stoltz 3, 4, 5
(23/01/2012)

Approachability has become a standard tool in analyzing earning algorithms in the adversarial online learning setup. We develop a variant of approachability for games where there is ambiguity in the obtained reward that belongs to a set, rather than being a single vector. Using this variant we tackle the problem of approachability in games with partial monitoring and develop simple and efficient algorithms (i.e., with constant per-step complexity) for this setup. We finally consider external regret and internal regret in repeated games with partial monitoring and derive regret-minimizing strategies based on approachability theory.
1 :  Department of Electrical Engineering - Technion (EE-Technion)
Israel Institute of Technology
2 :  Centre de Mathématiques et de Leurs Applications (CMLA)
CNRS : UMR8536 – École normale supérieure de Cachan - ENS Cachan
3 :  Département de Mathématiques et Applications (DMA)
CNRS : UMR8553 – Ecole normale supérieure de Paris - ENS Paris
4 :  Groupement de Recherche et d'Etudes en Gestion à HEC (GREGH)
GROUPE HEC – CNRS : UMR2959
5 :  CLASSIC (INRIA Paris - Rocquencourt)
Ecole normale supérieure de Paris - ENS Paris – INRIA
Mathématiques/Statistiques

Statistiques/Théorie

Informatique/Apprentissage
Liste des fichiers attachés à ce document : 
PDF
Mannor-Perchet-Stoltz--Robust-Approachability--HAL.pdf(445.9 KB)
PS
Mannor-Perchet-Stoltz--Robust-Approachability--HAL.ps(1.3 MB)