déposer
version française rss feed
HAL : hal-00624832, version 1

Fiche détaillée  Récupérer au format
ICONIP 2011, Chine (2011)
Q-Learning with Double Progressive Widening : Application to Robotics
Nataliya Sokolovska 1, 2, Olivier Teytaud 1, 2, Mario Milone 1
(19/09/2011)

Discretization of state and action spaces is a critical issue in $Q$-Learning. In our contribution, we propose a real-time adaptation of the discretization by the progressive widening technique which has been already used in bandit-based methods. Results are consistently converging to the optimum of the problem, without changing the parametrization for each new problem.
1 :  Laboratoire de Recherche en Informatique (LRI)
CNRS : UMR8623 – Université Paris XI - Paris Sud
2 :  TAO (INRIA Saclay - Ile de France)
INRIA – CNRS : UMR8623 – Université Paris XI - Paris Sud
Informatique/Apprentissage
Liste des fichiers attachés à ce document : 
PDF
ICONIP-0854.pdf(511.6 KB)

tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...