Hypervolume indicator and dominance reward based multi-objective Monte-Carlo Tree Search

Weijia Wang 1, 2 Michèle Sebag 1, 2
2 TAO - Machine Learning and Optimisation
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Abstract : Concerned with multi-objective reinforcement learning (MORL), this paper presents MOMCTS, an extension of Monte-Carlo Tree Search to multi-objective sequential decision making, embedding two decision rules respectively based on the hypervolume indicator and the Pareto dominance reward. The MOMCTS approaches are firstly compared with the MORL state of the art on two artificial problems, the two-objective Deep Sea Treasure problem and the three-objective Resource Gathering problem. The scalability of MOMCTS is also examined in the context of the NP-hard grid scheduling problem, showing that the MOMCTS performance matches the (non-RL based) state of the art albeit with a higher computational cost.
Type de document :
Article dans une revue
Machine Learning, Springer Verlag, 2013, 92 (2-3), pp.403-429. 〈10.1007/s10994-013-5369-0〉
Liste complète des métadonnées

Littérature citée [36 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00852048
Contributeur : Weijia Wang <>
Soumis le : lundi 19 août 2013 - 16:15:35
Dernière modification le : jeudi 5 avril 2018 - 12:30:12
Document(s) archivé(s) le : mercredi 5 avril 2017 - 21:54:19

Fichiers

acmlSIrevised.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Collections

Citation

Weijia Wang, Michèle Sebag. Hypervolume indicator and dominance reward based multi-objective Monte-Carlo Tree Search. Machine Learning, Springer Verlag, 2013, 92 (2-3), pp.403-429. 〈10.1007/s10994-013-5369-0〉. 〈hal-00852048〉

Partager

Métriques

Consultations de la notice

523

Téléchargements de fichiers

644