Multiple Tree for Partially Observable Monte-Carlo Tree Search

David Auger 1, 2, *
* Auteur correspondant
1 TAO - Machine Learning and Optimisation
LRI - Laboratoire de Recherche en Informatique, UP11 - Université Paris-Sud - Paris 11, Inria Saclay - Ile de France, CNRS - Centre National de la Recherche Scientifique : UMR8623
2 MAGMAT
LRI - Laboratoire de Recherche en Informatique
Abstract : We propose an algorithm for computing approximate Nash equilibria of partially observable games using Monte-Carlo tree search based on recent bandit methods. We obtain experimental results for the game of phantom tic-tac-toe, showing that strong strategies can be efficiently computed by our algorithm.
Type de document :
Pré-publication, Document de travail
2011
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00563480
Contributeur : David Auger <>
Soumis le : mardi 8 février 2011 - 11:34:36
Dernière modification le : jeudi 5 avril 2018 - 12:30:23
Document(s) archivé(s) le : samedi 3 décembre 2016 - 22:25:03

Fichiers

auger.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00563480, version 2
  • ARXIV : 1102.1580

Collections

Citation

David Auger. Multiple Tree for Partially Observable Monte-Carlo Tree Search. 2011. 〈hal-00563480v2〉

Partager

Métriques

Consultations de la notice

474

Téléchargements de fichiers

497