Skip to Main content Skip to Navigation
Conference papers

Exploration prudente : une approche par méthode de Monte-Carlo arborescente contrainte

Nicolas Galichet 1 Michèle Sebag 1, 2
2 TAO - Machine Learning and Optimisation
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Résumé : En robotique autonome, nous souhaitons permettre à l'agent d'explorer son environnement afin d'y effectuer les tâches désirées. Cette exploration autonome pose le problème de la sécurité de l'agent évoluant dans un environnement potentiellement dangereux. Cet article présente, dans un contexte d'apprentissage par renforcement, une implémentation d'exploration prudente par méthode de Monte-Carlo contrainte nommée Educated MCTS. Cette approche maintient à jour parallèlement à l'exploration un modèle permettant de se restreindre aux états proches de ceux connus et supposés sûrs. Les résultats expérimentaux montrent que Educated MCTS permet une amélioration significative du compromis exploration-sécurité
Complete list of metadatas

Cited literature [13 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-00656575
Contributor : Amélie Cordier <>
Submitted on : Tuesday, January 17, 2012 - 10:02:44 PM
Last modification on : Tuesday, April 21, 2020 - 1:04:57 AM
Document(s) archivé(s) le : Wednesday, April 18, 2012 - 2:30:46 AM

File

rfia2012_submission_153.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00656575, version 1

Collections

Citation

Nicolas Galichet, Michèle Sebag. Exploration prudente : une approche par méthode de Monte-Carlo arborescente contrainte. RFIA 2012 (Reconnaissance des Formes et Intelligence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3. ⟨hal-00656575⟩

Share

Metrics

Record views

611

Files downloads

1023