Simplification de la mémoire des agents en utilisant des FMDP

Shirley Hoët 1 Nicolas Sabouret 1
1 SMA - Systèmes Multi-Agents
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Dans cet article, nous nous intéressons à la problématique de l’apprentissage par renforcement dans un cadre multi-agent asynchrone et faiblement couplé. Nous montrons qu’il est nécessaire de mémoriser des informations sur les actions passées et nous montrons comment factoriser cette information mémorisée pour que l’espace d’états reste praticable en nous appuyant sur le modèle des processus décisionnels de Markov factorisés (FMDP). Nous définissons un mécanisme d’apprentissage qui intègre les actions et les observations passées et nous expliquons comment ce modèle est implanté dans notre plateforme et nous discutons les résultats attendus.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01292562
Contributor : Lip6 Publications <>
Submitted on : Wednesday, March 23, 2016 - 1:46:00 PM
Last modification on : Thursday, March 21, 2019 - 1:04:04 PM

Identifiers

  • HAL Id : hal-01292562, version 1

Citation

Shirley Hoët, Nicolas Sabouret. Simplification de la mémoire des agents en utilisant des FMDP. 18th Journées Francophones sur les Systèmes Multi-Agents, Oct 2010, Mahdia, Tunisie. pp.13-22. ⟨hal-01292562⟩

Share

Metrics

Record views

55