Un algorithme décentralisé d'apprentissage par renforcement multi-agents coopératifs : le Q-Learning Hystérétique. - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2007

Un algorithme décentralisé d'apprentissage par renforcement multi-agents coopératifs : le Q-Learning Hystérétique.

Résumé

Nous nous intéressons aux techniques d'apprentissage par renforcement dans les systèmes multi-agents coopératifs. Nous présentons un nouvel algorithme pour agents indépendants qui permet d'apprendre l'action jointe optimale dans des jeux où la coordination est difficile. Nous motivons notre approche par le caractère décentralisé de cet algorithme qui ne nécessite aucune communication entre agents et des tables Q de taille indépendante du nombre d'agents. Des tests concluants sont de plus effectués sur des jeux coopératifs répétés, ainsi que sur un jeu de poursuite.
Fichier principal
Vignette du fichier
matignon2007jfpda.pdf (210.64 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00161653 , version 1 (11-07-2007)

Identifiants

  • HAL Id : hal-00161653 , version 1

Citer

Laëtitia Matignon, Guillaume J. Laurent, Nadine Le Fort - Piat. Un algorithme décentralisé d'apprentissage par renforcement multi-agents coopératifs : le Q-Learning Hystérétique.. 2è Journées Francophones Planification, Décision, Apprentissage pour la conduite de Systèmes. JFPDA'07., Jul 2007, Grenoble, France. pp.115-121. ⟨hal-00161653⟩
250 Consultations
596 Téléchargements

Partager

Gmail Facebook X LinkedIn More