Utiliser des protocoles d'interaction et de la mémoire pour l'apprentissage par renforcement d'actes de communication

Shirley Hoët 1 Nicolas Sabouret 1
1 SMA - Systèmes Multi-Agents
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Dans ce papier, nous nous intéressons à l’apprentissage par renforcement pour la communication entre agents dans les SMA. L’étude de la littérature nous a permis de mettre en évidence trois principaux problèmes. Tout d’abord il est nécessaire pour l’agent de construire les actes de communication qu’il utilise pour communiquer avec les autres agents. Ensuite il nous faut adapter les actes de communication afin de les modéliser en tant qu’actions pour leur appliquer des techniques d’apprentissage par renforcement. Enfin nous devons résoudre les problèmes liés à la non markovité des systèmes multi-agents afin de pouvoir utiliser les algorithmes usuels d’apprentissage par renforcement utilisé dans le cadre mono-agent. Nous présentons un algorithme d’apprentissage par renforcement qui permet de traiter ces trois problèmes de manière entièrement distribuée. Nous nous appuyons pour cela sur l’utilisation d’agents introspectifs capables de raisonner sur leurs actions et sur leurs états. Puis nous démontrons que nous pouvons assimiler un acte de communication à une action en nous fondant sur la théorie des actes de langage et les travaux sur les PDSMs. Enfin nous montrons comment l’utilisation d’actes de communication peut résoudre le problème de non markovité en étant toutefois complétée par l’utilisation de la mémoire de l’agent.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01296333
Contributor : Lip6 Publications <>
Submitted on : Thursday, March 31, 2016 - 5:52:04 PM
Last modification on : Thursday, March 21, 2019 - 1:00:41 PM

Identifiers

  • HAL Id : hal-01296333, version 1

Citation

Shirley Hoët, Nicolas Sabouret. Utiliser des protocoles d'interaction et de la mémoire pour l'apprentissage par renforcement d'actes de communication. MFI’09 - Cinquièmes Journées Francophones MODÈLES FORMELS de l’INTERACTION, Jun 2009, Lannion, France. pp.159-170. ⟨hal-01296333⟩

Share

Metrics

Record views

79