4 résultats  enregistrer la recherche


...
hal-00333584v1  Communication dans un congrès
Laëtitia MatignonGuillaume LaurentNadine Le Fort-PiatImproving Reinforcement Learning Speed for Robot Control.
IEEE Catalog Number : 06CH37780D. IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS'06., Oct 2006, Beijing, China. pp.3172-3177, 2006, <10.1109/IROS.2006.282341>
...
hal-00161653v1  Communication dans un congrès
Laëtitia MatignonGuillaume LaurentNadine Le Fort - PiatUn algorithme décentralisé d'apprentissage par renforcement multi-agents coopératifs : le Q-Learning Hystérétique.
Cépaduès Editions. 2è Journées Francophones Planification, Décision, Apprentissage pour la conduite de Systèmes. JFPDA'07., Jul 2007, Grenoble, France. Cépaduès Editions, pp.115-121, 2007