Skip to Main content Skip to Navigation
Conference papers

Faut-il minimiser le résidu de Bellman ou maximiser la valeur moyenne ?

Matthieu Geist 1 Bilal Piot 2, 3, 4, 5 Olivier Pietquin 2
1 MALIS - MAchine Learning and Interactive Systems
SUPELEC-Campus Metz, CentraleSupélec
2 SEQUEL - Sequential Learning
Inria Lille - Nord Europe, CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-01576347
Contributor : Bruno Zanuttini Connect in order to contact the contributor
Submitted on : Wednesday, August 23, 2017 - 2:20:15 AM
Last modification on : Monday, December 14, 2020 - 2:10:04 PM

Identifiers

  • HAL Id : hal-01576347, version 1

Citation

Matthieu Geist, Bilal Piot, Olivier Pietquin. Faut-il minimiser le résidu de Bellman ou maximiser la valeur moyenne ?. Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes (JFPDA 2017), Jul 2017, Caen, France. ⟨hal-01576347⟩

Share

Metrics

Record views

275