Faut-il minimiser le résidu de Bellman ou maximiser la valeur moyenne ?

Matthieu Geist 1 Bilal Piot 2, 3, 4, 5 Olivier Pietquin 2
1 MALIS - MAchine Learning and Interactive Systems
SUPELEC-Campus Metz, CentraleSupélec
2 SEQUEL - Sequential Learning
Inria Lille - Nord Europe, CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01576347
Contributor : Bruno Zanuttini <>
Submitted on : Wednesday, August 23, 2017 - 2:20:15 AM
Last modification on : Friday, March 22, 2019 - 1:34:28 AM

Identifiers

  • HAL Id : hal-01576347, version 1

Citation

Matthieu Geist, Bilal Piot, Olivier Pietquin. Faut-il minimiser le résidu de Bellman ou maximiser la valeur moyenne ?. Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes (JFPDA 2017), Jul 2017, Caen, France. ⟨hal-01576347⟩

Share

Metrics

Record views

207