Apprentissage par renforcement de PDM factorisés avec effets corrélés - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Apprentissage par renforcement de PDM factorisés avec effets corrélés

Résumé

Nous nous intéressons au problème de l'apprentissage par renforcement dans les Processus de Décision Markoviens Factorisés, dans le cas où les effets des actions sur les variables sont corrélés et partiellement observables, tel que dans les représentations en Opérateurs STRIPS Probabilistes. Nous présentons un algorithme qui apprend à la fois la structure du problème et les effets des actions. Pour ce faire, nous partons d'algorithmes existants traitant les effets indépendants, pour ensuite les généraliser grâce à l'introduction d'une mesure de similarité entre distributions d'effets ambigus.
Fichier principal
Vignette du fichier
lz10b.pdf (261.69 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00947030 , version 1 (14-02-2014)

Identifiants

  • HAL Id : hal-00947030 , version 1

Citer

Boris Lesner, Bruno Zanuttini. Apprentissage par renforcement de PDM factorisés avec effets corrélés. Actes des 5es Journees Francophones Planification Decision Apprentissage (JFPDA 2010), 2010, France. 15 p. ⟨hal-00947030⟩
71 Consultations
63 Téléchargements

Partager

Gmail Facebook X LinkedIn More