Apprentissage par renforcement de PDM factorisés avec effets corrélés

Boris Lesner; Bruno Zanuttini

Communication Dans Un Congrès Année : 2010

Apprentissage par renforcement de PDM factorisés avec effets corrélés

(1) , (2)

1
2

Boris Lesner

Fonction : Auteur

Groupe de Recherche en Informatique, Image et Instrumentation de Caen

Bruno Zanuttini

Fonction : Auteur
PersonId : 952903

Equipe MAD - Laboratoire GREYC - UMR6072

Résumé

Nous nous intéressons au problème de l'apprentissage par renforcement dans les Processus de Décision Markoviens Factorisés, dans le cas où les effets des actions sur les variables sont corrélés et partiellement observables, tel que dans les représentations en Opérateurs STRIPS Probabilistes. Nous présentons un algorithme qui apprend à la fois la structure du problème et les effets des actions. Pour ce faire, nous partons d'algorithmes existants traitant les effets indépendants, pour ensuite les généraliser grâce à l'introduction d'une mesure de similarité entre distributions d'effets ambigus.

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

lz10b.pdf (261.69 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Greyc Référent : Connectez-vous pour contacter le contributeur

https://hal.science/hal-00947030

Soumis le : vendredi 14 février 2014-15:26:58

Dernière modification le : mercredi 20 mars 2024-16:20:04

Archivage à long terme le : jeudi 15 mai 2014-10:42:08

Dates et versions

hal-00947030 , version 1 (14-02-2014)

Identifiants

HAL Id : hal-00947030 , version 1

Citer

Boris Lesner, Bruno Zanuttini. Apprentissage par renforcement de PDM factorisés avec effets corrélés. Actes des 5es Journees Francophones Planification Decision Apprentissage (JFPDA 2010), 2010, France. 15 p. ⟨hal-00947030⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS GREYC GREYC-MAD COMUE-NORMANDIE ENSICAEN UNICAEN

71 Consultations

63 Téléchargements

Apprentissage par renforcement de PDM factorisés avec effets corrélés

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager