Apprentissage par renforcement de PDM factorisés avec effets corrélés
Résumé
Nous nous intéressons au problème de l'apprentissage par renforcement dans les Processus de Décision Markoviens Factorisés, dans le cas où les effets des actions sur les variables sont corrélés et partiellement observables, tel que dans les représentations en Opérateurs STRIPS Probabilistes. Nous présentons un algorithme qui apprend à la fois la structure du problème et les effets des actions. Pour ce faire, nous partons d'algorithmes existants traitant les effets indépendants, pour ensuite les généraliser grâce à l'introduction d'une mesure de similarité entre distributions d'effets ambigus.
Domaines
Intelligence artificielle [cs.AI]
Origine : Fichiers produits par l'(les) auteur(s)
Loading...