Contribution au problème de la sélection de l'action en environnement partiellement observable

Résumé : La sélection de l’action par les agents dans un environnement partiellement observable est un problème central de l’intelligence artificielle située. Nous montrons dans cet article comment le cadre mathématique des POMDPs permet de traiter le problème. Nous présentons l’intérêt de l’algorithme U-T REE et nous identifions la difficulté à introduire dans le bon ordre les distinctions dans l’arbre de décision que l’algorithme engendre. Nous montrons comment un algorithme génétique permet de trouver une solution. Nous nous livrons alors à une discussion de notre travail vis à vis des systèmes de classeurs à états internes à partir de l’exemple de ZCSM, ce qui nous conduit à une comparaison avec A LECSYS et HQ- LEARNING . Nous concluons par une synthèse de ce que nous retenons de ces différents systèmes.
Document type :
Book sections
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01574465
Contributor : Lip6 Publications <>
Submitted on : Monday, August 14, 2017 - 4:21:35 PM
Last modification on : Thursday, March 21, 2019 - 1:06:23 PM

Identifiers

  • HAL Id : hal-01574465, version 1

Citation

Olivier Sigaud, Pierre Gérard. Contribution au problème de la sélection de l'action en environnement partiellement observable. Intelligence Artificielle Située, Hermès, pp.129-146, 1999. ⟨hal-01574465⟩

Share

Metrics

Record views

30