Contribution au problème de la sélection de l'action en environnement partiellement observable - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 1999

Contribution au problème de la sélection de l'action en environnement partiellement observable

Olivier Sigaud

Résumé

La sélection de l’action par les agents dans un environnement partiellement observable est un problème central de l’intelligence artificielle située. Nous montrons dans cet article comment le cadre mathématique des POMDPs permet de traiter le problème. Nous présentons l’intérêt de l’algorithme U-T REE et nous identifions la difficulté à introduire dans le bon ordre les distinctions dans l’arbre de décision que l’algorithme engendre. Nous montrons comment un algorithme génétique permet de trouver une solution. Nous nous livrons alors à une discussion de notre travail vis à vis des systèmes de classeurs à états internes à partir de l’exemple de ZCSM, ce qui nous conduit à une comparaison avec A LECSYS et HQ- LEARNING . Nous concluons par une synthèse de ce que nous retenons de ces différents systèmes.
Fichier non déposé

Dates et versions

hal-01574465 , version 1 (14-08-2017)

Identifiants

  • HAL Id : hal-01574465 , version 1

Citer

Olivier Sigaud, Pierre Gérard. Contribution au problème de la sélection de l'action en environnement partiellement observable. Intelligence Artificielle Située, Hermès, pp.129-146, 1999. ⟨hal-01574465⟩
33 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More