Skip to Main content Skip to Navigation
Journal articles

Processus décisionnels de Markov possibilités à observabilité mixte

Abstract : Les processus décisionnels de Markov partiellement observables possibilistes qualita- tifs (π-PDMPO) constituent une alternative aux PDMPO classiques (probabilistes) : ils sont utilisés dans les situations où l’état de croyance initial de l’agent et les probabilités définissant le problème sont imprécises du fait d’un manque de connaissance ou de données. Cependant, tout comme les PDMPO, le calcul d’une stratégie optimale demande un grand nombre d’opé- rations : le nombre d’états de croyance grandit exponentiellement avec le nombre d’états du système. Dans cet article, une version possibiliste des processus décisisionnels de Markov à observabilité mixte est présentée pour simplifier ce calcul : la complexité de résolution d’un π-PDMPO, dont certaines variables d’état sont complètement observables, peut être consi- dérablement réduite. Un algorithme d’itération sur les revenus optimaux pour cette nouvelle formulation est ensuite proposé pour le cas de l’horizon infini, et l’optimalité de la stratégie calculée pour un critère donné est démontrée, lorsqu’il existe une action "rester" dans certains états buts. Les expérimentations montrent finalement que ce modèle possibiliste est plus perfor- mant que le modèle PDMPO probabiliste, utilisé classiquement en robotique, pour un problème de reconnaissance de cible, dans certaines situations où les capacités d’observation de l’agent ne sont pas précises.
Complete list of metadatas

Cited literature [21 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01530407
Contributor : Open Archive Toulouse Archive Ouverte (oatao) <>
Submitted on : Wednesday, May 31, 2017 - 4:40:22 PM
Last modification on : Friday, June 12, 2020 - 3:52:25 AM
Long-term archiving on: : Wednesday, September 6, 2017 - 5:29:09 PM

File

drougard_16980.pdf
Files produced by the author(s)

Identifiers

Citation

Nicolas Drougard, Florent Teichteil-Konigsbuch, Jean-Loup Farges, Didier Dubois. Processus décisionnels de Markov possibilités à observabilité mixte. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2015, vol. 29 (n° 6), pp. 629-653. ⟨10.3166/RIA.29.629-653⟩. ⟨hal-01530407⟩

Share

Metrics

Record views

322

Files downloads

734