Mise en pratique de LSPI pour la commande linéaire quadratique adaptative d'une surface de manipulation à coussin d'air actif.

Guillaume J. Laurent

Communication Dans Un Congrès Année : 2010

Mise en pratique de LSPI pour la commande linéaire quadratique adaptative d'une surface de manipulation à coussin d'air actif.

(1)

Guillaume J. Laurent

Fonction : Auteur
PersonId : 854827

Franche-Comté Électronique Mécanique, Thermique et Optique - Sciences et Technologies (UMR 6174)

Résumé

Cet article présente l'application de l'algorithme LSPI de Lagoudakis & Parr (2003) à la commande d'un système linéaire avec coût quadratique selon le protocole initialement proposé par Bradtke (1993). Le dispositif contrôlé est une surface active capable de mouvoir un objet sur un coussin d'air et dont la dynamique varie fortement en fonction de l'objet utilisé. La méthode d'apprentissage est validée en simulation avant d'être appliquée au système réel. Les résultats expérimentaux mettent en évidence la nécessité de formater les commandes générées par l'algorithme. Ce formatage a pour objectif d'éviter la génération de commandes irréalisables qui introduisent un biais dans la mise à jour de la fonction de valeur. L'apprentissage converge alors vers la même solution que la commande linéaire quadratique.

Mots clés

Apprentissage par renforcement LSTD LSTDQ LSPI commande linéaire quadratique LQR. LQR

Domaines

Micro et nanotechnologies/Microélectronique

Fichier principal

JFPDA2010Guillaume.pdf (500.29 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Martine Azema : Connectez-vous pour contacter le contributeur

https://hal.science/hal-00547476

Soumis le : jeudi 16 décembre 2010-14:49:11

Dernière modification le : jeudi 13 avril 2023-09:26:11

Archivage à long terme le : jeudi 17 mars 2011-02:42:35

Dates et versions

hal-00547476 , version 1 (16-12-2010)

Identifiants

HAL Id : hal-00547476 , version 1

Citer

Guillaume J. Laurent. Mise en pratique de LSPI pour la commande linéaire quadratique adaptative d'une surface de manipulation à coussin d'air actif.. 5èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, JFPDA'10., Jun 2010, BESANCON, France. 12 p. ⟨hal-00547476⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS UNIV-FCOMTE UNIV-BM FEMTO-ST UNIV-BM-THESE

84 Consultations

482 Téléchargements

Mise en pratique de LSPI pour la commande linéaire quadratique adaptative d'une surface de manipulation à coussin d'air actif.

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager