Apprentissage par renforcement profond de la fixation binoculaire en utilisant de la détection d'anomalies

Résumé : Par leur capacité à apprendre des comportements visuo-moteurs complexes, les algorithmes d'apprentissage par renforcement profond ont attiré l'attention de la communauté robotique. Pour programmer de façon efficace un tel algorithme, le signal de récompense envisagé doit être informatif dans le sens où il doit discriminer les valeurs des états voisins. Pour cela, des informations à priori sont souvent utilisées. Ce papier propose une méthode pour apprendre à fixer un objet sans ce type d'information. A la place, une récompense informative utilisant très peu d'information supervisée est calculée. Le calcul de la récompense est fondé sur un mécanisme de détection d'anomalies. Celui-ci estime une position d'objet pixellique avec une méthode faiblement supervisée. Cette position estimée est bruitée, ce qui rend le signal de récompense bruité également. Nous proposons une méthode d'apprentissage pour éliminer partiellement ce bruit. La fixation binoculaire est apprise dans un environnement simulé sur un ensemble d'objets aux couleurs et formes variées. La politique apprise est comparée avec une autre entraînée à partir d'une récompense lisse et informative. Nous observons des performances similaires, montrant qu'une étape d'encodage de l'environnement peut remplacer des informations à priori.
Type de document :
Communication dans un congrès
ORASIS 2017, Jun 2017, Colleville-sur-Mer, France
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01866766
Contributeur : Ccsd Sciencesconf.Org <>
Soumis le : lundi 3 septembre 2018 - 15:58:56
Dernière modification le : mercredi 5 septembre 2018 - 01:08:06

Fichier

orasis2017_francois_delabourdo...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01866766, version 1

Citation

François De La Bourdonnaye, Thierry Chateau, Jochen Triesch, Céline Teulière. Apprentissage par renforcement profond de la fixation binoculaire en utilisant de la détection d'anomalies. ORASIS 2017, Jun 2017, Colleville-sur-Mer, France. 〈hal-01866766〉

Partager

Métriques

Consultations de la notice

32

Téléchargements de fichiers

15