Skip to Main content Skip to Navigation
Conference papers

Apprentissage par renforcement profond de la fixation binoculaire en utilisant de la détection d'anomalies

Résumé : Par leur capacité à apprendre des comportements visuo-moteurs complexes, les algorithmes d'apprentissage par renforcement profond ont attiré l'attention de la communauté robotique. Pour programmer de façon efficace un tel algorithme, le signal de récompense envisagé doit être informatif dans le sens où il doit discriminer les valeurs des états voisins. Pour cela, des informations à priori sont souvent utilisées. Ce papier propose une méthode pour apprendre à fixer un objet sans ce type d'information. A la place, une récompense informative utilisant très peu d'information supervisée est calculée. Le calcul de la récompense est fondé sur un mécanisme de détection d'anomalies. Celui-ci estime une position d'objet pixellique avec une méthode faiblement supervisée. Cette position estimée est bruitée, ce qui rend le signal de récompense bruité également. Nous proposons une méthode d'apprentissage pour éliminer partiellement ce bruit. La fixation binoculaire est apprise dans un environnement simulé sur un ensemble d'objets aux couleurs et formes variées. La politique apprise est comparée avec une autre entraînée à partir d'une récompense lisse et informative. Nous observons des performances similaires, montrant qu'une étape d'encodage de l'environnement peut remplacer des informations à priori.
Document type :
Conference papers
Complete list of metadatas

Cited literature [19 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01866766
Contributor : Ccsd Sciencesconf.Org <>
Submitted on : Monday, September 3, 2018 - 3:58:56 PM
Last modification on : Thursday, March 21, 2019 - 5:29:31 PM
Document(s) archivé(s) le : Tuesday, December 4, 2018 - 7:39:37 PM

File

orasis2017_francois_delabourdo...
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01866766, version 1

Citation

François de la Bourdonnaye, Céline Teulière, Thierry Chateau, Jochen Triesch. Apprentissage par renforcement profond de la fixation binoculaire en utilisant de la détection d'anomalies. ORASIS 2017, GREYC, Jun 2017, Colleville-sur-Mer, France. ⟨hal-01866766⟩

Share

Metrics

Record views

137

Files downloads

507