Apprentissage par renforcement profond de la fixation binoculaire en utilisant de la détection d'anomalies

François de La Bourdonnaye; Céline Teulière; Thierry Chateau; Jochen Triesch

Communication Dans Un Congrès Année : 2017

Apprentissage par renforcement profond de la fixation binoculaire en utilisant de la détection d'anomalies

(1) , (1) , (1) , (2)

1
2

François de La Bourdonnaye

Fonction : Auteur
PersonId : 1036138

Institut Pascal

Céline Teulière

Fonction : Auteur
PersonId : 8681
IdHAL : cteuliere
IdRef : 149645163

Institut Pascal

Thierry Chateau

Fonction : Auteur
PersonId : 8056
IdHAL : thierry-chateau
IdRef : 154402176

Institut Pascal

Jochen Triesch

Fonction : Auteur
PersonId : 1036139

Frankfurt Institute for Advanced Studies

Résumé

Par leur capacité à apprendre des comportements visuo-moteurs complexes, les algorithmes d'apprentissage par renforcement profond ont attiré l'attention de la communauté robotique. Pour programmer de façon efficace un tel algorithme, le signal de récompense envisagé doit être informatif dans le sens où il doit discriminer les valeurs des états voisins. Pour cela, des informations à priori sont souvent utilisées. Ce papier propose une méthode pour apprendre à fixer un objet sans ce type d'information. A la place, une récompense informative utilisant très peu d'information supervisée est calculée. Le calcul de la récompense est fondé sur un mécanisme de détection d'anomalies. Celui-ci estime une position d'objet pixellique avec une méthode faiblement supervisée. Cette position estimée est bruitée, ce qui rend le signal de récompense bruité également. Nous proposons une méthode d'apprentissage pour éliminer partiellement ce bruit. La fixation binoculaire est apprise dans un environnement simulé sur un ensemble d'objets aux couleurs et formes variées. La politique apprise est comparée avec une autre entraînée à partir d'une récompense lisse et informative. Nous observons des performances similaires, montrant qu'une étape d'encodage de l'environnement peut remplacer des informations à priori.

Mots clés

auto encodeurs convolutifs apprentissage autonome apprentissage par renforcement profond détection d'anomalies semi supervisée fixation binoculaire

Domaines

Vision par ordinateur et reconnaissance de formes [cs.CV]

Fichier principal

orasis2017_francois_delabourdonnaye.pdf (5.11 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

CCSD Sciencesconf.org : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01866766

Soumis le : lundi 3 septembre 2018-15:58:56

Dernière modification le : samedi 22 avril 2023-04:28:50

Archivage à long terme le : mardi 4 décembre 2018-19:39:37

Dates et versions

hal-01866766 , version 1 (03-09-2018)

Identifiants

HAL Id : hal-01866766 , version 1

Citer

François de La Bourdonnaye, Céline Teulière, Thierry Chateau, Jochen Triesch. Apprentissage par renforcement profond de la fixation binoculaire en utilisant de la détection d'anomalies. ORASIS 2017, GREYC, Jun 2017, Colleville-sur-Mer, France. ⟨hal-01866766⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

PRES_CLERMONT CNRS INSTITUT_PASCAL ORASIS2017

122 Consultations

265 Téléchargements

Apprentissage par renforcement profond de la fixation binoculaire en utilisant de la détection d'anomalies

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager