Convolutional neural networks: towards less supervision for visual recognition

Résumé : Dans cette thèse nous étudions les réseaux de neurones à convolution dans les systèmes de reconnaissance visuelle. Les réseaux de neurones à convolution récents ont d’excellentes performances pour une grande variété de tâches de reconnaissance, mais requièrent une grande quantité de données d’entraînement, annotées manuellement, pour révéler leur potentiel. Obtenir des données est une opération souvent coûteuse, et qui peut introduire des biais. Dans cette thèse nous étudions différentes manières de réduire la quantité et la compléxité de la supervision. Notre première contribution est une méthode de transfert d’apprentissage dans les réseaux à convolution pour la classification d’image. Nous apprenons des représentations intermédiaires sur la base de données ImageNet pendant une phase de préentraînement, puis utilisons les paramètres appris pour initialiser un réseau concu pour une autre tâche avec moins de données. Nous montrons d’abord que ces représentations sont assez générales pour etre utilisées sur d’autres tâches, et meilleures lorsque le pré-entraînement est réalisé avec plus de données. Ceci nous a permis d’améliorer l’état de l’art en classification d’image sur la base de données Pascal VOC. Notre deuxième contribution est une approche faiblement supervisé, tirant parti du fait que les réseaux à convolution prennent, pour la classification, des décisions basées sur les parties les plus informatives des objets. Ceci nous a permis de créer un système pouvant predire la localisation des objets en utilisant lors de l’entraînement, seulement l’indication de la présence ou l’absence des objets dans les images, et non leur position. Nous montrons que ce système améliore l’état de l’art en classification d’image sur Pascal VOC, avec des résultats comparables à ceux des systémes disposant de la position des objects. Dans notre troisième contribution, nous cherchons des pistes de progression en apprentissage non-supervisé. Nous étudions l’algorithme récent des réseaux génératifs adversariaux; ces architectures apprennent des distributions d’images et génèrent de nouveaux exemples, mais l’évaluation d’un modèle appris est difficile. Nous proposons d’utiliser un test statistique pour ce problème, qui permet un premier filtrage des modèles. Nous étudions ensuite le problème de la causalité avec des réseaux génératifs, et proposons d’utiliser un test statistique pour la découverte causale. Finalement, grâce a un lien établi récemment avec les problèmes de transport optimal,nous étudions ce que ces réseaux apprennent des données dans le cas non-supervisé.
Type de document :
Thèse
Computer Science [cs]. Ecole Normale Supérieure (ENS); ED 386 : École doctorale de sciences mathématiques de Paris centre, UPMC, 2018. English
Liste complète des métadonnées

https://hal.inria.fr/tel-01803967
Contributeur : Maxime Oquab <>
Soumis le : jeudi 31 mai 2018 - 11:00:05
Dernière modification le : mardi 11 septembre 2018 - 10:39:57
Document(s) archivé(s) le : samedi 1 septembre 2018 - 13:36:22

Fichier

Oquab PhD Thesis.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01803967, version 1

Collections

Citation

Maxime Oquab. Convolutional neural networks: towards less supervision for visual recognition. Computer Science [cs]. Ecole Normale Supérieure (ENS); ED 386 : École doctorale de sciences mathématiques de Paris centre, UPMC, 2018. English. 〈tel-01803967〉

Partager

Métriques

Consultations de la notice

487

Téléchargements de fichiers

704