Estimation de profondeur mono-image par réseaux de neurones et flou de défocalisation - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Estimation de profondeur mono-image par réseaux de neurones et flou de défocalisation

Résumé

L’estimation de la profondeur monoculaire à l’aide de réseaux de neurones profonds a atteint aujourd’hui d’excellentes performances. Cependant, il est difficile d’établir l’influence respective de l’architecture, de la fonction de coût et des conditions d’expérimentations sur ces résultats. Dans cet article, nous présentons une nouvelle architecture, appelée D3-Net, pour l’estimation de profondeur monoculaire. Cette architecture, simple à entraîner et ne reposant pas sur des modèles analytiques de la scène nous permet d’étudier l’influence de différentes fonctions de coûts (standards et proposées dans l’état de l’art) et différentes conditions expérimentales sur les performances d’estimation de profondeur. Cette étude nous a amené à choisir une fonction de coût correspondant à la norme L1, à laquelle on ajoute une fonction de coût adversaire lors qu’un grand nombre de données est disponible. Notre méthode atteint alors les performances de l’état de l’art sur la base NYUv2. De plus les approches d’estimation de profondeur par apprentissage exploitent uniquement les structures géométriques des scènes et ne prennent pas en compte un indice depuis longtemps utilisé pour l’estimation de profondeur : le flou de défocalisation. Nous présentons ici une analyse sur données simulées qui montre le gain en performance lorsque la base contient des images avec du flou de défocalisation. Nous étudions également l’influence du flou dans la prédiction de profondeur en observant l’incertitude du modèle avec une approche de réseau de neurones bayésienne.
Fichier principal
Vignette du fichier
DTIS18272.1544708421.pdf (6.08 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01977877 , version 1 (11-01-2019)

Identifiants

  • HAL Id : hal-01977877 , version 1

Citer

Marcela Carvalho, Bertrand Le Saux, Pauline Trouvé, Andrés Almansa, Frédéric Champagnat. Estimation de profondeur mono-image par réseaux de neurones et flou de défocalisation. RFIAP SFPT 2018, Jun 2018, MARNE-LA-VALLEE, France. ⟨hal-01977877⟩
135 Consultations
181 Téléchargements

Partager

Gmail Facebook X LinkedIn More