Synthèse de vues pour l'initialisation de pose

Pierre Rolin 1
1 MAGRIT - Visual Augmentation of Complex Environments
Inria Nancy - Grand Est, LORIA - ALGO - Department of Algorithms, Computation, Image and Geometry
Résumé : La localisation est un problème récurrent de la vision par ordinateur, avec des applications dans des domaines multiples tels que la robotique ou la réalité augmentée. Dans cette thèse on considère en particulier le problème d’initialisation de la pose, c’est-à-dire la localisation sans information a priori sur la position de la caméra. Nous nous intéressons à la localisation à partir d’une image monoculaire et d’un nuage de points reconstruit à partir d’une séquence d’images. Puisque nous n’avons pas d’a priori sur la position de la caméra, l’estimation de la pose s’appuie sur la recherche de correspondances entre des points de l’image et des points du modèle de la scène. Cette mise en correspondance est difficile en raison de sa combinatoire élevée. Elle peut être mise en défaut lorsque l’image dont on cherche la pose est très différente de celles ayant servi à la construction du modèle, en particulier en présence de forts changements de point de vue. Cette thèse développe une approche permettant la mise en correspondance imagemodèle dans ces situations complexes. Elle consiste à synthétiser localement l’apparence de la scène à partir de points de vue virtuels puis à ajouter au modèle des descripteurs extraits des images synthétisées. Comme le modèle de scène est un nuage de points, la synthèse n’est pas faite par rendu 3D mais utilise des transformations 2D locales des observations connues de la scène. Les contributions suivantes sont apportées. Nous étudions différents modèles de transformation possibles et montrons que la synthèse par homographie est la plus adaptée pour ce type d’application. Nous définissons une méthode de positionnement des points de vue virtuels par rapport à une segmentation de la scène en patchs plans. Nous assurons l’efficacité de l’approche proposée en ne synthétisant que des vues utiles : elles sont éloignées de celles existantes et elles ne se recouvrent pas. Nous vérifions également que la scène est visible à partir des points des vue virtuels pour ne pas produire des vues aberrantes à cause d’occultations. Enfin, nous proposons une méthode de recherche de correspondances image-modèle qui est à la fois rapide et robuste. Cette méthode exploite la répartition non-uniforme des correspondances correctes dans le modèle, ce qui permet de guider leur recherche. Les résultats expérimentaux montrent que la méthode proposée permet de calculer des poses dans des configurations défavorables où es approches standard échouent. De façon générale la précision des poses obtenues augmente significativement lorsque la synthèse de vue est utilisée. Enfin nous montrons que, en facilitant la mise en correspondance image-modèle, cette méthode accélère le calcul de pose.
Type de document :
Thèse
Vision par ordinateur et reconnaissance de formes [cs.CV]. Université de Lorraine, 2017. Français
Liste complète des métadonnées

Littérature citée [63 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/tel-01536649
Contributeur : Pierre Rolin <>
Soumis le : lundi 24 juillet 2017 - 18:55:43
Dernière modification le : jeudi 11 janvier 2018 - 06:25:23
Document(s) archivé(s) le : mercredi 10 janvier 2018 - 11:50:33

Identifiants

  • HAL Id : tel-01536649, version 1

Citation

Pierre Rolin. Synthèse de vues pour l'initialisation de pose. Vision par ordinateur et reconnaissance de formes [cs.CV]. Université de Lorraine, 2017. Français. 〈tel-01536649〉

Partager

Métriques

Consultations de la notice

248

Téléchargements de fichiers

140