Apprentissage statistique de classes sémantiques pour l’interprétation d’images aériennes - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2016

Statistical learning of classes Semantics for interpretation Aerial images

Apprentissage statistique de classes sémantiques pour l’interprétation d’images aériennes

Résumé

This work is about interpretation of the content of very high resolution aerial optical panchromatic images. Two methods are proposed for the classification of this kind of images. The first method aims at detecting the instances of a class of objects and the other method aims at segmenting superpixels extracted from the images using a contextual model of the relations between the superpixels. The object detection method in very high resolution images uses a mixture of appearance models of a class of objects then fuses the hypothesis returned from each model. We develop a method that clusters training samples into visual subcategories based on a two stages procedure using metadata and visual information. The clustering part allows to learn models that are specialised in recognizing a visual subcategory and whose fusion allow to generalize the detection to the whole semantic category. The performances of the method are evaluate on several dataset of very high resolution images at several resolutions and several places. The method proposed for contextual semantic segmentation use a combination of visual description of a superpixel extract from the image and contextual information gathered between superpixels. The contextual representation is based on a graph where the nodes are the superpixels and the edges are the relations between two neighbors. Finally we predict the category of a superpixel using the predictions made by of the neighbors using the contextual model in order to make the prediction more reliable. We test our method on a dataset of very high resolution images.
Ce travail concerne l’interprétation du contenu des images aériennes optiques panchromatiques très haute résolution. Deux méthodes pour la classification du contenu de ces images ont été développées. Une méthode basée sur la détection des instances des différentes catégories d’objets et une autre méthode basée sur la segmentation sémantique de l’image utilisant un modèle des relations de contexte entre les superpixels extraits de l’image. La méthode de détection des objets dans une image très haute résolution est basée sur l’apprentissage d’un mélange de modèles d’apparence d’une catégorie d’objets à détecter puis de la fusion des hypothèses renvoyées par le mélange. Nous proposons une méthode de partitionnement des exemples d’apprentissage de la base en sous-catégories visuelles basée sur une procédure en deux étapes qui utilise les métadonnées des exemples et leurs apparences. Cette phase de partitionnement permet d’apprendre des modèles d’apparence où chaque modèle est spécialisé dans la reconnaissance d’une sous-catégorie visuelle de la base et dont la fusion permet de généraliser les détections à l’ensemble de la classe sémantique. Les performances du détecteur ainsi obtenues sont évaluées sur plusieurs bases d’images aériennes très haute résolution à des différentes résolutions et en plusieurs endroits du monde. La méthode de segmentation sémantique contextuelle développée utilise une combinaison des descriptions visuelles des superpixels extraits d’une image et des informations de contexte extraits entre les superpixel. La représentation du contexte entre les superpixels est obtenu en utilisant une représentation par modèle graphique entre les superpixels voisins. Les noeuds du graphes correspondant à la représentation visuelle d’un superpixel et les arêtes la représentation contextuelle entre deux voisins. Enfin nous présentons une méthode de prédiction de la catégorie d’un superpixel en fonction des décisions données par les voisins pour rendre les prédictions plus robustes. La méthode a été testé sur une base d’image aérienne très haute résolution.
Fichier principal
Vignette du fichier
DTIM17020.1487680751.pdf (14.84 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01482119 , version 1 (03-03-2017)
tel-01482119 , version 2 (12-01-2018)

Identifiants

  • HAL Id : tel-01482119 , version 1

Citer

Hicham Randrianarivo. Apprentissage statistique de classes sémantiques pour l’interprétation d’images aériennes. Traitement des images [eess.IV]. CONSERVATOIRE DES ARTS ET METIERS (CNAM), 2016. Français. ⟨NNT : ⟩. ⟨tel-01482119v1⟩
432 Consultations
191 Téléchargements

Partager

Gmail Facebook X LinkedIn More