Kernel based learning on hierarchical image representations : applications to remote sensing data classification

Yanwei Cui 1, 2
2 OBELIX - Environment observation with complex imagery
UBS - Université de Bretagne Sud, IRISA-D5 - SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE
Résumé : La représentation d'image sous une forme hiérarchique a été largement utilisée dans un contexte de classification. Une telle représentation est capable de modéliser le contenu d'une image à travers une structure arborescente, où les objets d'intérêt (représentés par les noeuds de l'arbre) peuvent être appréhendés à différentes échelles et où la relation topologique entre les objets (par exemple A fait partie de B, ou B se compose de A) peut être facilement décrite grâce aux arêtes de l'arbre. Cependant, pour bénéficier pleinement de ces informations-clés, des méthodes d'apprentissage statistiques doivent être développées pour traiter directement les données structurées sous leur forme hiérarchique. Dans cette thèse, nous considérons les méthodes à noyaux qui permettent de prendre en entrée des données sous une forme structurée et de tenir compte des informations topologiques présentes dans chaque structure en concevant des noyaux structurés. Nous appliquons le noyau que nous avons développé aux tâches usuelles de classification des images de télédétection, permettant ainsi de découvrir des modèles complexes dans les représentations hiérarchiques des images. Nous présentons un noyau structuré dédié aux structures telles que des arbres non ordonnés et des chemins (séquences de noeuds) équipés d'attributs numériques. Le noyau proposé, appelé Bag of Subpaths Kernel (BoSK), est une instance du noyau de convolution et s'appuie sur l'extraction de sous-structures de sous-chemins, plus précisement un sac de tous les chemins et des n{\oe}uds simples. Il est formé en sommant les noyaux calculés sur toutes les paires de sous-chemins de même longueur entre deux sacs. Le calcul direct de BoSK peut se faire selon un schéma itératif, amenant à une complexité quadratique par rapport à la taille de la structure (nombre de n{\oe}uds) et la quantité de données (taille de l'ensemble d'apprentissage). Cependant, une telle complexité ne permet pas d'utiliser BoSK pour résoudre des problèmes à grande échelle, où la structure peut contenir des centaines de n{\oe}uds et les données d'apprentissage disponibles peuvent comporter plus de dix milliers d'échantillons. Par conséquent, nous proposons également une version rapide de notre algorithme, appelé Scalable BoSK (SBoSK), qui s'appuie sur les Random Fourier Features pour projeter les données structurées dans un espace euclidien, où le produit scalaire du vecteur transformé est une approximation de BoSK. Cet algorithme bénéficie d'une complexité non plus quadratique mais linéaire par rapport aux tailles de la structure et de l'ensemble d'apprentissage, rendant ainsi le noyau adapté aux situations d'apprentissage à grande échelle. Grâce à (S)BoSK, nous sommes en mesure d'effectuer un apprentissage à partir d'informations présentes à plusieurs échelles dans les représentations hiérarchiques d'image. (S)BoSK fonctionne sur des chemins, permettant ainsi de tenir compte du contexte d'un pixel (feuille de la représentation hiérarchique) par l'intermédiaire de ses régions ancêtres à plusieurs échelles. Un tel modèle est utilisé dans la classification des images au niveau pixel. (S)BoSK fonctionne également sur les arbres, ce qui le rend capable de modéliser la composition d'un objet (racine de la représentation hiérarchique) et les relations topologiques entre ses sous-parties. Cette stratégie permet la classification des tuiles ou parties d'image. En poussant plus loin l'utilisation de (S)BoSK, nous introduisons une nouvelle approche de classification multi-source qui effectue la classification directement à partir d'une représentation hiérarchique construite sur deux images de la même scène prises à différentes résolutions, éventuellement selon différentes capteurs. Les évaluations sur plusieurs jeux de données de télédétection disponibles dans la communauté illustrent la supériorité de (S)BoSK par rapport à l'état de l'art en termes de précision de classification, et les expériences menées sur une tâche de classification urbaine montrent la pertinence de l'approche de classification multi-source proposée.
Type de document :
Thèse
Machine Learning [stat.ML]. Université Bretagne Loire 2017. English
Liste complète des métadonnées

Littérature citée [220 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/tel-01671529
Contributeur : Yanwei Cui <>
Soumis le : vendredi 22 décembre 2017 - 13:07:15
Dernière modification le : mercredi 16 mai 2018 - 11:24:14

Fichier

Thesis_IRISA_YanweiCUI.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01671529, version 1

Citation

Yanwei Cui. Kernel based learning on hierarchical image representations : applications to remote sensing data classification. Machine Learning [stat.ML]. Université Bretagne Loire 2017. English. 〈tel-01671529〉

Partager

Métriques

Consultations de la notice

321

Téléchargements de fichiers

257