Triangular similarity metric learning : A siamese architecture approach

Lilei Zheng 1
1 imagine - Extraction de Caractéristiques et Identification
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
Résumé : Dans de nombreux problèmes d’apprentissage automatique et de reconnaissance des formes, il y a toujours un besoin de fonctions métriques appropriées pour mesurer la distance ou la similarité entre des données. La fonction métrique est une fonction qui définit une distance ou une similarité entre chaque paire d’éléments d’un ensemble de données. Dans cette thèse, nous proposons une nouvelle methode, Triangular Similarity Metric Learning (TSML), pour spécifier une fonction métrique de données automatiquement. Le système TSML proposée repose une architecture Siamese qui se compose de deux sous-systèmes identiques partageant le même ensemble de paramètres. Chaque sous-système traite un seul échantillon de données et donc le système entier reçoit une paire de données en entrée. Le système TSML comprend une fonction de coût qui définit la relation entre chaque paire de données et une fonction de projection permettant l’apprentissage des formes de haut niveau. Pour la fonction de coût, nous proposons d’abord la similarité triangulaire (Triangular Similarity), une nouvelle similarité métrique qui équivaut à la similarité cosinus. Sur la base d’une version simplifiée de la similarité triangulaire, nous proposons la fonction triangulaire (the triangular loss) afin d’effectuer l’apprentissage de métrique, en augmentant la similarité entre deux vecteurs dans la même classe et en diminuant la similarité entre deux vecteurs de classes différentes. Par rapport aux autres distances ou similarités, la fonction triangulaire et sa fonction gradient nous offrent naturellement une interprétation géométrique intuitive et intéressante qui explicite l’objectif d’apprentissage de métrique. En ce qui concerne la fonction de projection, nous présentons trois fonctions différentes: une projection linéaire qui est réalisée par une matrice simple, une projection non-linéaire qui est réalisée par Multi-layer Perceptrons (MLP) et une projection non-linéaire profonde qui est réalisée par Convolutional Neural Networks (CNN). Avec ces fonctions de projection, nous proposons trois systèmes de TSML pour plusieurs applications: la vérification par paires, l’identification d’objet, la réduction de la dimensionnalité et la visualisation de données. Pour chaque application, nous présentons des expérimentations détaillées sur des ensembles de données de référence afin de démontrer l’efficacité de notre systèmes de TSML.
Type de document :
Thèse
Other [cs.OH]. Université de Lyon, 2016. English. 〈NNT : 2016LYSEI045〉
Liste complète des métadonnées

Littérature citée [204 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/tel-01314392
Contributeur : Abes Star <>
Soumis le : jeudi 28 septembre 2017 - 16:58:07
Dernière modification le : vendredi 10 novembre 2017 - 01:21:13

Fichier

these.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01314392, version 2

Collections

Citation

Lilei Zheng. Triangular similarity metric learning : A siamese architecture approach. Other [cs.OH]. Université de Lyon, 2016. English. 〈NNT : 2016LYSEI045〉. 〈tel-01314392v2〉

Partager

Métriques

Consultations de la notice

75

Téléchargements de fichiers

92