Metric learning for structured data - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2019

Metric learning for structured data

Apprentissage de métriques pour données structurées

Résumé

Metric learning is a branch of machine learning, and more specifically representation learning, which involves learning the parameters of a metric in order to improve its intrinsic qualities when using it. In this thesis, we summarize recent developments around metric learning, both on so-called flat data, but also on structured data. The lack of power of representation of the metrics currently used leads us to propose a new metric based on sub-modular functions. This new proposal significantly increases the evaluation of interactions between data dimensions. A learning algorithm for this metric is then proposed. Secondly, we present two approaches LSCS (selection of relational constraints) and MRML (multi-relation metric learning) allowing to process types of data extremely present in information systems: relational databases. All of these proposals are then compared experimentally with existing ones, justifying the practical interest of the proposed approaches.
L’apprentissage de métrique est une branche de l’apprentissage automatique, et plus spécifiquement de l’apprentissage de représentation, qui consiste à apprendre les paramètres d’une métrique de façon à améliorer ses qualités intrinsèques lors de son utilisation. Dans cette thèse, nous résumons les récents développements autour de ces apprentissages de métrique, à la fois sur des données dites plates, mais également sur des données structurées. Le manque de pouvoir de représentation des métriques actuellement utilisées nous conduit à proposer une nouvelle métrique fondée sur des fonctions sous-modulaires. Cette nouvelle proposition d’augmenter de manière significative l’évaluation des interactions entre dimensions des données. Un algorithme d’apprentissage de cette métrique est par la suite proposé. Dans un second temps, nous présentons deux approches LSCS (sélection de contraintes relationnelles) et MRML (multi-relation metric learning) permettant de traiter des types de données extrêmement présent dans les systèmes d’informations: les bases de données relationnelles. L’ensemble de ces propositions sont ensuite expérimentalement comparés à l’existant, justifiant l’intérêt pratique des approches proposées.
Fichier principal
Vignette du fichier
PAN.pdf (2.6 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-03180284 , version 1 (25-03-2021)

Identifiants

  • HAL Id : tel-03180284 , version 1

Citer

Jiajun Pan. Metric learning for structured data. Artificial Intelligence [cs.AI]. Université de Nantes, 2019. English. ⟨NNT : ⟩. ⟨tel-03180284⟩
97 Consultations
163 Téléchargements

Partager

Gmail Facebook X LinkedIn More