Metric learning for structured data

Jiajun Pan

Thèse Année : 2019

Metric learning for structured data

Apprentissage de métriques pour données structurées

(1)

Jiajun Pan

Fonction : Auteur

Laboratoire des Sciences du Numérique de Nantes

Résumé

Metric learning is a branch of machine learning, and more specifically representation learning, which involves learning the parameters of a metric in order to improve its intrinsic qualities when using it. In this thesis, we summarize recent developments around metric learning, both on so-called flat data, but also on structured data. The lack of power of representation of the metrics currently used leads us to propose a new metric based on sub-modular functions. This new proposal significantly increases the evaluation of interactions between data dimensions. A learning algorithm for this metric is then proposed. Secondly, we present two approaches LSCS (selection of relational constraints) and MRML (multi-relation metric learning) allowing to process types of data extremely present in information systems: relational databases. All of these proposals are then compared experimentally with existing ones, justifying the practical interest of the proposed approaches.

L’apprentissage de métrique est une branche de l’apprentissage automatique, et plus spécifiquement de l’apprentissage de représentation, qui consiste à apprendre les paramètres d’une métrique de façon à améliorer ses qualités intrinsèques lors de son utilisation. Dans cette thèse, nous résumons les récents développements autour de ces apprentissages de métrique, à la fois sur des données dites plates, mais également sur des données structurées. Le manque de pouvoir de représentation des métriques actuellement utilisées nous conduit à proposer une nouvelle métrique fondée sur des fonctions sous-modulaires. Cette nouvelle proposition d’augmenter de manière significative l’évaluation des interactions entre dimensions des données. Un algorithme d’apprentissage de cette métrique est par la suite proposé. Dans un second temps, nous présentons deux approches LSCS (sélection de contraintes relationnelles) et MRML (multi-relation metric learning) permettant de traiter des types de données extrêmement présent dans les systèmes d’informations: les bases de données relationnelles. L’ensemble de ces propositions sont ensuite expérimentalement comparés à l’existant, justifiant l’intérêt pratique des approches proposées.

Mots clés

metric learning

Apprentissage de métrique

Domaines

Intelligence artificielle [cs.AI] Apprentissage [cs.LG]

Fichier principal

PAN.pdf (2.6 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Hoel Le Capitaine : Connectez-vous pour contacter le contributeur

https://hal.science/tel-03180284

Soumis le : jeudi 25 mars 2021-19:13:55

Dernière modification le : vendredi 24 mars 2023-14:53:21

Archivage à long terme le : samedi 26 juin 2021-18:07:13

Dates et versions

tel-03180284 , version 1 (25-03-2021)

Identifiants

HAL Id : tel-03180284 , version 1

Citer

Jiajun Pan. Metric learning for structured data. Artificial Intelligence [cs.AI]. Université de Nantes, 2019. English. ⟨NNT : ⟩. ⟨tel-03180284⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-NANTES INSTITUT-TELECOM CNRS EC-NANTES UNAM LS2N LS2N-DUKE NANTES-UNIVERSITE

97 Consultations

163 Téléchargements

Metric learning for structured data

Apprentissage de métriques pour données structurées

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager