Modèle Transformer à base de Connaissances pour la Recherche d'Information dans des Domaines Spécialisés

Jibril Frej; Didier Schwab; Jean-Pierre Chevallet

Communication Dans Un Congrès Extraction et Gestion des Connaissances (EGC) Année : 2020

Modèle Transformer à base de Connaissances pour la Recherche d'Information dans des Domaines Spécialisés

(1) , (2) , (1)

1
2

Jibril Frej

Fonction : Auteur
PersonId : 1064593

Laboratoire d'Informatique de Grenoble

Didier Schwab

Fonction : Auteur
PersonId : 4261
IdHAL : didier-schwab
ORCID : 0000-0002-2462-8148
IdRef : 069192359

Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole

Jean-Pierre Chevallet

Fonction : Auteur
PersonId : 169702
IdHAL : jean-pierre-chevallet
ORCID : 0000-0002-5945-9444
IdRef : 088217116

Laboratoire d'Informatique de Grenoble

Résumé

Le problème de la disparité des termes (term mismatch) occure fré-quement en recherche d'information (RI). Il peut se produire lorsque la requête est courte et/ou ambiguë mais aussi dans des domaines spécialisés où les re-quêtes sont effectuées par des non-spécialistes et les documents sont rédigés par des experts. Récemment, le problème de disparité des termes a été abordé à l'aide de modèles neuronaux d'apprentissage de classement (Neural Learning-To-Rank) et de plongements de mots pour éviter d'utiliser uniquement la corres-pondance exacte des termes pour la recherche. Une autre approche au problème de la disparité des termes consiste à utiliser des bases de connaissances (Know-ledge Bases) qui peuvent associer différents termes au même concept. Compte tenu du succès récent des encodeurs de type transformers en traitement auto-matique du language naturel (TALN), nous proposons KTRel : un modèle de type Neural Learning-To-Rank (NLTR) qui utilise des plongements de mots, des plongements de bases de connaissances et des encodeurs transformers pour la RI dans des domaines spécialisés. Dans cet article, nous évaluons KTRel sur une tâche de RI médicale.

Domaines

Informatique [cs] Intelligence artificielle [cs.AI]

Fichier principal

workshop_EGC_2020.pdf (237.82 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Jibril FREJ : Connectez-vous pour contacter le contributeur

https://hal.science/hal-02474706

Soumis le : mardi 11 février 2020-15:31:22

Dernière modification le : jeudi 4 avril 2024-21:26:42

Archivage à long terme le : mardi 12 mai 2020-15:13:16

Dates et versions

hal-02474706 , version 1 (11-02-2020)

Identifiants

HAL Id : hal-02474706 , version 1

Citer

Jibril Frej, Didier Schwab, Jean-Pierre Chevallet. Modèle Transformer à base de Connaissances pour la Recherche d'Information dans des Domaines Spécialisés. Conférence Extraction et Gestion des Connaissances, Jan 2020, Bruxelles, Belgique. ⟨hal-02474706⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS LIG LIG_TDCGE_GETALP LIG_SIDCH

165 Consultations

279 Téléchargements

Modèle Transformer à base de Connaissances pour la Recherche d'Information dans des Domaines Spécialisés

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager