Modèle Transformer à base de Connaissances pour la Recherche d'Information dans des Domaines Spécialisés
Résumé
Le problème de la disparité des termes (term mismatch) occure fré-quement en recherche d'information (RI). Il peut se produire lorsque la requête est courte et/ou ambiguë mais aussi dans des domaines spécialisés où les re-quêtes sont effectuées par des non-spécialistes et les documents sont rédigés par des experts. Récemment, le problème de disparité des termes a été abordé à l'aide de modèles neuronaux d'apprentissage de classement (Neural Learning-To-Rank) et de plongements de mots pour éviter d'utiliser uniquement la corres-pondance exacte des termes pour la recherche. Une autre approche au problème de la disparité des termes consiste à utiliser des bases de connaissances (Know-ledge Bases) qui peuvent associer différents termes au même concept. Compte tenu du succès récent des encodeurs de type transformers en traitement auto-matique du language naturel (TALN), nous proposons KTRel : un modèle de type Neural Learning-To-Rank (NLTR) qui utilise des plongements de mots, des plongements de bases de connaissances et des encodeurs transformers pour la RI dans des domaines spécialisés. Dans cet article, nous évaluons KTRel sur une tâche de RI médicale.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...