Apprendre des représentations jointes de mots et d'entités pour la désambiguïsation d'entités - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Apprendre des représentations jointes de mots et d'entités pour la désambiguïsation d'entités

Résumé

Combining Word and Entity Embeddings for Entity Linking. The correct identification of the link between an entity mention in a text and a known entity in a large knowledge base is important in information retrieval or information extraction. However, systems have to deal with ambiguity as numerous entities could be linked to a mention. This paper proposes a novel method for entity disambiguation which is based on the joint learning of embeddings for the words in the text and the entities in the knowledge base. By learning these embeddings in the same space we arrive at a more conceptually grounded model that can be used for candidate selection based on the surrounding context.
La désambiguïsation d'entités (ou liaison d'entités), qui consiste à relier des mentions d'entités d'un texte à des entités d'une base de connaissance, est un problème qui se pose, entre autre, pour le peuplement automatique de bases de connaissances à partir de textes. Une difficulté de cette tâche est la résolution d'ambiguïtés car les systèmes ont à choisir parmi un nombre important de candidats. Cet article propose une nouvelle approche fondée sur l'apprentissage joint de représentations distribuées des mots et des entités dans le même espace, ce qui permet d'établir un modèle robuste pour la comparaison entre le contexte local de la mention d'entité et les entités candidates.
Fichier principal
Vignette du fichier
taln2017desamb.pdf (279.91 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01626197 , version 1 (13-11-2017)

Identifiants

  • HAL Id : hal-01626197 , version 1
  • OATAO : 22152

Citer

Jose G. Moreno, Romaric Besancon, Romain Beaumont, Eva d'Hondt, Anne-Laure Ligozat, et al.. Apprendre des représentations jointes de mots et d'entités pour la désambiguïsation d'entités. 24ème Conférence sur le Traitement Automatique des Langues Naturelles - TALN 2017, LLL (Laboratoire Ligérien de Linguistique); LIFO (Laboratoire d’Informatique Fondamentale d’Orléans); LI (Laboratoire Informatique) de Tours, Jan 2017, Orléans, France. ⟨hal-01626197⟩
256 Consultations
208 Téléchargements

Partager

Gmail Facebook X LinkedIn More