Skip to Main content Skip to Navigation
Conference papers

Une nouvelle méthode ensembliste pour la reconnaissance et la désambiguïsation d'entités nommées en utilisant des réseaux de neurones

Résumé : Résumé de [Canale et al. (2018)], publié à ISWC 2018. Une tâche cruciale en extraction de connaissances à partir de textes se décompose souvent en deux tâches complémentaires : la reconnaissance d'entité nommée (NER) et la désambiguïsation d'entité nommée (NED). L'objectif consiste à attribuer à des parties du texte (mention) respectivement un type appartenant à une taxonomie prédéfinie et un identifiant unique, souvent représenté sous la forme d'URI, qui fait référence de manière univoque à une entité définie dans une base de connaissances donnée. La combinaison de ces deux tâches est souvent abrégée avec l'acronyme NERD. De nombreuses approches, souvent exposées sous forme d'API Web, ont été proposées pour ré-soudre ces tâches au cours des dernières années. En termes de NER, chaque service fournit générale-ment sa propre taxonomie de types qui peuvent être reconnus. Même si tous comprendront trois types principaux (PERSON, ORGANIZATION, LOCATION), ils diffèrent largement pour les types plus fins, ce qui complique leur comparaison et leur combinaison. En termes de NED, chaque extracteur peut potentiellement lever l'ambiguïté d'entités par rapport à des bases de connaissances spécifiques (KB), mais en pratique, ils s'appuient principalement sur des bases de connaissances généralistes, comme DBpedia ou Wikidata. Pour cette raison, la comparaison et la fusion des résultats de ces ex-tracteurs nécessitent certaines tâches de post-traitement qui dépendent généralement d'alignements entre ces bases de connaissances. Dans ce travail, nous décrivons Ensemble NERD, un framework qui regroupe de nombreuses réponses d'extracteurs, les normalise et les combine afin de produire des annotations sémantiques. Cette méthode repose sur deux réseaux d'apprentissage profond, ENNTR (Ensemble Neural Network for Type Recognition) et ENND (Ensemble Neural Network for Disambiguation), qui fournissent des modèles pour effectuer d'une part un alignement entre les types et d'autre part entre les entités nommées identifiées dans une base de connaissances.
Document type :
Conference papers
Complete list of metadata

Cited literature [3 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02329542
Contributor : Nathalie Hernandez Connect in order to contact the contributor
Submitted on : Wednesday, October 23, 2019 - 3:56:33 PM
Last modification on : Wednesday, March 17, 2021 - 1:58:03 PM
Long-term archiving on: : Friday, January 24, 2020 - 7:48:07 PM

File

canale&al.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-02329542, version 1

Collections

Citation

Lorenzo Canale, Pasquale Lisena, Raphaël Troncy. Une nouvelle méthode ensembliste pour la reconnaissance et la désambiguïsation d'entités nommées en utilisant des réseaux de neurones. IC 2019 - Journées francophones d'Ingénierie des Connaissances, AFIA, Jul 2019, Toulouse, France. pp.78-79. ⟨hal-02329542⟩

Share

Metrics

Les métriques sont temporairement indisponibles