Skip to Main content Skip to Navigation
Conference papers

Apprentissage supervisé sur ressources encyclopédiques pour l'enrichissement d'un lexique de noms propres destiné à la reconnaissance des entités nommées

Nadia Okinina 1 Damien Nouvel 2, 1 Nathalie Friburger 1 Jean-Yves Antoine 1
1 BDTLN - Bases de données et traitement des langues naturelles
LIFAT - Laboratoire d'Informatique Fondamentale et Appliquée de Tours
2 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing
Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7
Résumé : Cet article présente une méthode hybride d'enrichissement d'un lexique de noms propres à partir de la base encyclopédique en ligne Wikipedia. Une des particularités de cette recherche est de viser l'enrichissement d'une ressource existante (Prolexbase) très contrôlée décrivant finement les noms propres. A la différence d'autres travaux destinés à la reconnaissance des entités nommées, notre objectif est donc de réaliser un enrichissement automatique de qualité. Notre approche repose sur l'utilisation en pipe-line de règles déterministes basées sur certaines informations DBpedia et d'une catégorisation supervisée à base de classifieur SVM. Nos résultats montrent qu'il est ainsi possible d'enrichir un lexique de noms propres avec une très bonne précision.
Complete list of metadatas

Cited literature [7 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01016545
Contributor : Jean-Yves Antoine <>
Submitted on : Thursday, July 3, 2014 - 9:03:23 AM
Last modification on : Saturday, March 28, 2020 - 2:11:27 AM
Document(s) archivé(s) le : Friday, October 3, 2014 - 10:42:00 AM

File

TALN_2013_WIKIPEDIA_final2.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-01016545, version 1

Citation

Nadia Okinina, Damien Nouvel, Nathalie Friburger, Jean-Yves Antoine. Apprentissage supervisé sur ressources encyclopédiques pour l'enrichissement d'un lexique de noms propres destiné à la reconnaissance des entités nommées. TALN'2013, 20e conférence sur le Traitement Automatique des Langues Naturelles, Jun 2011, Les Sable d'Olonne, France. pp.667-674. ⟨hal-01016545⟩

Share

Metrics

Record views

268

Files downloads

191