déposer
version française rss feed
HAL : hal-00604369, version 1

Fiche détaillée  Récupérer au format
5th Linguistics Annotation Workshop (The LAW V), Portland : États-Unis (2011)
Proposal for an Extension of Traditional Named Entitites: from Guidelines to Evaluation, an Overview
Cyril Grouin 1, Sophie Rosset 1, Pierre Zweigenbaum 1, Karën Fort 2, 3, Olivier Galibert 4, Ludovic Quintard 4
Quaero Collaboration(s)
(24/06/2011)

Within the framework of the construction of a fact database, we defined guidelines to extract named entities, using a taxonomy based on an extension of the usual named entities defini- tion. We thus defined new types of entities with broader coverage including substantive- based expressions. These extended named en- tities are hierarchical (with types and compo- nents) and compositional (with recursive type inclusion and metonymy annotation). Human annotators used these guidelines to annotate a 1.3M word broadcast news corpus in French. This article presents the definition and novelty of extended named entity annotation guide- lines, the human annotation of a global corpus and of a mini reference corpus, and the evalu- ation of annotations through the computation of inter-annotator agreement. Finally, we dis- cuss our approach and the computed results, and outline further work.
1 :  Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [Orsay] (LIMSI)
CNRS : UPR3251 – Université Pierre et Marie Curie [UPMC] - Paris VI – Université Paris XI - Paris Sud
2 :  Institut de l'information scientifique et technique (INIST)
CNRS : UPS76
3 :  Laboratoire d'informatique de Paris-nord (LIPN)
CNRS : UMR7030 – Université Paris XIII - Paris Nord
4 :  Laboratoire National de Métrologie et d'Essais - Institut National de Métrologie (LNE- INM)
Conservatoire National des Arts et Métiers (CNAM)
RCLN
Informatique/Traitement du texte et du document
named entities – annotation – evaluation
Liste des fichiers attachés à ce document : 
PDF
grouin2011law_final.pdf(237.2 KB)

tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...