Vers une méthodologie d'annotation des entités nommées en corpus ? - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Vers une méthodologie d'annotation des entités nommées en corpus ?

Résumé

Today, the named entity recognition task is considered as fundamental, but it involves some specific difficulties in terms of annotation. We list them here, with illustrations taken from manual annotation experiments in microbiology. Those issues lead us to ask the fun- damental question of what the annotators should annotate and, even more important, for which purpose. We thus identify the applications using named entity recognition and, according to the real needs of those applications, we propose to semantically define the elements to annotate. Finally, we put forward a number of methodological recommendations to ensure a coherent and reliable annotation scheme.
Fichier principal
Vignette du fichier
taln09_right.pdf (90.16 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00402321 , version 1 (07-07-2009)

Identifiants

  • HAL Id : hal-00402321 , version 1

Citer

Karen Fort, Maud Ehrmann, Adeline Nazarenko. Vers une méthodologie d'annotation des entités nommées en corpus ?. Traitement Automatique des Langues Naturelles 2009, Jun 2009, Senlis, France. ⟨hal-00402321⟩
359 Consultations
1036 Téléchargements

Partager

Gmail Facebook X LinkedIn More