Évaluer des annotations manuelles dispersées : les coefficients sont-ils suffisants pour estimer l'accord inter-annotateurs ? - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Évaluer des annotations manuelles dispersées : les coefficients sont-ils suffisants pour estimer l'accord inter-annotateurs ?

Résumé

This article details work aiming at evaluating the quality of the manual annotation of gene renaming relations in scientific abstracts, which generates dispersed annotations. To evaluate these annotations, we computed and compared the results obtained using the commonly advocated inter-annotator agreement coefficients like κ (Cohen, 1960) or π (Scott, 1955) and analyzed to which extent they are relevant for our data. We also studied the different weighting computations applicable to κω (Cohen, 1968) and α (Krippendorff, 1980, 2004) and defined a way to compute distances between categories based on the produced annotations. We then propose a first approach to estimate the bias introduced by prevalence.
L’objectif des travaux présentés dans cet article est l’évaluation de la qualité d’annotations manuelles de relations de renommage de gènes dans des résumés scientifiques, annotations qui présentent la caractéristique d’être très dispersées. Pour cela, nous avons calculé et comparé les coefficients les plus communément utilisés, entre autres κ (Cohen, 1960) et π (Scott, 1955), et avons analysé dans quelle mesure ils sont adaptés à nos données. Nous avons également étudié les différentes pondérations applicables à ces coefficients permettant de calculer le κ pondéré (Cohen, 1968) et l’α (Krippendorff, 1980, 2004). Nous avons ainsi étudié le biais induit par la grande prévalence d’une catégorie et défini un mode de calcul des distances entre catégories reposant sur les annotations réalisées.
Fichier principal
Vignette du fichier
taln-iaa-KFCFMG_final.pdf (157.27 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00484265 , version 1 (18-05-2010)
hal-00484265 , version 2 (27-05-2010)

Identifiants

  • HAL Id : hal-00484265 , version 2

Citer

Karen Fort, Claire François, Maha Ghribi. Évaluer des annotations manuelles dispersées : les coefficients sont-ils suffisants pour estimer l'accord inter-annotateurs ?. Traitement Automatique des Langues Naturelles (TALN), Jul 2010, Montréal, France. ⟨hal-00484265v2⟩
150 Consultations
773 Téléchargements

Partager

Gmail Facebook X LinkedIn More