Comprendre les effets des erreurs d'annotations des plates-formes de TAL

Davy Weissenbacher 1 Adeline Nazarenko 2
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Les résultats des analyses des outils de TAL sont souvent des annotations qui caractérisent les séquences des textes analysés. Ces annotations sont dites erronées lorsque leurs valeurs diffèrent des valeurs attribuées par un expert. Des architectures innovantes sont aujourd'hui proposées pour annoter et corriger simultanément des annotations de différentes catégories. Mais la complexité des calculs requis limite le nombre d'annotations réellement intégrées. Nous étudions ici une alternative conservant l'architecture standard de traitement en cascade. Nous montrons, sur la résolution des anaphores, que la modélisation de l'incertitude des annotations permet de limiter l'impact des annotations erronées, d'intégrer toutes les annotations nécessaires à l'inférence et de différer la révision des erreurs à un post-traitement.
Document type :
Journal articles
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-00641508
Contributor : Davy Weissenbacher <>
Submitted on : Wednesday, November 16, 2011 - 7:17:16 AM
Last modification on : Thursday, February 7, 2019 - 5:52:56 PM

Identifiers

  • HAL Id : hal-00641508, version 1

Citation

Davy Weissenbacher, Adeline Nazarenko. Comprendre les effets des erreurs d'annotations des plates-formes de TAL. Traitement Automatique des Langues, ATALA, 2012, 52, pp.52/1. ⟨hal-00641508⟩

Share

Metrics

Record views

322