ANNODIS : une approche outillée de l'annotation de structures discursives - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

ANNODIS : une approche outillée de l'annotation de structures discursives

Myriam Bras
  • Fonction : Auteur
  • PersonId : 1046948
Cécile Fabre
Lydia-Mai Ho-Dac
Anne Le Draoulec
Yann Mathet
Laurent Prévot
Ludovic Tanguy

Résumé

The ANNODIS project has two interconnected objectives: to produce a corpus of texts annotated at discourse-level, and to develop tools for corpus annotation and exploitation. Two sets of annotations are proposed, representing two complementary perspectives on discourse organisation: a bottom-up approach starting from minimal discourse units and building complex structures via a set of discourse relations; a top-down approach envisaging the text as a whole and using pre-identified cues to detect discourse macro-structures. The construction of the corpus goes hand in hand with the development of two interfaces: the first one supports manual annotation of discourse structures, and allows different views of the texts using NLP-based pre-processing; another interface will support the exploitation of the annotations. We present the discourse models and annotation protocols, and the interface which embodies them.
Le projet ANNODIS vise la construction d'un corpus de textes annotés au niveau discursif ainsi que le développement d'outils pour l'annotation et l'exploitation de corpus. Les annotations adoptent deux points de vue complémentaires : une perspective ascendante part d'unités de discours minimales pour construire des structures complexes via un jeu de relations de discours ; une perspective descendante aborde le texte dans son entier et se base sur des indices pré-identifiés pour détecter des structures discursives de haut niveau. La construction du corpus est associée à la création de deux interfaces : la première assiste l'annotation manuelle des relations et structures discursives en permettant une visualisation du marquage issu des prétraitements ; une seconde sera destinée à l'exploitation des annotations. Nous présentons les modèles et protocoles d'annotation élaborés pour mettre en œuvre, au travers de l'interface dédiée, la campagne d'annotation.
Fichier principal
Vignette du fichier
TALN_52.pdf (501.48 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00410590 , version 1 (21-08-2009)

Identifiants

  • HAL Id : hal-00410590 , version 1

Citer

Marie-Paule Péry-Woodley, Nicholas Asher, Patrice Enjalbert, Farah Benamara, Myriam Bras, et al.. ANNODIS : une approche outillée de l'annotation de structures discursives. 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper 52. ⟨hal-00410590⟩
737 Consultations
447 Téléchargements

Partager

Gmail Facebook X LinkedIn More