TREMoLo-Tweets corpus : guide d'annotation pour un corpus annoté en registres de langue pour le français - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2021

TREMoLo-Tweets corpus : guide d'annotation pour un corpus annoté en registres de langue pour le français

Résumé

This work is part of the TREMoLo project dedicated to language registers (casual, neutral, and formal). Here, we present an annotation guide grounded on a linguistic analysis of language registers and Computer-Mediated Communications (CMCs). It gives instructions for annotating French tweets according to the tripartition casual, neutral, and formal. First, it specifies and defines the elements specific to CMCs. Then, it presents the protocol for annotating tweets in language registers. All annotation choices have to be justified by at least one linguistic descriptor. The complete list of linguistic descriptors is presented with examples at the end of the annotation guide.
Fichier principal
Vignette du fichier
Guide_d_annotation_pour_un_corpus_annot__en_registres_de_langue_fran_ais.pdf (3.58 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03218217 , version 1 (05-05-2021)
hal-03218217 , version 2 (02-09-2021)
hal-03218217 , version 3 (02-09-2021)
hal-03218217 , version 4 (03-09-2021)
hal-03218217 , version 5 (16-09-2021)

Identifiants

  • HAL Id : hal-03218217 , version 2

Citer

Jade Mekki, Gwénolé Lecorvé, Delphine Battistelli, Nicolas Béchet. TREMoLo-Tweets corpus : guide d'annotation pour un corpus annoté en registres de langue pour le français. 2021. ⟨hal-03218217v2⟩
343 Consultations
286 Téléchargements

Partager

Gmail Facebook X LinkedIn More