Constitution d'un corpus de français tchaté - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2005

Constitution d'un corpus de français tchaté

Résumé

We present in this article a french chat corpus, intended for the study of chat language. This corpus, automatically collected and coded, is especially remarkable for its extent, since it covers a total of 4 million messages on 105 channels, heterogeneous from a thematic and pragmatic point of view. Its simple coding will not, however, be sufficient for all purposes. It is available on the Web, and browsable using a Web interface.
Nous présentons dans cet article un corpus de français tchaté, destiné à l'étude de la langue du tchat. Ce corpus, collecté et encodé automatiquement, est remarquable avant tout par son étendue, puisqu'il couvre un total de 4 millions de messages sur 105 canaux, hétérogènes sur les plans thématique et pragmatique. Son codage simple ne sera toutefois pas satisfaisant pour tous les usages. Il est disponible sur un site Web, et consultable grâce à une interface web.
Fichier principal
Vignette du fichier
2005RECITALPaper-Falaise.pdf (161.96 Ko) Télécharger le fichier
2005RECITALSlides-Falaise.pdf (1.17 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Autre

Dates et versions

hal-00909667 , version 1 (26-11-2013)

Identifiants

  • HAL Id : hal-00909667 , version 1

Citer

Falaise Achille. Constitution d'un corpus de français tchaté. RECITAL, 2005, Dourdan, France. pp._. ⟨hal-00909667⟩
543 Consultations
1170 Téléchargements

Partager

Gmail Facebook X LinkedIn More