Constitution d'un corpus de français tchaté
Résumé
We present in this article a french chat corpus, intended for the study of chat language. This corpus, automatically collected and coded, is especially remarkable for its extent, since it covers a total of 4 million messages on 105 channels, heterogeneous from a thematic and pragmatic point of view. Its simple coding will not, however, be sufficient for all purposes. It is available on the Web, and browsable using a Web interface.
Nous présentons dans cet article un corpus de français tchaté, destiné à l'étude de la langue du tchat. Ce corpus, collecté et encodé automatiquement, est remarquable avant tout par son étendue, puisqu'il couvre un total de 4 millions de messages sur 105 canaux, hétérogènes sur les plans thématique et pragmatique. Son codage simple ne sera toutefois pas satisfaisant pour tous les usages. Il est disponible sur un site Web, et consultable grâce à une interface web.
Fichier principal
2005RECITALPaper-Falaise.pdf (161.96 Ko)
Télécharger le fichier
2005RECITALSlides-Falaise.pdf (1.17 Mo)
Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Autre