« De la collecte à l’analyse d’un corpus de SMS authentiques : une démarche pluridisciplinaire ».

Résumé : This article highlights an approach based on authentic data, by focusing on recent research related to collection, processing and analysis of a large French text-message corpus, enti- tled 88milSMS (http://88milsms.huma-num. fr/, Panckhurst, Détrie, Lopez, Moïse, Roche, Verine, 2014), including a sociolinguistic questionnaire submitted to donors (with their answers). The authors, using a pluridisci- plinary approach (linguistics/language sci- ences, computer science, Natural Language Processing), explain why they chose to give the scienti c community and the general pub- lic access to the SMS corpus.
Type de document :
Article dans une revue
Histoire Epistémologie Langage, SHESL/EDP Sciences, 2016, Constitution de corpus linguistiques et pérennisation des données 38 (2), pp.63-82. 〈http://www.hel-journal.org/fr/〉. 〈10.1051/hel/2016380206〉
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01485577
Contributeur : Rachel Panckhurst <>
Soumis le : jeudi 9 mars 2017 - 09:44:09
Dernière modification le : jeudi 11 janvier 2018 - 06:27:21

Identifiants

Citation

Rachel Panckhurst, Mathieu Roche, Cédric Lopez, Bertrand Verine, Catherine Détrie, et al.. « De la collecte à l’analyse d’un corpus de SMS authentiques : une démarche pluridisciplinaire ».. Histoire Epistémologie Langage, SHESL/EDP Sciences, 2016, Constitution de corpus linguistiques et pérennisation des données 38 (2), pp.63-82. 〈http://www.hel-journal.org/fr/〉. 〈10.1051/hel/2016380206〉. 〈hal-01485577〉

Partager

Métriques

Consultations de la notice

265