De la collecte à l’analyse d’un corpus de SMS authentiques : une démarche pluridisciplinaire

Résumé : Nous présentons notre approche fondée sur les données authentiques, en nous concentrant sur des recherches récentes, portant sur le recueil, le traitement et l’analyse d’un grand corpus de SMS en français, intitulé 88milSMS (http://88milsms.huma-num.fr/, Panckhurst, Détrie, Lopez, Moïse, Roche, Verine, 2014), incluant un questionnaire sociolinguistique soumis aux donateurs au moment de la collecte ainsi que leurs réponses. Puis nous expliquons pourquoi, dans une démarche pluridisciplinaire (située entre sciences du langage, informatique et traitement automatique du langage naturel), nous avons décidé de fournir à la communauté scienti que et au grand public le corpus de SMS.
Type de document :
Article dans une revue
Histoire Epistémologie Langage, SHESL/EDP Sciences, 2016, Constitution de corpus linguistiques et pérennisation des données, 38 (2), pp.63-82. 〈http://www.hel-journal.org/fr/〉. 〈10.1051/hel/2016380206〉
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01485577
Contributeur : Rachel Panckhurst <>
Soumis le : jeudi 9 mars 2017 - 09:44:09
Dernière modification le : mercredi 10 octobre 2018 - 14:28:12

Identifiants

Citation

Rachel Panckhurst, Mathieu Roche, Cédric Lopez, Bertrand Verine, Catherine Détrie, et al.. De la collecte à l’analyse d’un corpus de SMS authentiques : une démarche pluridisciplinaire. Histoire Epistémologie Langage, SHESL/EDP Sciences, 2016, Constitution de corpus linguistiques et pérennisation des données, 38 (2), pp.63-82. 〈http://www.hel-journal.org/fr/〉. 〈10.1051/hel/2016380206〉. 〈hal-01485577〉

Partager

Métriques

Consultations de la notice

360