A. T. , J. A. Almeida, and Y. A. , Spam filtering: how the dimensionality reduction affects the accuracy of naive Bayes classifiers, JISA, vol.1, issue.3, pp.183-200, 2011.

A. Gaussier-e, Recherche d'information, 2013.

A. S. Gaussier-e and A. A. , Régression logistique et catégorisation de textes. Modèles statistiques pour l'accès à l'information textuelle, pp.97-122, 2011.

D. L. Savoy-j, When stopword lists make the difference, JASIST, vol.61, issue.1, pp.200-203, 2010.

F. A. Rozon-f and . Lapalme-g, CATS a topic-oriented multi-document summarization system at DUC, 2005.

G. G. Tapanainen-p, What is a word ? What is a sentence ? Problems of tokenization. Actes de 3 rd conference on computational lexicography and text research, pp.79-87, 1994.

G. De, N. E. , D. A. , and P. J. , TiLT correcteur de SMS : évaluation et bilan qualitatif, pp.123-132, 2007.

J. M. and K. A. Kovar-v, The TenTen corpus family, 2013.

K. A. Baisa-v and . J. Busta, The Sketch Engine: ten years on, Lexicography, vol.1, issue.1, pp.7-36, 2014.

M. C. and R. P. Schütze-h, Introduction to information retrieval, 2008.

M. Y. Srinivasan-p, Exploring feature definition and selection for sentiment classifiers, 2011.

O. C. Mitkov-r and . Hasler-l, CAST: a computer-aided summarisation tool, Actes de 10 th Conference on European Chapter of the Association for Computational Linguistics, pp.135-173, 2003.

P. D. Fessant-f and . Bothorel-c, Approches statistique et linguistique pour la classification de textes d'opinion portant sur les films, pp.147-169, 2009.

P. V. Yousfi-monod, Compression de phrases par élagage de leur arbre morphosyntaxique . Revue des sciences et technologies de l'information, pp.437-468, 2006.

T. C. Baron and R. P. , i didn't spel that wrong did i. Oops " : analysis and normalisation of SMS spelling variationéd.) : SMS communication, pp.217-237, 2014.

T. D. Hinkelman-e, Conversation acts in task-oriented spoken dialogue, Computational Intelligence, vol.8, issue.3, pp.575-599, 1992.