, Notre outil SegDoc déve-loppé antérieurement a été étendu et adapté pour effectuer ce traitement et produire une sortie XML qui contient la conversation, les messages individuels, leurs en-têtes, et les phrases associés à chaque message. L'outil continue d'être développé et sera prochainement publié en source ouvert. Bien qu'aujourd'hui SegDoc utilise des SRX comme outil principal de segmentation en phrases, il est conçu pour pouvoir facilement intégrer d'autres outils de segmentation, Nous avons abordé le problème de la segmentation de courriels en vue de les préparer à de l'extraction d'informations. Nous avons proposé une méthode pour identifier et extraire les messages cités dans d'autres messages, 2009.

, Références Alias-I, 2008.

S. Bird, E. Loper, and E. E. Klein, Natural Language Processing with Python, 2009.

A. Lampert, R. Dale, and C. Paris, Segmenting email message text into zones, Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, vol.2, pp.919-928, 2009.

M. Mi?kowski and J. Lipski, Human Language Technologies as a Challenge for Computer Science and Linguistics, Wydawnictwo Pozna´nskiePozna´nskie, pp.556-560, 2009.

J. Read, R. Dridan, S. Oepen, and L. J. Solberg, Sentence boundary detection: A long solved problem?, The COLING 2012 Organizing Committee, pp.985-994, 2012.

W. Styler, The enronsent corpus, 2011.