, Il convient de noter toutefois que subsiste un aspect supervisé qui pourrait limiter la robustesse de la méthode par rapport à la diversité des types de documents : l'apprentissage des modèles de prédiction des frontières effectué sur un corpus segmenté manuellement. Si les indices considérés ici sont suffisamment généraux pour donner à penser que l'extension à d'autres documents est possible, une vérification est toutefois nécessaire. C'est d'ailleurs l'une des premières perspectives du travail présenté, Bien qu'appliqué à deux sources de connaissances, notre modèle offre un cadre générique permettant d'accueillir d'autres indices

A. J. Références, J. Carbonell, G. Doddington, and Y. , Topic detection and tracking pilot study final report, Proc. DARPA Broadcast News Transcription and Understanding Workshop, 1998.

B. D. Berger-a and . Lafferty-j, Statistical models for text segmentation, Machine Learning, vol.34, pp.177-210, 1999.

G. M. Mckeown-k and F. , Discourse segmentation of multi-party conversation, Proc. Association for Computational Linguistics, 2003.

G. S. , G. E. , B. Gravier, and G. Mostefa-d.-&-choukri-k, Corpus description of the ESTER evaluation campaign for the rich transcription of French broadcast news, Proc. Language Resources and Evaluation Conference, 2006.

H. M. , TextTiling : Segmenting text into multi-paragraph subtopic passages, Computational Linguistics, vol.23, issue.1, pp.33-64, 1997.

H. S. and G. G. Sébillot-p, Morphosyntactic processing of N-best lists for improved recognition and confidence measure computation, Proc. European Conf. on Speech Communication and Technology, 2007.

P. R. Litman-d, Discourse segmentation by human and automated means, Computational Linguistics, vol.23, issue.1, pp.103-139, 1997.

P. A. , A critique and improvement of an evaluation metric for text segmentation, Computational Linguistics, vol.28, issue.1, pp.19-36, 2002.

R. , Combining statistical data analysis techniques to extract topical keyword classes from corpora, vol.9, pp.105-127, 2005.

S. A. Shriberg, E. Bates-r, M. Ostendorf, D. Hakkani, M. Plauche et al., Automatic detection of sentence boundaries and disfluencies based on recognized words, Proc. Intl. Conf. on Spoken Language Processing, 1998.

T. G. Hakkani-tür-d, . Stolcke-a, and . Shriberg-e, Integrating prosodic and lexical cues for automatic topic segmentation, Computational Linguistics, vol.21, issue.1, pp.31-57, 2001.

U. , A statistical model for domain-independent text segmentation, Proc. Association for Computational Linguistics, 2001.