, Il convient de noter toutefois que subsiste un aspect supervisé qui pourrait limiter la robustesse de la méthode par rapport à la diversité des types de documents : l'apprentissage des modèles de prédiction des frontières effectué sur un corpus segmenté manuellement. Si les indices considérés ici sont suffisamment généraux pour donner à penser que l'extension à d'autres documents est possible, une vérification est toutefois nécessaire. C'est d'ailleurs l'une des premières perspectives du travail présenté, Bien qu'appliqué à deux sources de connaissances, notre modèle offre un cadre générique permettant d'accueillir d'autres indices
Topic detection and tracking pilot study final report, Proc. DARPA Broadcast News Transcription and Understanding Workshop, 1998. ,
Statistical models for text segmentation, Machine Learning, vol.34, pp.177-210, 1999. ,
Discourse segmentation of multi-party conversation, Proc. Association for Computational Linguistics, 2003. ,
Corpus description of the ESTER evaluation campaign for the rich transcription of French broadcast news, Proc. Language Resources and Evaluation Conference, 2006. ,
TextTiling : Segmenting text into multi-paragraph subtopic passages, Computational Linguistics, vol.23, issue.1, pp.33-64, 1997. ,
Morphosyntactic processing of N-best lists for improved recognition and confidence measure computation, Proc. European Conf. on Speech Communication and Technology, 2007. ,
Discourse segmentation by human and automated means, Computational Linguistics, vol.23, issue.1, pp.103-139, 1997. ,
A critique and improvement of an evaluation metric for text segmentation, Computational Linguistics, vol.28, issue.1, pp.19-36, 2002. ,
Combining statistical data analysis techniques to extract topical keyword classes from corpora, vol.9, pp.105-127, 2005. ,
Automatic detection of sentence boundaries and disfluencies based on recognized words, Proc. Intl. Conf. on Spoken Language Processing, 1998. ,
Integrating prosodic and lexical cues for automatic topic segmentation, Computational Linguistics, vol.21, issue.1, pp.31-57, 2001. ,
A statistical model for domain-independent text segmentation, Proc. Association for Computational Linguistics, 2001. ,