Un algorithme en ligne pour la detection de nouveauté dans un flux de documents
Résumé
Cet article traite d’une tâche de recherche d’information qui est la détection et le suivi d’événements dans un flot
de documents textuels. Avec la multiplication des flux et des sources d’information, les enjeux de cette tâche,
notamment pour la veille technologique, économique, etc. sont considérables. Nous proposons d’améliorer des al-
gorithmes utilisés pour la détection d’événement en combinant classification automatique et sélection de variables
dans des algorithmes incrémentaux. Les expériences réalisées sur un corpus de grande taille montrent que les
modèles proposés obtiennent de bonnes performances pour un faible temps de calcul.