Un algorithme en ligne pour la detection de nouveauté dans un flux de documents

Henri Binsztok 1 Patrick Gallinari 1
1 APA - Apprentissage et Acquisition des connaissances
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Cet article traite d’une tâche de recherche d’information qui est la détection et le suivi d’événements dans un flot de documents textuels. Avec la multiplication des flux et des sources d’information, les enjeux de cette tâche, notamment pour la veille technologique, économique, etc. sont considérables. Nous proposons d’améliorer des al- gorithmes utilisés pour la détection d’événement en combinant classification automatique et sélection de variables dans des algorithmes incrémentaux. Les expériences réalisées sur un corpus de grande taille montrent que les modèles proposés obtiennent de bonnes performances pour un faible temps de calcul.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01561448
Contributor : Lip6 Publications <>
Submitted on : Wednesday, July 12, 2017 - 5:29:24 PM
Last modification on : Thursday, March 21, 2019 - 2:22:15 PM

Identifiers

  • HAL Id : hal-01561448, version 1

Citation

Henri Binsztok, Patrick Gallinari. Un algorithme en ligne pour la detection de nouveauté dans un flux de documents. JADT 2002 - 6èmes Journées internationales d’Analyse statistique des Données Textuelles, Mar 2002, Saint-Malo, France. ⟨hal-01561448⟩

Share

Metrics

Record views

61