Un algorithme en ligne pour la detection de nouveauté dans un flux de documents - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2002

Un algorithme en ligne pour la detection de nouveauté dans un flux de documents

Résumé

Cet article traite d’une tâche de recherche d’information qui est la détection et le suivi d’événements dans un flot de documents textuels. Avec la multiplication des flux et des sources d’information, les enjeux de cette tâche, notamment pour la veille technologique, économique, etc. sont considérables. Nous proposons d’améliorer des al- gorithmes utilisés pour la détection d’événement en combinant classification automatique et sélection de variables dans des algorithmes incrémentaux. Les expériences réalisées sur un corpus de grande taille montrent que les modèles proposés obtiennent de bonnes performances pour un faible temps de calcul.
Fichier non déposé

Dates et versions

hal-01561448 , version 1 (12-07-2017)

Identifiants

  • HAL Id : hal-01561448 , version 1

Citer

Henri Binsztok, Patrick Gallinari. Un algorithme en ligne pour la detection de nouveauté dans un flux de documents. JADT 2002 - 6èmes Journées internationales d’Analyse statistique des Données Textuelles, Mar 2002, Saint-Malo, France. ⟨hal-01561448⟩
81 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More