Prise en Compte de la Structure des Documents pour la Découverte d'Informations Inattendues - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2006

Prise en Compte de la Structure des Documents pour la Découverte d'Informations Inattendues

François Jacquenet
Christine Largeron

Résumé

Dans cet article nous nous intéressons à la prise en compte de la structure des documents dans un processus de découverte d'informations inattendues au sein d'un corpus de documents textuels. Faisant suite à un premier travail visant à concevoir et implanter des mesures d'inattendu dans un système baptisé UnexpectedMiner, nous avons cherché à améliorer les performances de celui-ci en prenant en compte la structure des documents analysés. Chaque partie des documents est ainsi pondérée par des coefficients dont les valeurs sont déterminées par un algorithme d'optimisation. Ces coefficients sont alors intégrés dans les mesures d'inattendu utilisées par UnexpectedMiner pour déterminer si un document présente un caractère inattendu ou pas. Les performances de notre nouveau système sont évaluées et mettent en évidence les améliorations de performances induites par la prise en compte de la structure des documents.
Fichier principal
Vignette du fichier
art35_jacquenet_largeron.pdf (154.85 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00117477 , version 1 (01-12-2006)

Identifiants

  • HAL Id : hal-00117477 , version 1

Citer

François Jacquenet, Christine Largeron. Prise en Compte de la Structure des Documents pour la Découverte d'Informations Inattendues. 2006. ⟨hal-00117477⟩
56 Consultations
58 Téléchargements

Partager

Gmail Facebook X LinkedIn More