Lecture Séquentielle de Documents pour la Classification - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Lecture Séquentielle de Documents pour la Classification

Résumé

Nous proposons un nouveau modèle de lecture séquentielle permettant la classification automatique de documents textuels. Il est basé sur la modélisation d’un agent qui lit un document phrases après phrases et qui peut à tout moment décider d’associer un document à une ou plusieurs catégories données. L’algorithme proposé se base sur une formalisation de la classification de texte en tant que Processus de Décision Markovien, et un apprentissage du modèle par des techniques de renforcement. Des experiences effectuées sur quatre corpus classiques du domaine montrent que l’approche proposée atteint des performances équivalentes à un SVM tout en lisant (en moyenne) que quelques phrases de chaque document.
Fichier non déposé

Dates et versions

hal-01271754 , version 1 (09-02-2016)

Identifiants

  • HAL Id : hal-01271754 , version 1

Citer

Gabriel Dulac-Arnold, Ludovic Denoyer, Patrick Gallinari. Lecture Séquentielle de Documents pour la Classification. CORIA, Mar 2012, Bordeaux, France. pp.245-259. ⟨hal-01271754⟩
110 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More