Une nouvelle méthode de classification monoclasse à base de représentation symbolique : Application à la classification de documents - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Une nouvelle méthode de classification monoclasse à base de représentation symbolique : Application à la classification de documents

Résumé

Construire un classificateur obtenant de bons résultats tout en utilisant un faible nombre d'exemples d'apprentissage est un besoin récurrent dans le domaine de la classification d'images de documents, et en particulier pour l'entreprise pour laquelle cette étude a été réalisée. Dans ce cas-là, le choix d'utiliser un classificateur monoclasse (nécessitant uniquement des exemples positifs) représente une alternative intéressante. Dans cet article, nous présentons une nouvelle méthode de classification monoclasse basée sur une représentation symbolique. Initialement, un ensemble de caractéristiques est extrait à partir des données de l'ensemble d'apprentissage. Puis, un vecteur d'intervalles issus de ces caractéristiques est construit pour représenter la classe. Chaque intervalle (donnée symbolique) est calculé à partir de la moyenne et de l'écart-type de chaque caractéristique. Pour évaluer le classificateur monoclasse proposé, nous avons utilisé un ensemble de données composé de 544 images de documents. Les expérimentations montrent que le classificateur monoclasse est performant lorsque le nombre d'exemples d'apprentissage est faible (=10). Il est donc utilisable dans un contexte de classification de documents, avec de meilleurs résultats que ceux obtenus par un classificateur k-ppv.
Fichier principal
Vignette du fichier
rfia2014_submission_102.pdf (155.91 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-00989012 , version 1 (09-05-2014)

Identifiants

  • HAL Id : hal-00989012 , version 1

Citer

Nicolas Sidère, Fahimeh Alaei, Nathalie Girard, Sabine Barrat, Jean-Yves Ramel. Une nouvelle méthode de classification monoclasse à base de représentation symbolique : Application à la classification de documents. Reconnaissance de Formes et Intelligence Artificielle (RFIA) 2014, Jun 2014, France. ⟨hal-00989012⟩
303 Consultations
556 Téléchargements

Partager

Gmail Facebook X LinkedIn More