Extraction de zones informatives dans des images de formulaire en couleur - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Extraction de zones informatives dans des images de formulaire en couleur

Résumé

In this paper, we present a new approach of locating informative zones through extracting colorimetric features from a colored document images. The aim of this study is to obtain anchors which will allow spotting and retrieving textual information. The proposed approach is lying on three major steps. First step is to apply a noise filter while making sure that no new colors will emerge and edges will be preserved. Second is to detect homogenous regions within the image by quantifying colours through combining layers of different color spaces. Finally is to detect, from the segmented image, the components satisfying the rectangularity criterion. This approach has been evaluated over 134 document images dataset. The outcomes show that the approach is reliable and efficient as we combine layers from different color spaces.
Nous présentons, dans cet article, une approche permettant de localiser des zones informatives dans des documents couleur, par extraction de zones rectangulaires de couleur homogène. L’objectif de ce travail est d’obtenir des ancres pour le répérage et l’extraction d’information textuelle. L’approche proposée repose sur trois étapes. La première consiste à procéder à un filtrage de bruit, tout en évitant de créer de nouvelles couleurs ou de causer des distortions des contours. Ensuite, une quantificiation de couleur est réalisée, en combinant des plans de différents espaces couleurs, pour détecter les régions homogènes dans une image. Enfin, nous détectons les composantes connexes répondant à un critère de rectangularité. L’approche est évaluée sur 134 images de document, avec des métriques de la littérature. Nous montrons dans les résultats l’importance du choix des plans de couleur utilisés.
Fichier principal
Vignette du fichier
CIFED-14.pdf (2.74 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01249474 , version 1 (05-01-2016)

Identifiants

  • HAL Id : hal-01249474 , version 1

Citer

Maroua Hammami, Pierre Héroux, Sébastien Adam. Extraction de zones informatives dans des images de formulaire en couleur. Colloque International Francophone sur l'Ecrit et le Document, 2014, Nancy, France. pp.171-184. ⟨hal-01249474⟩
68 Consultations
162 Téléchargements

Partager

Gmail Facebook X LinkedIn More