Extraction de zones informatives dans des images de formulaire en couleur
Résumé
In this paper, we present a new approach of locating informative zones through extracting colorimetric features from a colored document images. The aim of this study is to obtain anchors which will allow spotting and retrieving textual information. The proposed approach is lying on three major steps. First step is to apply a noise filter while making sure that no new colors will emerge and edges will be preserved. Second is to detect homogenous regions within the image by quantifying colours through combining layers of different color spaces. Finally is to detect, from the segmented image, the components satisfying the rectangularity criterion. This approach has been evaluated over 134 document images dataset. The outcomes
show that the approach is reliable and efficient as we combine layers from different color spaces.
Nous présentons, dans cet article, une approche permettant de localiser des zones informatives dans des documents couleur, par extraction de zones rectangulaires de couleur homogène. L’objectif de ce travail est d’obtenir des ancres pour le répérage et l’extraction d’information textuelle. L’approche proposée repose sur trois étapes. La première consiste à procéder à un filtrage de bruit, tout en évitant de créer de nouvelles couleurs ou de causer
des distortions des contours. Ensuite, une quantificiation de couleur est réalisée, en combinant des plans de différents espaces couleurs, pour détecter les régions homogènes dans une image. Enfin, nous détectons les composantes connexes répondant à un critère de rectangularité. L’approche est évaluée sur 134 images de document, avec des métriques de la littérature. Nous montrons dans les résultats l’importance du choix des plans de couleur utilisés.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...