Une méthode de segmentation d'Images de Documents Composites
Résumé
Dans cet article, nous proposons une méthode de segmentation d'images de documents composites. Cette méthode commence par regrouper les objets connexes proches les uns par rapport aux autres dans des microstructures homogènes (texte, tableau, etc.). Elle extrait ensuite les différentes microstructures du document et sépare après entre celles qui sont textuelles des non textuelles (graphiques). La méthode proposée catégorise les microstructures graphiques (tableau, cercle, etc.) et localise leur contenu textuel. L'étude expérimentale a été effectuée sur 50 documents contenant de l'écriture Arabe (fictif, réel, simple et composite). Le taux de segmentation correcte globale était de l'ordre de 89.75 %