Détection de motifs graphiques dans des images de documents anciens - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Détection de motifs graphiques dans des images de documents anciens

Sovann En
  • Fonction : Auteur
Caroline Petitjean
Stéphane Nicolas
Laurent Heutte

Résumé

La détection de motifs graphiques consiste à rechercher dans une collection d'images de documents, les occurences les plus similaires à une requête image. Dans cet article, nous proposons un système non supervisé pour la détection de motifs, sans besoin de segmentation préalable, en nous inspirant de techniques récentes en vision par ordinateur. Notre approche s'appuie sur une décomposition des documents en fenêtres de tailles variées et une description de ces fenêtres par sac de mots visuels, le tout hors-ligne afin de diminuer le temps de calcul. Une technique de compression des données, proposée tout récemment en recherche d'images, permet de maintenir une quantité de mémoire raisonnable, mais nécessite d'approximer le calcul de distance à la requête. De premiers résultats encourageants sont obtenus sur la base de documents DocExplore, une base de documents médiévaux. Abstract-Pattern spotting consists of retrieving the most similar graphical patterns from a collection of document images. Inspired by the recent advances in computer vision and word spotting techniques, we propose in this paper an unsupervised, segmentation-free pattern spotting system. Overall, the system includes a powerful patch-based framework, the bag of visual word model with an offline sliding window mechanism to avoid heavy computational burden during the retrieval process. Our system takes advantage of the most recent powerful compression and distance approximation techniques (product quantization and asymmetric distance computation) to efficiently index the great number of sub-windows produced by sliding windows and allows to retrieve small sized queries in a large indexed corpus.
Fichier principal
Vignette du fichier
GretsiFinal.pdf (505.29 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02114004 , version 1 (29-04-2019)

Identifiants

  • HAL Id : hal-02114004 , version 1

Citer

Sovann En, Caroline Petitjean, Stéphane Nicolas, Laurent Heutte. Détection de motifs graphiques dans des images de documents anciens. GRETSI, 2015, Lyon, France. ⟨hal-02114004⟩
55 Consultations
67 Téléchargements

Partager

Gmail Facebook X LinkedIn More