Recherche d'information dans les bases d'images de manuscrits anciens par une caractérisation multi-échelle des écritures - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2007

Recherche d'information dans les bases d'images de manuscrits anciens par une caractérisation multi-échelle des écritures

Résumé

The aim of this scientific work is to propose an original approach of writers characterization based on the handwriting multi scale decomposition into two main features: curvature and orientation. For every shape point, those two dimensions are extracted by a Curvelets analysis before getting joined together in a compact signature. Curvelets are a specialised version of anisotropic wavelets which are well adapted to the representation of discontinuities along shapes. This is a new geometric multi scale transform for which atoms are indexed by their position, scale and orientation. They integrate the concept of directionnality and allow a sparse representation of images containing objects with many borders, as it is the case of handwritings. For each image, this characterization is synthesized in a compact and single signature used in our information retrieval system dedicated to medieval and humanistic writings. This tool provides very promising results to the use of experts in histories, literatures and palaeographers.
Dans cet article, nous proposons une approche originale de la caractérisation des écritures manuscrites à partir de leur représentation en image et de la décomposition multi-échelle des deux dimensions principales des formes écrites : la courbure et l'orientation aux frontières des mots. Pour tous les points d'écriture d'une image, les deux dimensions sont extraites par une analyse par Curvelets puis rassemblées en une signature compacte. Les Curvelets constituent une version spécialisée de la famille des ondelettes anisotropes qui sont très bien adaptées à la représentation des discontinuités le long des contours. Elles intègrent la notion de directionnalité et permettent une représentation parcimonieuse des images contenant des objets présentant des frontières nombreuses et porteuses d'information, comme c'est le cas des écritures sur lesquelles nous travaillons. Cette caractérisation, synthétisée sous la forme d'une signature compacte et unique pour chaque image sert ainsi à la mise en correspondance des images de la base d'écrits médiévaux et humanistes pour laquelle notre système de recherche d'information a été développé. Cet outil d'aide à l'indexation et à la recherche d'information fournit des résultats très prometteurs à l'usage des spécialistes en histoires, littératures et paléographes.
Fichier non déposé

Dates et versions

hal-01501875 , version 1 (04-04-2017)

Identifiants

  • HAL Id : hal-01501875 , version 1

Citer

Guillaume Joutel, Véronique Eglin, Hubert Emptoz. Recherche d'information dans les bases d'images de manuscrits anciens par une caractérisation multi-échelle des écritures. CORIA 2007, Mar 2007, Saint-Étienne, France. pp.413-424. ⟨hal-01501875⟩
122 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More