La reconnaissance dans les images numérisées, OCR et transcription, reconnaissance des structures fonctionnelles et des méta-données

Résumé : La numérisation du patrimoine culturel et technique constitue une révolution importante qui permettra à la fois de le mettre en valeur et de le rendre accessible à tous. Depuis une dizaine d’années la numérisation a suscité des espoirs et des rêves… Les apports de la numérisation sont multiples. C’es une opération qui contribue à la diffusion du patrimoine scientifique et technique car les documents numérisés peuvent être transmis n’importe où ou bien recopiés indéfiniment sans aucune perte d’information. La copie électronique peut aussi, à tout moment, être imprimée à la demande autant de fois que l’on veut, avec toujours la même qualité et un coût de plus en plus faible. C’est une [r]évolution économiquement viable à long terme grâce à la réduction des coûts de consultation, de manipulation, de diffusion et de duplication. La numérisation du patrimoine offre de nouveaux services comme la consultation à distance, la miniaturisation physique à l’extrême, l’accès à des documents rares, de nouvelles formes de lecture et de navigation et enfin la possibilité de partager des connaissances. Pour pérenniser cette révolution puisse avoir lieu, il va falloir dans les prochaines années, convertir sous forme électronique, tous les ouvrages importants pour la connaissance humaine. La numérisation, est un processus qui fait intervenir plusieurs étapes successives en commençant par l’acquisition, c’est-à-dire la prise d’image, suivie d’une étape de pré-traitement des images (dont la restauration) pour enfin se terminer par une phase finale d’analyse et d’interprétation qui permet de les mettre sous une forme appropriée aux usages attendus. L’acquisition est importante car elle définit la qualité des images et le succès des étapes suivantes en dépend. C’est une étape coûteuse qui dépend du choix du matériel d’acquisition, de ses performances, de son réglage et de son utilisation ; une acquisition d’image inadaptée est une opération irréversible qui peut produire des images de qualité insuffisante pour les usages souhaités. La restauration par traitement d’images peut corriger certains problèmes techniques qui peuvent apparaître lors de l’étape de numérisation, comme l’inclinaison, des fluctuations lumineuses, la courbure (dans le cas des livres reliés). Mais la restauration d’images ne peut pas corriger les effets d’une trop faible résolution, d’une binarisation excessive ou bien encore des effets d’une compression destructive engendrée par l’utilisation d’un format comme JPEG ; dans ces cas-là l’information est définitivement perdue et la seule solution réside dans une nouvelle campagne coûteuse de re-numérisation. L’étape suivante consiste à traiter les images pour les conditionner sous une forme adaptée aux besoins des utilisateurs. C’est donc l’étude des usages qui va déterminer la suite des traitements à effectuer. Cette étape peut aller de la simple compression des images pour leur diffusion sur Internet jusqu’à une interprétation plus poussée de leur contenu pour requérant une transcription du texte et l’extraction d’un certain nombre de méta-données associées à l’organisation du texte, à sa structure ou à la reconnaissance d’éléments visuels. Cette phase doit être la plus automatisée possible pour éviter une coûteuse saisie ou correction manuelle. Elle repose sur les performances de logiciels d’analyse d’images qui dépendent à la fois de la qualité des images et de la complexité des documents à traiter. Un projet de numérisation commencé sans une réelle étude préalable des besoins présents et futurs ni une analyse des problèmes technologiques, peut conduire à l’échec avec des conséquences de toute nature (dont financières) désastreuses. Actuellement, nous rencontrons encore beaucoup de projets qui se sont satisfaits d’une prise d’image tout juste suffisante pour une interprétation humaine de leur contenu [15]. Or, avec la croissance du nombre de documents à analyser, leur traitement manuel devient de plus en plus difficile et onéreux. Le traitement automatique devient une solution incontournable. Tous les traitements et toutes les opérations d’analyse automatique qui vont être décrits dépendent donc d’abord de la qualité des images (en regard des besoins finaux !) et donc de la bonne utilisation des numériseurs ou des scanners. L’acquisition d’une image doit être considérée sous l’angle de l’acquisition de l’information. Bien que ce soit le première (en terme de temps, opération effectuée sur une chaîne de numérisation, ce devrait être le dernière dont les spécifications sont élaborées lors de l’étude d’un projet. Une mauvaise numérisation avec des paramètres inadaptés et des choix techniques insuffisants implique une perte d’information que le traitement et l’analyse d’images ne peut pas toujours retrouver. Pour les chercheurs que nous sommes, la capture d’images devrait être effectuée en utilisant au maximum les potentiels des machines, les images numérisées d’origine doivent impérativement être conservées, la traçabilité devrait être associée à toute image d’origine ou traitée, cela dans le but d’anticiper les traitements automatiques présents et à venir. Rêves de chercheurs qui demain peut-être pourrait rejoindre une certaine réalité dans les « entrepôts de contenus numérisés » que l’on commence à envisager pour la prochaines décennie.
Document type :
Book sections
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01552358
Contributor : Équipe Gestionnaire Des Publications Si Liris <>
Submitted on : Sunday, July 2, 2017 - 1:38:37 PM
Last modification on : Friday, January 11, 2019 - 5:08:47 PM

Identifiers

  • HAL Id : hal-01552358, version 1

Citation

Hubert Emptoz, Frank Le Bourgeois, Véronique Eglin, Yann Leydier. La reconnaissance dans les images numérisées, OCR et transcription, reconnaissance des structures fonctionnelles et des méta-données. éditions Presse de Lille 3. La numérisation des textes et des images : techniques et réalisations, pp.105-129, 2003. ⟨hal-01552358⟩

Share

Metrics

Record views

121