Reconnaissance et extraction de documents. Une application industrielle à la détection de documents semi-structurés

Résumé : Cet article aborde le problème de la reconnaissance d'images de documents semi-structurés. L'objectif est de détecter la présence d'un document dans une image et d'extraire la zone d'intérêt qui le contient. Dans un premier temps, un exemple de document à retrouver est donné en entrée du système et un ensemble de points d'intérêt sont extraits de cette image requête. Ensuite, pour chaque image à comparer, l'ensemble des points d'intérêt sont extraits puis mis en correspondance avec ceux de l'image requête. Cette étape de mise en correspondance permet de calculer la transformation géométrique (translation, rotation, zoom) permettant de localiser précisément l'image requête dans les images à analyser. Deux principales propositions sont faites pour rendre utilisable cette techniques pour la recherche d'image de documents : la sélection de points d'intérêt et l'adaptation de RANSAC.
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2013, 16 (2), pp.91-118
Liste complète des métadonnées

Littérature citée [36 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00918192
Contributeur : Olivier Augereau <>
Soumis le : vendredi 13 décembre 2013 - 09:30:49
Dernière modification le : mercredi 29 novembre 2017 - 14:57:07
Document(s) archivé(s) le : vendredi 14 mars 2014 - 01:30:12

Fichier

31janvier_doc-article-hermes.p...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00918192, version 1

Collections

Citation

Olivier Augereau, Nicholas Journet, Jean-Philippe Domenger. Reconnaissance et extraction de documents. Une application industrielle à la détection de documents semi-structurés. Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2013, 16 (2), pp.91-118. 〈hal-00918192〉

Partager

Métriques

Consultations de la notice

134

Téléchargements de fichiers

638