Contribution à la reconnaissance automatique de documents d'entreprises

Djamel Gaceb 1 Frank Le Bourgeois 1 Véronique Eglin 1 Hubert Emptoz 1
1 imagine - Extraction de Caractéristiques et Identification
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
Résumé : Le traitement automatique de documents et courrier d’entreprises est un domaine exigeant en terme de performances et de vitesse. Les systèmes actuels utilisent des architectures modulaires dans lesquelles chaque étape du processus de reconnaissance est indépendante. Pour augmenter les performances, il est nécessaire de réintroduire une coopération entre les différents modules. Dans ce cadre, nous proposons une approche hybride de localisation des zones de textes et de binarisation des images. Ce couplage a permis à la fois de gagner en temps de calcul en évitant de traiter l’arrière plan de l’image et d’obtenir une meilleure segmentation en caractères pour l’OCR. Nous présenterons les résultats obtenus à partir de l’implémentation de notre nouvelle approche sur une ligne industrielle qui traite quotidiennement plusieurs tonnes de courrier et documents internes de grandes entreprises.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01562422
Contributor : Équipe Gestionnaire Des Publications Si Liris <>
Submitted on : Friday, July 14, 2017 - 5:43:05 PM
Last modification on : Friday, January 11, 2019 - 5:08:45 PM

Identifiers

  • HAL Id : hal-01562422, version 1

Citation

Djamel Gaceb, Frank Le Bourgeois, Véronique Eglin, Hubert Emptoz. Contribution à la reconnaissance automatique de documents d'entreprises. CORESA, Compression et représentation des Signaux Audiovisuels, Aug 2006, Caen, France. ⟨hal-01562422⟩

Share

Metrics

Record views

126