Ground-Truth Production and Benchmarking Scenarios Creation with DocMining

Abstract : In this paper we present the DocMining platform and its application to ground-truth datasets production and page segmentation evaluation. DocMining is a highly modular framework dedicated to document interpretation where document processing tasks are modelized with scenarios. We present here two scenarios which use PDF documents, found on the web or produced from XML files, as basis of the ground-truth dataset.
Type de document :
Communication dans un congrès
International Workshop on Document Layout and Image Analysis, 2003, Edimburgh, United Kingdom. pp.31--35, 2003
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00637065
Contributeur : Pierre Héroux <>
Soumis le : samedi 29 octobre 2011 - 17:23:41
Dernière modification le : mercredi 11 octobre 2017 - 11:18:03
Document(s) archivé(s) le : lundi 30 janvier 2012 - 11:19:18

Fichier

10.1.1.59.1985.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00637065, version 1

Collections

Citation

Eric Clavier, Pierre Héroux, Joël Gardes, Eric Trupin. Ground-Truth Production and Benchmarking Scenarios Creation with DocMining. International Workshop on Document Layout and Image Analysis, 2003, Edimburgh, United Kingdom. pp.31--35, 2003. 〈hal-00637065〉

Partager

Métriques

Consultations de
la notice

126

Téléchargements du document

147