Une approche statistico-structurelle pour la reconnaissance de symboles exploitant une représentation XML des données

Résumé : Ce papier aborde le problème de la reconnaissance de symboles pour l'interprétation de documents techniques. Nous présentons un système utilisant une approche statistico-structurelle. Ce système utilise deux niveaux d'interprétation. Le premier extrait puis reconnaît les occlusions des symboles grâce à un classifieur statistique. Le second exploite les relations de proximité entre ces occlusions pour reconstruire des graphes d'occlusions pour cha-cun des symboles, puis reconnaît les symboles à l'aide d'un classifieur structurel. Notre but est d'avoir une appro-che générique, nous avons donc extériorisé la description de nos modèles et les paramètres de nos algorithmes. Les données manipulées par notre système sont au format XML, ce qui confère au système une capacité de contrôle des données. 1 Introduction Les améliorations constantes des structures de réseaux Intranet permettent aux grandes compa-gnies de développer des communications internes entre services. Historiquement, la base documentaire de ces entreprises était au format papier. Leur mise à disposition sur un Intranet ne peut donc se faire que suite à un processus de rétro-conversion automatique de ces documents du format papier au format numérique. Ces documents sont souvent de structure complexe, composés de parties textuelles et/ou graphiques. Parmi les documents à forte composante graphique, on trouve les documents techniques. Les systèmes de rétro-conversion de documents techniques existant proposent de réaliser cette rétro-conversion par différentes étapes [1] [2] [3] [4] dont la reconnaissance de symboles. Nous présentons, dans ce document, un système de la reconnaissance de symboles basé sur une approche statistico-structurelle. Dans la deuxième partie de cet article, nous décrivons brièvement les approches classiques pour la reconnaissance de symboles. Dans la troisième partie, nous présentons notre approche. Finalement, nous concluons et proposons des perspectives pour nos futurs travaux.
Type de document :
Communication dans un congrès
Colloque International Francophone sur l'Ecrit et le Document, 2002, Hammamet, Tunisie. pp.121-128
Liste complète des métadonnées

Littérature citée [18 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01249446
Contributeur : Pierre Héroux <>
Soumis le : vendredi 1 janvier 2016 - 17:17:45
Dernière modification le : mercredi 11 octobre 2017 - 11:18:01
Document(s) archivé(s) le : jeudi 7 avril 2016 - 17:01:28

Fichier

cifed02.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01249446, version 1

Collections

Citation

Mathieu Delalandre, Pierre Héroux, Sébastien Adam, Eric Trupin, Jean-Marc Ogier. Une approche statistico-structurelle pour la reconnaissance de symboles exploitant une représentation XML des données. Colloque International Francophone sur l'Ecrit et le Document, 2002, Hammamet, Tunisie. pp.121-128. 〈hal-01249446〉

Partager

Métriques

Consultations de la notice

33

Téléchargements de fichiers

26