Correction de formulaires basée sur des machines pondérées à états finis
Résumé
Pour être rendue plus démocratique, surtout dans les applications industrielles, la reconnaissance de caractères manuscrits a besoin d'atteindre de très hauts taux de reconnaissance. Pour cela, une correction dédiée à un problème particulier le permet de manière efficace, en modélisant l'information a priori disponible. Dans ce papier, nous présentons une méthode complète de compréhension de formulaires, avec une attention toute particulière sur une correction automatique à plusieurs niveaux. Basée sur une grammaire, définie en fonction des champs du formulaire à reconnaître, la correction utilise des machines à états finis modulaires, robustes et faciles d'implémentation. De plus, ces dernières permettent de relâcher le nombre de contraintes lié au remplissage du formulaire, rendant son utilisation plus facile. Finalement, des considérations pratiques sur la consommation mémoire et le temps de calcul pour un lexique de 40 000 entrées seront également énoncées.
Origine : Accord explicite pour ce dépôt
Loading...