Reconnaissance de chiffres farsi isolés par réseau de neurones à convolutions
Résumé
Une base de données de chiffres farsis (persans) manuscrits isolés de taille conséquente (60000 images en apprentissage et 20000 exemples en test) a été proposée [KHO 07]. Dans cet article, nous proposons un système de reconnaissance de chiffres farsis isolés, et nous montrons que les techniques développés pour la reconnaissances de chiffres arabes sur la base MNIST s'appliquent également bien à la reconnaissance de chiffres indiens et farsis. En particulier, l'utilisation de réseaux de neurones à convolutions permet de s'affranchir de l'étape délicate du choix d'un jeu de primitives ad hoc ; le réseau de neurones apprend lui-même une sa propre extraction de primitives à partir des données. Nous vérifions également que l'utilisation de techniques de déformations élastiques pour accroître artificiellement la taille de la base d'apprentissage permet d'améliorer les performances du reconnaisseur. Les performances rapportées (99,02% de reconnaissance) dépassent celles des systèmes déjà proposés sur la problématique de reconnaissance de chiffres farsis manuscrits.
Origine : Accord explicite pour ce dépôt
Loading...