Vers l’Alignement des Signaux Écrit et Sonore - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Vers l’Alignement des Signaux Écrit et Sonore

Résumé

In this paper , we report some new results related to mathematical expression recognition. We tackle this problem, known to be very difficult, using multimodal information – handwriting and speech –. This bimodality aspect of the information provides greater reliability since the modalities in concern are very complementary. To combine the signals coming from both modalities in an efficient way , we propose an original learning process based on neural networks. This approach allows not only fusing both streams, but also the alignment of the signals coming from both modalities. The bimodal system is evaluated on real bimodal data fr om the HAMEX dataset and the obtained results are compared to a single modality (handwriting) based system.
Dans cet article, nous rapportons de nouveaux résultats sur la reconnaissance des expressions mathématiques (EMs). Nous abordons cette problématique en considérant l’aspect bimodal de l’information : c’est à dire exploiter à la fois le signal de parole et celui de l’écriture manuscrite représentant la même EM. Ceci permet de disposer de plus de fiabilité lors d’un traitement automatique , d’autant plus que ces deux modalités s’avèrent être très complémentaires. Nous proposons d’aligner les deux modalités grâce à un classifieur de type réseau de neurones et en adoptant un apprentissage original des associations écrit-audio. Nous avons évalué le système proposé sur la base bimodale HAMEX d’EMs. Nous avons également confronté les résultats obtenus à ceux obtenus par notre précédent système et un système de référence basé uniquement sur l’écriture seule .
Fichier principal
Vignette du fichier
CIFED-25.pdf (674.37 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01151106 , version 1 (12-05-2015)

Identifiants

  • HAL Id : hal-01151106 , version 1

Citer

Sofiane Medjkoune, Harold Mouchère, Simon Petitrenaud, Christian Viard-Gaudin. Vers l’Alignement des Signaux Écrit et Sonore : Application pour la reconnaissance des expressions mathématiques. Colloque International Francophone sur l’Écrit et le Document 2014 (CIFED), Mar 2014, Nancy, France. pp.341-356. ⟨hal-01151106⟩
261 Consultations
388 Téléchargements

Partager

Gmail Facebook X LinkedIn More