Coherent Time Modeling of semi-Markov Models with Application to Real-Time Audio-to-Score Alignment - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Coherent Time Modeling of semi-Markov Models with Application to Real-Time Audio-to-Score Alignment

Résumé

This paper proposes a novel insight to the problem of duration modeling for recognition setups where events are inferred from time-signals using a probabilistic framework. When a prior knowledge about the duration of events is available, Hidden Markov or Semi-Markov models allow the setting of individual duration distributions but give no clue about their choice. We propose two criteria of temporal coherency for such applications and prove they are fulfilled by statistical properties like infinite divisibility and log-concavity. We conclude by showing practical consequences of these properties in a real-time audio-to-score alignment experiment.
Ce papier propose une nouvel éclairage sur la question de la modélisation des durées dans les algorithmes de reconnaissance, lorsque les événements reconnus sont inférés à partir de signaux temporels au moyen d'un modèle probabiliste. Si une connaissance a priori sur la durée nominale des événements est disponible, les modèles de Markov et de semi-Markov cachés permettent de choisir en fonction les distributions de durées de chaque événement, mais laissent ce choix complètement ouvert. Nous proposons deux critères de cohérence temporelle de tels algorithmes, et prouvons que ceux-ci si impliqués par des propriétés particulières étudiées en statistiques, telles que l'infinie divisibilité et la log-concavité. En conclusion, nous rapportons une expérience d'alignement audio-sur-partition en temps réel, qui montre l'intérêt pratique de ces propriétés théoriques.
Fichier principal
Vignette du fichier
MLSP14_v2.pdf (396.58 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01058366 , version 1 (26-08-2014)

Identifiants

  • HAL Id : hal-01058366 , version 1

Citer

Philippe Cuvillier, Arshia Cont. Coherent Time Modeling of semi-Markov Models with Application to Real-Time Audio-to-Score Alignment. MLSP 2014 - IEEE International Workshop on Machine Learning for Signal Processing (2014), Mboup, Mamadou, Sep 2014, Reims, France. ⟨hal-01058366⟩
210 Consultations
409 Téléchargements

Partager

Gmail Facebook X LinkedIn More