Coherent Time Modeling of semi-Markov Models with Application to Real-Time Audio-to-Score Alignment

Philippe Cuvillier; Arshia Cont

Communication Dans Un Congrès Année : 2014

Coherent Time Modeling of semi-Markov Models with Application to Real-Time Audio-to-Score Alignment

(1, 2) , (2, 1)

1
2

Philippe Cuvillier

Fonction : Auteur correspondant
PersonId : 5616
IdHAL : philippe-cuvillier
IdRef : 200552538

Connectez-vous pour contacter l'auteur

Représentations musicales

Synchronous Realtime Processing and Programming of Music Signals

Arshia Cont

Fonction : Auteur
PersonId : 6067
IdHAL : arshiacont
ORCID : 0000-0002-7352-7212
IdRef : 131109758

Synchronous Realtime Processing and Programming of Music Signals

Représentations musicales

Résumé

This paper proposes a novel insight to the problem of duration modeling for recognition setups where events are inferred from time-signals using a probabilistic framework. When a prior knowledge about the duration of events is available, Hidden Markov or Semi-Markov models allow the setting of individual duration distributions but give no clue about their choice. We propose two criteria of temporal coherency for such applications and prove they are fulfilled by statistical properties like infinite divisibility and log-concavity. We conclude by showing practical consequences of these properties in a real-time audio-to-score alignment experiment.

Ce papier propose une nouvel éclairage sur la question de la modélisation des durées dans les algorithmes de reconnaissance, lorsque les événements reconnus sont inférés à partir de signaux temporels au moyen d'un modèle probabiliste. Si une connaissance a priori sur la durée nominale des événements est disponible, les modèles de Markov et de semi-Markov cachés permettent de choisir en fonction les distributions de durées de chaque événement, mais laissent ce choix complètement ouvert. Nous proposons deux critères de cohérence temporelle de tels algorithmes, et prouvons que ceux-ci si impliqués par des propriétés particulières étudiées en statistiques, telles que l'infinie divisibilité et la log-concavité. En conclusion, nous rapportons une expérience d'alignement audio-sur-partition en temps réel, qui montre l'intérêt pratique de ces propriétés théoriques.

Mots clés

score following semi-Markov chains alignment Hidden Markov model

Domaines

Traitement du signal et de l'image [eess.SP] Traitement du signal et de l'image [eess.SP]

Fichier principal

MLSP14_v2.pdf (396.58 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Philippe Cuvillier : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-01058366

Soumis le : mardi 26 août 2014-16:33:05

Dernière modification le : vendredi 24 mars 2023-14:52:59

Archivage à long terme le : mardi 11 avril 2017-20:31:54

Dates et versions

hal-01058366 , version 1 (26-08-2014)

Identifiants

HAL Id : hal-01058366 , version 1

Citer

Philippe Cuvillier, Arshia Cont. Coherent Time Modeling of semi-Markov Models with Application to Real-Time Audio-to-Score Alignment. MLSP 2014 - IEEE International Workshop on Machine Learning for Signal Processing (2014), Mboup, Mamadou, Sep 2014, Reims, France. ⟨hal-01058366⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UPMC CNRS INRIA IRCAM STMS INRIA2 SORBONNE-UNIVERSITE SU-SCIENCES ANR

210 Consultations

409 Téléchargements

Coherent Time Modeling of semi-Markov Models with Application to Real-Time Audio-to-Score Alignment

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager