Indexation de séquences de descripteurs - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2011

Indexing feature sequences

Indexation de séquences de descripteurs

Romain Tavenard

Résumé

Getting information from multimedia documents is a very important field of research. We can now process huge image databases and do effective content-based searches. Processing more complex documents such as video or audio streams appears to be the next step in the development of content-based search tools. Video and audio streams are different as they embed the notion of descriptors sequences, in which the order between described elements is a key. This thesis proposes two indexing methods for temporal multimedia documents. The first one is based on the use of the Dynamic Time Warping (DTW) algorithm to compare sequences. This thesis introduces a method that presents significant improvement in terms of response time when compared to already existing methods. The second one is specifically applied to cover song detection. It consists in a first filtering stage of temporal regions of the database that are possible matches for elements of the query song and a second robustification stage that ensures temporal consistency.
L'exploitation de documents multimédia est en plein essor. Nous savons maintenant bien exploiter de très grandes bases d'images photographiques et y faire des recherches par le contenu efficaces. L'étape suivante consiste à se tourner vers des documents plus complexes, comme le sont les vidéos et les bandes sonores. Une des principales difficultés afférentes au traitement de tels documents vient de leur caractère temporel. Décrire de l'audio et de la vidéo revient ainsi à fabriquer des séquences de descriptions dont il est important de préserver l'ordre et l'enchaînement. Cette thèse propose deux méthodes d'indexation de documents multimédia séquentiels. La première se base sur l'utilisation de l'alignement dynamique (DTW) pour la comparaison de séquences et propose une méthode présentant des gains significatifs en termes de coût de calcul par rapport aux méthodes existantes. La seconde méthode est appliquée spécifiquement à la recherche de reprises musicales. Il s'agit d'effectuer un premier filtrage des régions temporelles susceptibles d'être mises en correspondance avec la requête, avant d'appliquer une robustification temporelle.

Mots clés

Fichier principal
Vignette du fichier
thesis.pdf (796.96 Ko) Télécharger le fichier
PhD_11_tavenard.pptx (1.03 Mo) Télécharger le fichier
Format : Autre
Loading...

Dates et versions

tel-00639225 , version 1 (08-11-2011)

Identifiants

  • HAL Id : tel-00639225 , version 1

Citer

Romain Tavenard. Indexation de séquences de descripteurs. Multimédia [cs.MM]. Université Rennes 1, 2011. Français. ⟨NNT : ⟩. ⟨tel-00639225⟩
322 Consultations
451 Téléchargements

Partager

Gmail Facebook X LinkedIn More