Analysis and interpretation of visual scenes through collaborative approaches

Résumé : Les dernières années, la taille des collections vidéo a connu une forte augmentation. La recherche et la navigation efficaces dans des telles collections demande une indexation avec des termes pertinents, ce qui nous amène au sujet de cette thèse, l’indexation sémantique des vidéos. Dans ce contexte, le modèle Sac de Mots (BoW), utilisant souvent des caractéristiques SIFT ou SURF, donne de bons résultats sur les images statiques. Notre première contribution est d’améliorer les résultats des descripteurs SIFT/SURF BoW sur les vidéos en pré-traitant les vidéos avec un modèle de rétine humaine, ce qui rend les descripteurs SIFT/SURF BoW plus robustes aux dégradations vidéo et qui leurs donne une sensitivité à l’information spatio-temporelle. Notre deuxième contribution est un ensemble de descripteurs BoW basés sur les trajectoires. Ceux-ci apportent une information de mouvement et contribuent vers une description plus riche des vidéos. Notre troisième contribution, motivée par la disponibilité de descripteurs complémentaires, est une fusion tardive qui détermine automatiquement comment combiner un grand ensemble de descripteurs et améliore significativement la précision moyenne des concepts détectés. Toutes ces approches sont validées sur les bases vidéo du challenge TRECVid, dont le but est la détection de concepts sémantiques visuels dans un contenu multimédia très riche et non contrôlé.
Type de document :
Thèse
Other. Université de Grenoble, 2013. English. 〈NNT : 2013GRENA026〉
Liste complète des métadonnées

Littérature citée [70 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00959081
Contributeur : Abes Star <>
Soumis le : lundi 29 septembre 2014 - 17:37:08
Dernière modification le : jeudi 21 juin 2018 - 16:08:29
Document(s) archivé(s) le : mardi 30 décembre 2014 - 11:46:06

Fichier

37243_STRAT_2013_archivage.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-00959081, version 3

Collections

Citation

Sabin Tiberius Strat. Analysis and interpretation of visual scenes through collaborative approaches. Other. Université de Grenoble, 2013. English. 〈NNT : 2013GRENA026〉. 〈tel-00959081v3〉

Partager

Métriques

Consultations de la notice

1025

Téléchargements de fichiers

431