Semantic Video Model for Description, Detection and Retrieval of Visual Events

Ahmed Azough 1
1 BD - Base de Données
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
Résumé : Cette thèse a pour but de réaliser trois avancés sur le domaine de la multimédia sémantique, qui peut être définie comme l'application des techniques du sémantique web aux ressources multimédia. La première contribution concerne la génération de descriptions haut-niveau (sémantiques); en effet, alors que l'extraction de caractéristiques de bas niveau a été largement étudiée par la communauté du traitement d'images, la génération automatique de descriptions de haut-niveau est encore un problème ouvert. Dans cette thèse, un langage de descriptions de haut-niveau, qui permet la définition d'événements et d'objets à partir de caractéristiques de bas-niveau, est proposé comme une tentative pour résoudre le problème du "semantic gap". La deuxième contribution concerne le résonnement dans la multimédia sémantique. En effet, bien que les langages du sémantique web aient été conçus pour la description de tous les types de ressources, ces langages ne sont pas aussi performent quand il s'agit de raisonner sur la multimédia sémantique. Celle-ci contient des informations spatiotemporelles dont l'interprétation nécessite souvent la résolution de l'incertitude. La deuxième contribution de cette thèse traite ce problème en proposant un langage sémantique pour la description des vidéos basé sur les graphs conceptuels flous, mais aussi en proposant les procédures de raisonnement correspondantes. La troisième contribution porte sur l'indexation et la recherche sémantique dans les bases de données multimédia. En effet un langage de requêtes pour la multimédia sémantique doit permettre à l'utilisateur d'exprimer facilement les contraintes spatiotemporelles aussi bien que les contraintes sémantiques. Par ailleurs, le moteur de requêtes doit être capable de résoudre l'ensemble de ses requêtes. La troisième contribution de cette thèse propose un langage de requête issu des bases de données déductives pour l'expression de requêtes spatiotemporelles et sémantiques, mais aussi les méthodes de raisonnement nécessaires pour répondre à ces requêtes
Type de document :
Pré-publication, Document de travail
4806; T. 2010
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01466043
Contributeur : Équipe Gestionnaire Des Publications Si Liris <>
Soumis le : lundi 13 février 2017 - 12:26:04
Dernière modification le : mardi 14 février 2017 - 01:10:33

Identifiants

  • HAL Id : hal-01466043, version 1

Collections

Citation

Ahmed Azough. Semantic Video Model for Description, Detection and Retrieval of Visual Events. 4806; T. 2010. <hal-01466043>

Partager

Métriques

Consultations de la notice

33