Mots visuels issus de graphes locaux multi-niveaux pour la reconnaissance d'objets

Résumé : Dans cet article, nous nous intéressons au problème ouvert à ce jour en indexation et recherche d'images à savoir la reconnaissance des objets. Depuis l'apparition de l'approche par des " Sacs-de-descripteurs " et ensuite des " Sac-de-mots ", la " déstructuration " de la description des images en utilisant des ensembles non structurés de caractéristiques a été contrée par l'introduction de différents groupements de descripteurs locaux ou encore par l'introduction de la topologie. Ainsi la reconnaissance d'objets peut être vue à ce jour comme le retour, à un autre niveau et avec d'autres outils, à la démarche structurelle. Les caractéristiques structurelles que nous proposons pour la reconnaissance d'objets sont les graphes locaux multi-niveaux emboîtés établis sur des ensembles de points SURF avec la triangulation de Delaunay. Cette représentation conserve l'invariance aux transformations géométriques du plan-image inhérente aux descripteurs SIFT/SURF. Une approche de type sac de mots visuels est appliquée sur ces graphes, donnant naissance à une représentation de sacs de mots issus de graphes locaux. La construction des graphes locaux opère par niveaux successifs, depuis les graphes de Delaunay élémentaires - les points SURF isolés - en augmentant le nombre de nœuds à chaque couche. Pour chaque niveau de graphes un dictionnaire visuel distinct est établi. Les expériences entreprises sur les ensembles de données SIVAL et Caltech-101 indiquent que les graphes multi-niveaux ont des performances complémentaires sur chaque niveau et que leur combinaison améliore les performances par rapport à l'approche par sacs de mots visuels
Type de document :
Communication dans un congrès
RFIA 2012 (Reconnaissance des Formes et Intelligence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3, 2012
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00656516
Contributeur : Amélie Cordier <>
Soumis le : mardi 17 janvier 2012 - 13:25:59
Dernière modification le : jeudi 11 janvier 2018 - 06:21:07
Document(s) archivé(s) le : mercredi 18 avril 2012 - 02:28:07

Fichier

rfia2012_submission_92.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00656516, version 1

Citation

Svebor Karaman, Jenny Benois-Pineau, Rémi Mégret, Aurélie Bugeau. Mots visuels issus de graphes locaux multi-niveaux pour la reconnaissance d'objets. RFIA 2012 (Reconnaissance des Formes et Intelligence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3, 2012. 〈hal-00656516〉

Partager

Métriques

Consultations de la notice

251

Téléchargements de fichiers

236