Mots visuels issus de graphes locaux multi-niveaux pour la reconnaissance d'objets

Résumé : Dans cet article, nous nous intéressons au problème ouvert à ce jour en indexation et recherche d'images à savoir la reconnaissance des objets. Depuis l'apparition de l'approche par des " Sacs-de-descripteurs " et ensuite des " Sac-de-mots ", la " déstructuration " de la description des images en utilisant des ensembles non structurés de caractéristiques a été contrée par l'introduction de différents groupements de descripteurs locaux ou encore par l'introduction de la topologie. Ainsi la reconnaissance d'objets peut être vue à ce jour comme le retour, à un autre niveau et avec d'autres outils, à la démarche structurelle. Les caractéristiques structurelles que nous proposons pour la reconnaissance d'objets sont les graphes locaux multi-niveaux emboîtés établis sur des ensembles de points SURF avec la triangulation de Delaunay. Cette représentation conserve l'invariance aux transformations géométriques du plan-image inhérente aux descripteurs SIFT/SURF. Une approche de type sac de mots visuels est appliquée sur ces graphes, donnant naissance à une représentation de sacs de mots issus de graphes locaux. La construction des graphes locaux opère par niveaux successifs, depuis les graphes de Delaunay élémentaires - les points SURF isolés - en augmentant le nombre de nœuds à chaque couche. Pour chaque niveau de graphes un dictionnaire visuel distinct est établi. Les expériences entreprises sur les ensembles de données SIVAL et Caltech-101 indiquent que les graphes multi-niveaux ont des performances complémentaires sur chaque niveau et que leur combinaison améliore les performances par rapport à l'approche par sacs de mots visuels
Complete list of metadatas

Cited literature [12 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-00656516
Contributor : Amélie Cordier <>
Submitted on : Tuesday, January 17, 2012 - 1:25:59 PM
Last modification on : Thursday, January 11, 2018 - 6:21:07 AM
Long-term archiving on : Wednesday, April 18, 2012 - 2:28:07 AM

File

rfia2012_submission_92.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00656516, version 1

Citation

Svebor Karaman, Jenny Benois-Pineau, Rémi Mégret, Aurélie Bugeau. Mots visuels issus de graphes locaux multi-niveaux pour la reconnaissance d'objets. RFIA 2012 (Reconnaissance des Formes et Intelligence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3. ⟨hal-00656516⟩

Share

Metrics

Record views

264

Files downloads

260