Mots visuels issus de graphes locaux multi-niveaux pour la reconnaissance d'objets
Résumé
Dans cet article, nous nous intéressons au problème ouvert à ce jour en indexation et recherche d'images à savoir la reconnaissance des objets. Depuis l'apparition de l'approche par des " Sacs-de-descripteurs " et ensuite des " Sac-de-mots ", la " déstructuration " de la description des images en utilisant des ensembles non structurés de caractéristiques a été contrée par l'introduction de différents groupements de descripteurs locaux ou encore par l'introduction de la topologie. Ainsi la reconnaissance d'objets peut être vue à ce jour comme le retour, à un autre niveau et avec d'autres outils, à la démarche structurelle. Les caractéristiques structurelles que nous proposons pour la reconnaissance d'objets sont les graphes locaux multi-niveaux emboîtés établis sur des ensembles de points SURF avec la triangulation de Delaunay. Cette représentation conserve l'invariance aux transformations géométriques du plan-image inhérente aux descripteurs SIFT/SURF. Une approche de type sac de mots visuels est appliquée sur ces graphes, donnant naissance à une représentation de sacs de mots issus de graphes locaux. La construction des graphes locaux opère par niveaux successifs, depuis les graphes de Delaunay élémentaires - les points SURF isolés - en augmentant le nombre de nœuds à chaque couche. Pour chaque niveau de graphes un dictionnaire visuel distinct est établi. Les expériences entreprises sur les ensembles de données SIVAL et Caltech-101 indiquent que les graphes multi-niveaux ont des performances complémentaires sur chaque niveau et que leur combinaison améliore les performances par rapport à l'approche par sacs de mots visuels
Origine : Fichiers produits par l'(les) auteur(s)
Loading...