Nouvelle distance d'édition pour la reconnaissance d'images par chaînes de sacs de mots visuels
Résumé
La reconnaissance automatique d'images ou de classes d'images intervient dans de multiples problèmes, notamment lorsqu'il s'agit de classer ou de rechercher automatiquement des images par leur contenu. Depuis quelques années, la représentation d'images par sacs de mots visuels s'est imposée comme un modèle de référence pour ce type problème. L'un des inconvénients de ce modèle est de ne pas prendre en compte la répartition spatiale des mots dans les images. Dans cet article, nous proposons d'une part de représenter les images à partir de chaînes d'histogrammes de mots visuels issues d'un découpage régulier de l'image et d'autre part une nouvelle distance d'édition qui permet d'aligner deux chaînes en prenant en compte des opérations de fusions entre les histogrammes. Nous présentons l'algorithme de calcul de cette nouvelle distance et nous étudions ses performances pour la classification d'images
Origine : Fichiers produits par l'(les) auteur(s)
Loading...