Recherche visuo-textuelle d'images sur le Web améliorée par sélection de la dimension

Sabrina Tollari 1 Hervé Glotin
1 MALIRE - Machine Learning and Information Retrieval
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Dans cet article, nous proposons une méthode pour améliorer la recherche d’images sur le web dans le cas de requêtes bimodales composées de quelques mots et de quelques images. Pour chaque page web et chaque requête, une moyenne pondérée fusionne les distances textuelles basées sur tfidf et les distances visuelles. Nous montrons alors que cette recherche bi-modale d’images peut être optimisée en analysant simplement des images récupérées en ligne par des requêtes purement textuelle sur un moteur classique de recherche d’images sur le web. Nous approximons alors une Analyse Linéaire Discriminante (ALDA) sur ces images de développement pour estimer le sous-ensemble de traits optimaux de chaque requête traitée. Nous testons notre méthode sur la campagne Techno-Vision ImagEVAL (notre équipe s’y est classée 2nde sur 4), avec 700 URLs (700 pages web et 10k images). Nous discutons le comportement des résultats des requêtes en fonction du taux de texte dans la fusion. Les résultats montrent alors que nous pouvons automatiquement réduire le nombre de dimensions afin d’obtenir une réduction du temps de calcul de 35% sans dégradation des scores de Mean Average Precison.
Document type :
Conference papers
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01304979
Contributor : Lip6 Publications <>
Submitted on : Wednesday, April 20, 2016 - 3:06:19 PM
Last modification on : Thursday, March 21, 2019 - 1:19:36 PM

Identifiers

  • HAL Id : hal-01304979, version 1

Citation

Sabrina Tollari, Hervé Glotin. Recherche visuo-textuelle d'images sur le Web améliorée par sélection de la dimension. Conférence en Recherche d'Informations et Applications (CORIA'08), Mar 2008, Tregastel, France. pp.7-22. ⟨hal-01304979⟩

Share

Metrics

Record views

103