SPT – Summary Prefix Tree: An over DHT Indexing Data Structure for Efficient Superset Search

Bassirou Ngom 1, 2 Mesaac Makpangou 1 Samba Ndiaye 2
1 DELYS - DistributEd aLgorithms and sYStems
Inria de Paris, LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Cet article présente un arbre de préfixes SPT, une structure de données qui permet de réaliser efficacement des recherches de sur-ensemble sur DHT. Chaque document est résumé par un filtre Bloom qui est ensuite utilisé par SPT pour indexer ce document. SPT implémente une procédure de recherche hybride qui est bien adaptée aux clés d'indexation éparses telles que les filtres Bloom. Nous proposons aussi une fonction de mapping qui atténue l'impact de l'asymétrie de SPT en raison de la rareté des bit 1 dans les filtres de Bloom, surtout lorsqu'ils ne contiennent que peu de mots. Pour effectuer des recherches de sur-ensemble, SPT maintient sur chaque noeud une vue locale de l'arbre global. Les principales contributions sont les suivantes. Premièrement, l'approximation de la relation de sur-ensemble entre les ensembles de mots-clés par la relation descendance entre les filtres Bloom. Deuxièmement, l'utilisation d'un arbre de préfixes (SPT), une structure d'indexation de données pour la recherche par mot-clé sur DHT. Troisièmement, une procédure de recherche hybride qui exploite la nature éparse des filtres Bloom pour offrir de bonnes performances. Enfin, un algorithme qui exploite SPT pour trouver efficacement des descriptions qui sont des sur-ensembles d'une requête de mots-clés.
Liste complète des métadonnées

Littérature citée [11 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01757074
Contributeur : Bassirou Ngom <>
Soumis le : mardi 3 avril 2018 - 13:15:05
Dernière modification le : samedi 16 mars 2019 - 02:01:50

Fichier

spt-arima.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01757074, version 1

Citation

Bassirou Ngom, Mesaac Makpangou, Samba Ndiaye. SPT – Summary Prefix Tree: An over DHT Indexing Data Structure for Efficient Superset Search. 2018. 〈hal-01757074〉

Partager

Métriques

Consultations de la notice

151

Téléchargements de fichiers

148