A SPARQL distributed query processing engine addressing both vertical and horizontal data partitions - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

A SPARQL distributed query processing engine addressing both vertical and horizontal data partitions

Un moteur de traitement de requêtes SPARQL distribuées optimisée pour les partitions de données verticales et horizontales

Résumé

An increasing number of linked knowledge bases are openly accessible over the Internet. Distributed Query Processing (DQP) techniques enable querying multiple knowledge bases coherently. However, the precise DQP semantics is often overlooked, and query performance issues arise. In this paper, we propose a DQP engine for distributed RDF graphs, adopting a SPARQL-compliant DQP semantics. We improve performance through heuristics that generate Basic Graph Pattern-based sub-queries designed to maximise the parts of the query processed by the remote endpoints. We evaluate our DQP engine considering a query set representative of most common SPARQL clauses and different data distribution schemes. Results show a significant reduction of the number of remote queries executed and the query execution time while preserving completeness.
Un nombre grandissant de bases de connaissances liées sont exposéesexposéesà travers l'Internet. Le traitement de requêtes distribuées (DQP) permet d'interroger des bases de connais-sances multiples simultanément. Cependant, la sémantique DQP précise est souvent négligée, et desprobì emes de performance doiventêtredoiventêtre traités. Dans ce papier, nous proposons un moteur DQP pour l'interrogation de graphs RDF distribués, conformè a la sé-mantique de SPARQL. Nous en améliorons la performance grâcè a des heuristiques qui génèrent des sous-requêtesrequêtes`requêtesà par-tir de schémas de graphes basiques (BGPs) demanì erè a maximiser la partie de la requête traitée par les serveurs de données distants. NousévaluonsNousévaluons notre moteur DQPàDQP`DQPà travers un ensemble de reqêtes représentatives de clauses SPARQL les plus répen-dues et des schémas de distribution des données divers. Les résultats montrent un réduction significative du nombre de requêtes exécutées et du temps de traitement sans altération de la complétude des résultats.
Fichier principal
Vignette du fichier
macina_montagnat_corby_bda2016.pdf (412.67 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01404165 , version 1 (28-11-2016)

Identifiants

  • HAL Id : hal-01404165 , version 1

Citer

Abdoul Macina, Johan Montagnat, Olivier Corby. A SPARQL distributed query processing engine addressing both vertical and horizontal data partitions. BDA 2016 - 32ème Conférence sur la Gestion de Données - Principes, Technologies et Applications, Nov 2016, Poitiers, France. ⟨hal-01404165⟩
198 Consultations
222 Téléchargements

Partager

Gmail Facebook X LinkedIn More