PeNeLoop: Parallelizing Federated SPARQL Queries in Presence of Replicated Fragments

Thomas Minier; Gabriela Montoya; Hala Molli; Pascal Molli

Communication Dans Un Congrès Année : 2017

PeNeLoop: Parallelizing Federated SPARQL Queries in Presence of Replicated Fragments

(1, 2) , (3) , (1, 2) , (1, 2)

1
2
3

Thomas Minier

Fonction : Auteur
PersonId : 13562
IdHAL : thomas-minier
ORCID : 0000-0002-7321-286X

Laboratoire des Sciences du Numérique de Nantes

Gestion de Données Distribuées

Gabriela Montoya

Fonction : Auteur
PersonId : 1011120

Department of Computer Science [Aalborg]

Hala Molli

Fonction : Auteur
PersonId : 1996
IdHAL : hala-skaf-molli
ORCID : 0000-0003-1062-6659
IdRef : 160348781

Laboratoire des Sciences du Numérique de Nantes

Gestion de Données Distribuées

Pascal Molli

Fonction : Auteur
PersonId : 2355
IdHAL : pascal-molli
ORCID : 0000-0001-8048-273X
IdRef : 134021045

Laboratoire des Sciences du Numérique de Nantes

Gestion de Données Distribuées

Résumé

Replicating data fragments in Linked Data improves data availability and performances of federated query engines. Existing replication aware federated query engines mainly focus on source selection and query decomposition in order to prune redundant sources and reduce intermediate results thanks to data locality. In this paper, we extend replication-aware federated query engines with a replication-aware parallel join operator: PeNeLoop. PeNeLoop exploits redundant sources to parallelize the join operator and reduce execution time. We implemented PeNeLoop in the federated query engine FedX with the replicated-aware source selection Fedra and we empirically evaluated the performance of FedX+Fedra+PeNeLoop. Experimental results suggest that FedX+Fedra+PeNeLoop outperforms FedX+Fedra in terms of execution time while preserving answer completeness.

Mots clés

Fragment Replication Parallel Query Processing Linked Data Federated SPARQL Queries Processing

Domaines

Base de données [cs.DB] Calcul parallèle, distribué et partagé [cs.DC] Algorithme et structure de données [cs.DS] Web

Fichier principal

paper_peneloop.pdf (412.39 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Thomas Minier : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01549751

Soumis le : jeudi 6 juillet 2017-15:34:57

Dernière modification le : vendredi 24 mars 2023-14:53:04

Archivage à long terme le : jeudi 14 décembre 2017-19:05:23

Dates et versions

hal-01549751 , version 1 (06-07-2017)

Identifiants

HAL Id : hal-01549751 , version 1

Citer

Thomas Minier, Gabriela Montoya, Hala Molli, Pascal Molli. PeNeLoop: Parallelizing Federated SPARQL Queries in Presence of Replicated Fragments. Querying the Web of Data (QuWeDa 2017) Workshop, co-located with 14th ESWC 2017 (Awarded Best workshop paper), Muhammad Saleem; Ricardo Usbeck; Ruben Verborgh; Axel-Cyrille Ngonga Ngomo, May 2017, Portorož, Slovenia. pp.37-50. ⟨hal-01549751⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-NANTES INSTITUT-TELECOM CNRS EC-NANTES UNAM LS2N LS2N-GDD NANTES-UNIVERSITE

221 Consultations

103 Téléchargements

PeNeLoop: Parallelizing Federated SPARQL Queries in Presence of Replicated Fragments

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager