Nouvelle technique pour le traitement et le mapping des requêtes SPARQL complexes sur Hive basé sur l'ingénierie des modèles - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Nouvelle technique pour le traitement et le mapping des requêtes SPARQL complexes sur Hive basé sur l'ingénierie des modèles

Résumé

La croissance des données Web a présenté de nouveaux défis en ce qui concerne la capacité d'interroger efficacement les données RDF. Les systèmes de bases de données relationnelles traditionnels adaptent et interrogent efficacement les données distribuées. Avec le développement de Hadoop, son implémentation du Framework MapReduce avec Hive, un entrepôt de données, la sémantique du traitement et de l'interrogation des données a changé. Nous présentons dans cet article, SPARQL2Hive un système de traitement des requêtes SPARQL compétitif sur le Framework MapReduce qui permet un traitement de requête SPARQL ad hoc sur de grands graphes RDF. Au lieu d'un mapping direct, SPARQL2Hive utilise le langage de requête de Hive(HiveQL), Hive est un système d'entrepôt de données qui permet d'interroger des systèmes utilisant HDFS, située au-dessus de Hadoop MapReduce, en tant que couche intermédiaire entre SPARQL et MapReduce. Ce niveau d'abstraction supplémentaire rend notre approche indépendante de la version actuelle de Hadoop et garantit ainsi la compatibilité avec les futures modifications du framework Hadoop car elles seront couvertes par la couche Hive sous-jacente. Notre approche consiste à utiliser les deux méta-modèles de SPARQL et Hive, et de proposer une transformation/mapping entre ces deux méta-modèles en utilisant le langage de transformation Atlas(ATL).Nous comparons SPARQL2Hive avec les implémentations SPARQL basées sur MapReduce, qui proposent le traitement des requêtes SPARQL dans un environnement basé sur Hadoop.
Banane_IMAT3E’18.pdf (154.13 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01951451 , version 1 (20-12-2018)

Identifiants

  • HAL Id : hal-01951451 , version 1

Citer

Mouad Banane, Allae Erraissi, Abdessamad Belangour. Nouvelle technique pour le traitement et le mapping des requêtes SPARQL complexes sur Hive basé sur l'ingénierie des modèles. IMAT3E'18 International Meeting on Advanced Technologies in Energy and Electrical Engineering, Nov 2018, Fez, Maroc. ⟨hal-01951451⟩
49 Consultations
34 Téléchargements

Partager

Gmail Facebook X LinkedIn More