Query Processing in Multistore Systems: an overview - Archive ouverte HAL Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2016

Query Processing in Multistore Systems: an overview

Carlyna Bondiombouy
Patrick Valduriez

Résumé

Building cloud data-intensive applications often requires using multiple data stores (NoSQL, HDFS, RDBMS, etc.), each optimized for one kind of data and tasks. However, the wide diversification of data store interfaces makes it difficult to access and integrate data from multiple data stores. This important problem has motivated the design of a new generation of systems, called multistore systems, which provide integrated or transparent access to a number of cloud data stores through one or more query languages. In this paper, we give an overview of query processing in multistore systems. We start by introducing the recent cloud data management solutions and query processing in multidatabase systems. Then, we describe and analyze some representative multistore systems, based on their architecture, data model, query languages and query processing techniques. To ease comparison, we divide multistore systems based on the level of coupling with the underlying data stores, i.e. loosely-coupled, tightly-coupled and hybrid. Our analysis reveals some important trends, which we discuss. We also identify some major research issues.
Le développement d'applications orientées-données dans le cloud exige souvent de pouvoir manipuler des data stores multiples et différents (NoSQL, HDFS, RDBMS, etc.), chacun optimisé pour un type de données et de traitements. Cependant la grande diversification des interfaces de ces data stores rend difficile l'accès et l'intégration de données depuis plusieurs data stores. Ce problème important a conduit à la conception d'une nouvelle génération de systèmes, les systèmes multistores, qui fournissent l'accès intègre et transparent à des data stores dans le cloud avec un ou plusieurs langages de requêtes. Dans ce rapport, nous proposons un survol du traitement de requêtes dans les systèmes multistores. Nous commençons par introduire les récentes solutions de gestion de données dans le cloud et le traitement de requêtes dans les systèmes multibases de données. Puis, nous décrivons et analysons un ensemble représentatif de systèmes multistores, selon leur architecture, modèle de données, langage de requêtes et techniques de traitement de requêtes. Pour faciliter la comparaison, nous classons les systèmes multistores en fonction du niveau de couplage avec les data stores: faiblement couplé, fortement couplé, et hybride. Nos comparaisons révèlent des tendances importantes, que nous discutons. Nous terminons en identifiant des directions de recherche majeure.
Fichier principal
Vignette du fichier
RR-8890.pdf (1.09 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01289759 , version 1 (25-03-2016)
hal-01289759 , version 2 (30-03-2016)

Identifiants

  • HAL Id : hal-01289759 , version 2

Citer

Carlyna Bondiombouy, Patrick Valduriez. Query Processing in Multistore Systems: an overview. [Research Report] RR-8890, INRIA Sophia Antipolis - Méditerranée. 2016, pp.38. ⟨hal-01289759v2⟩
522 Consultations
3123 Téléchargements

Partager

Gmail Facebook X LinkedIn More