Modèle multidimensionnel et OLAP sur architecture de grille - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2009

Multidimensional model and OLAP on a grip architecture

Modèle multidimensionnel et OLAP sur architecture de grille

Pascal Wehrle
  • Fonction : Auteur

Résumé

Data warehouses and OLAP (OnLine Analytical Processing) systems allow fast and aggregated access to large volumes of data for analysis purposes. In order to further increase the performance of decision support systems, one solution consists in implementing data warehouses on more and more powerful distributed systems. Computing grids in particular provide significant amounts of storage and computing resources. The deployment of a data warehouse on a decentralized grid infrastructure however requires adjustments of the multidimensional data model and of the OLAP processes to take into account the distribution and replication of warehouse data and their aggregates. We introduce an identification model for distributed warehouse data and an indexing method representing the data in the form of multidimensional blocs. This index structure is based on spatial X-tree indexes and cuboïd lattices and allows for localization of materialized data as well as computable aggregates on various grid nodes. We propose an OLAP query execution method aiming at the construction of an optimized query execution plan from a list of candidate blocs providing parts of the query result. Finally, we define a grid services architecture named GIROLAP (Grid Infrastructure for Relational OLAP) which is integrated with the Globus middleware and deployed in the context of the GGM project (Grid for Geno-Medicine) funded by the ACI "Masse de Données".
Les entrepôts de données et les systèmes OLAP (OnLine Analytical Processing) permettent un accès rapide et synthétique à de gros volumes de données à des fins d'analyse. Afin d'améliorer encore les performances des systèmes décisionnels, une solution consiste en la mise en œuvre d'entrepôts de données sur des systèmes répartis toujours plus puissants. Les grilles de calcul en particulier offrent d'importantes ressources de stockage et de traitement. Le déploiement d'un entrepôt sur une infrastructure décentralisée de grille nécessite cependant l'adaptation du modèle multidimensionnel et des processus OLAP pour tenir compte de la répartition et de la réplication des données et de leurs agrégats. Nous introduisons un modèle d'identification des données de l'entrepôt réparti et une méthode d'indexation des données sous forme de blocs multidimensionnels. Cette structure d'index s'appuie sur des index spatiaux en X-tree et des treillis de cuboïdes, et permet la localisation des données matérialisées ainsi que des agrégats calculables sur les différents nœuds de la grille. Nous proposons une méthode de traitement de requêtes OLAP visant à construire un plan d'exécution optimisé à partir de la liste des blocs candidats contribuant au résultat de la requête. Enfin, nous définissons une architecture de services de grille GIROLAP (Grid Infrastructure for Relational OLAP), intégrée à l'intergiciel Globus, et déployée dans le cadre du projet GGM (Grille Géno-Médicales) de l’ACI « Masse de Données ».
Fichier non déposé

Dates et versions

hal-01465818 , version 1 (13-02-2017)

Identifiants

  • HAL Id : hal-01465818 , version 1

Citer

Pascal Wehrle. Modèle multidimensionnel et OLAP sur architecture de grille. 2009. ⟨hal-01465818⟩
292 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More