BigStep Towards Query Eco-Processing - Thinking Smart - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2020

BigStep Towards Query Eco-Processing - Thinking Smart

Grande Étape vers l'eco-traitement des requêtes - Thinking Smart

Résumé

Computers and electronic machines in businesses consume a significant amount of electricity, releasing carbon dioxide (CO2), which contributes to greenhouse gas emissions. Energy efficiency is a pressing concern in IT systems, ranging from mobile devices to large servers in data centers, in order to be more environmentally responsible. In order to meet the growing demands for awareness of excessive energy consumption, many initiatives have been launched on energy efficiency for big data processing covering electronic components, software and applications. Query optimizers are one of the most power consuming components of a DBMS. They can be modified to take into account the energy cost of query plans by using the energy cost models integrated into the optimizer in the aims to reduce the power consumption of computer systems. In this paper, we study, describe and evaluate the design of three energy cost models whose values of energy sensitive parameters are determined using the Nonlinear Regression technique and the Random Forests technique. To that end, we study in depth the operating principle of the selected DBMS and present an analysis of the performance time and energy consumption of typical queries in the TPC benchmarks. We perform extensive experiments on a physical testbed based on the PostgreSQL, MonetDB and Hyrise systems using workloads generated from the TPC benchmarks to validate our proposing.
Les ordinateurs et les machines électroniques des entreprises consomment une quantité importante d’électricité, libérant ainsi du dioxyde de carbone (CO2), qui contribue aux émissions de gaz à effet de serre. L’efficacité énergétique est une préoccupation urgente dans les systèmes informatiques, partant des équipements mobiles aux grands serveurs dans les centres de données, afin d’être plus respectueux envers l’environnement. Afin de répondre aux exigences croissantes en matière de sensibilisation à l’utilisation excessive de l’énergie, de nombreuses initiatives ont été lancées sur l’efficacité énergétique pour le traitement des données massives couvrant les composants électroniques, les logiciels et les applications. Les optimiseurs de requêtes sont l’un des composants les plus énergivores d’un SGBD. Ils peuvent être modifié pour prendre en compte le coût énergétique des plans des requêtes à l’aide des modèles de coût énergétiques intégrés dans l’optimiseur dans le but de réduire la consommation électrique des systèmes informatiques. Dans cet article, nous étudions, décrivons et évaluons la conception de trois modèles de coût énergétique dont les valeurs des paramètres sensibles à l’énergie sont définis en utilisant la technique de la Régression non linéaire et la technique des forêts aléatoires. Pour ce fait, nous donnons une étude approfondie du principe de fonctionnement des SGBD choisis et présentons une analyse des performances en terme de temps et énergie sur des requêtes typiques du benchmarks TPC-H. Nous effectuons des expériences approfondies basé sur les systèmes PostgreSQL, MonetDB et Hyrise en utilisant un jeu de données généré à partir du benchmarks TPC-H afin de valider nos propositions.
Fichier principal
Vignette du fichier
Arima2020.pdf (2.04 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02931309 , version 1 (05-09-2020)
hal-02931309 , version 2 (04-02-2021)
hal-02931309 , version 3 (26-03-2021)

Identifiants

  • HAL Id : hal-02931309 , version 1

Citer

Simon Pierre Dembele, Ladjel Bellatreche, Carlos Ordonez. BigStep Towards Query Eco-Processing - Thinking Smart. 2020. ⟨hal-02931309v1⟩
133 Consultations
873 Téléchargements

Partager

Gmail Facebook X LinkedIn More