Non-Linear Divisible Loads: There is No Free Lunch - Archive ouverte HAL Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2012

Non-Linear Divisible Loads: There is No Free Lunch

Résumé

Divisible Load Theory (DLT) has received a lot of attention in the past decade. A divisible load is a perfect parallel task, that can be split arbitrarily and executed in parallel on a set of possibly heterogeneous resources. The success of DLT is strongly related to the existence of many optimal resource allocation and scheduling algorithms, what strongly differs from general scheduling theory. Moreover, recently, close relationships have been underlined between DLT, that provides a fruitful theoretical framework for scheduling jobs on heterogeneous platforms, and \mapreduce, that provides a simple and efficient programming framework to deploy applications on large scale distributed platforms. The success of both have suggested to extend their framework to non-linear complexity tasks. In this paper, we show that both DLT and \mapreduce are better suited to workloads with linear complexity. In particular, we prove that divisible load theory cannot directly be applied to quadratic workloads, such as it has been proposed recently. We precisely state the limits for classical DLT studies and we review and propose solutions based on a careful preparation of the dataset and clever data partitioning algorithms. In particular, through simulations, we show the possible impact of this approach on the volume of communications generated by \mapreduce, in the context of Matrix Multiplication and Outer Product algorithms.
L'ordonnancement de tâches divisibles (DLT) a connu beaucoup de développements ces dernières années. Une tâche divisible est une tâche parfaitement parallélisable, qui peut être découpée en un nombre arbitraire de sous-tâches et exécutée en parallèle sur un ensemble de ressources potentiellement hétérogènes. Le succès de cette théorie vient de l'existence de nombreux algorithmes optimaux pour l'allocation et l'ordonnancement de ces tâches, au contraire des problèmes classiques d'ordonnancement qui sont habituellement NP-complets. De plus, on a récemment constaté la proximité de cette théorie, qui pose les bases théoriques de l'ordonnancement de tâches sur plates-formes hétérogènes, avec des solutions logicielles comme MapReduce, qui permettent de déployer des applications sur des plates-formes distribuées à grande échelle. Devant un tel succès, il a été proposé d'étendre ces solutions à des tâches dont la complexité en calcul n'est plus linéaire en la taille des données. Dans ce rapport, nous montrons que l'ordonnancement de tâches divisibles et MapReduce sont tous deux plus adaptés aux tâches de complexité linéaire. En particulier, nous montrons que l'ordonnancement de tâches divisibles ne peut être appliqué aux tâches de complexité quadratique, comme cela a été proposé récemment. Nous précisons les limites des résultats de cette théorie et pour les tâches non linéaires, nous proposes des solutions utilisant sur une préparation minutieuse des données et un partitionnement efficace du calcul. En particulier, par simulation, nous montrons l'impact de cette méthode sur le volume de communications généré par MapReduce sur des algorithmes de produit de matrices et de produit $u^T \times v$ de deux vecteurs.
Fichier principal
Vignette du fichier
RR-8170.pdf (738.32 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00762008 , version 1 (06-12-2012)

Identifiants

  • HAL Id : hal-00762008 , version 1

Citer

Olivier Beaumont, Hubert Larchevêque, Loris Marchal. Non-Linear Divisible Loads: There is No Free Lunch. [Research Report] RR-8170, INRIA. 2012, pp.20. ⟨hal-00762008⟩
232 Consultations
170 Téléchargements

Partager

Gmail Facebook X LinkedIn More