Recouvrement des Collectives MPI Non-bloquantes sur Processeur Manycore
Résumé
Les collectives MPI non-bloquantes ont été proposées pour recouvrir les communications par du calcul afin d'en amortir le coût. Cependant, ces opérations consomment plus de temps CPU que les opérations point-à-point. L'utilisation d'un seul CPU dédié aux threads de progression n'est donc pas efficace et rend les communications lentes. D'un autre côté, si les communications sont exécutées sur les coeurs applicatifs, aucun recouvrement n'est obtenu. Pour aborder ce problème, nous proposons un algorithme pour les opérations collectives en arbre qui scinde l'arbre des communications entre les coeurs applicatifs et les coeurs dédiés aux communications afin d'obtenir un compromis entre le taux de recouvrement et les performances globales. Nous proposons un modèle afin d'étudier et prédire le comportement de cet algorithme ainsi qu'une implémentation dans le framework MPC. Nous avons obtenu de bons résultats en testant notre approche sur des processeurs manycores tels que le KNL et le Skylake.
Domaines
Informatique [cs]
Origine : Fichiers produits par l'(les) auteur(s)
Loading...