ExBLAS: Reproducible and Accurate BLAS Library

Roman Iakymchuk 1, 2 Sylvain Collange 3 David Defour 4 Stef Graillat 1
1 PEQUAN - Performance et Qualité des Algorithmes Numériques
LIP6 - Laboratoire d'Informatique de Paris 6
3 ALF - Amdahl's Law is Forever
Inria Rennes – Bretagne Atlantique , IRISA-D3 - ARCHITECTURE
4 DALI - Digits, Architectures et Logiciels Informatiques
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, UPVD - Université de Perpignan Via Domitia
Abstract : Due to non-associativity of floating-point operations and dynamic scheduling on parallel architectures, getting a bit-wise reproducible floating-point result for multiple executions of the same code on different or even similar parallel architectures is challenging. We address the problem of reproducibility in the context of fundamental linear algebra operations – like the ones included in the BLAS library – and propose algorithms that yield both reproducible and accurate results (correct rounding, except for triangular solver). We present implementations of these algorithms for the BLAS routines along with the performance results in parallel environments such as Intel desktop and server CPUs, Intel Xeon Phi, and both NVIDIA and AMD GPUs.
Type de document :
Communication dans un congrès
NRE: Numerical Reproducibility at Exascale, Nov 2015, Austin, TX, United States. 2015
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01202396
Contributeur : Roman Iakymchuk <>
Soumis le : lundi 21 décembre 2015 - 22:45:26
Dernière modification le : mercredi 29 novembre 2017 - 15:41:59
Document(s) archivé(s) le : samedi 29 avril 2017 - 23:31:09

Fichier

exblas.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01202396, version 3

Citation

Roman Iakymchuk, Sylvain Collange, David Defour, Stef Graillat. ExBLAS: Reproducible and Accurate BLAS Library. NRE: Numerical Reproducibility at Exascale, Nov 2015, Austin, TX, United States. 2015. 〈hal-01202396v3〉

Partager

Métriques

Consultations de la notice

414

Téléchargements de fichiers

248