Reproducible Triangular Solvers for High-Performance Computing

Roman Iakymchuk 1, 2 David Defour 3 Sylvain Collange 4 Stef Graillat 2
2 PEQUAN - Performance et Qualité des Algorithmes Numériques
LIP6 - Laboratoire d'Informatique de Paris 6
3 DALI - Digits, Architectures et Logiciels Informatiques
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, UPVD - Université de Perpignan Via Domitia
4 ALF - Amdahl's Law is Forever
Inria Rennes – Bretagne Atlantique , IRISA-D3 - ARCHITECTURE
Abstract : On modern parallel architectures, floating-point computations may become non-deterministic and, therefore, non-reproducible mainly due to non-associativity of floating-point operations. We propose an algorithm to solve dense triangular systems by leveraging the standard parallel triangular solver and our, recently introduced, multi-level exact summation approach. Finally, we present implementations of the proposed fast repro-ducible triangular solver and results on recent NVIDIA GPUs.
Type de document :
Pré-publication, Document de travail
2015
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01116588
Contributeur : Roman Iakymchuk <>
Soumis le : samedi 14 février 2015 - 17:30:54
Dernière modification le : mardi 10 octobre 2017 - 11:11:36
Document(s) archivé(s) le : jeudi 28 mai 2015 - 15:05:44

Fichier

trsv.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01116588, version 2

Citation

Roman Iakymchuk, David Defour, Sylvain Collange, Stef Graillat. Reproducible Triangular Solvers for High-Performance Computing. 2015. 〈hal-01116588v2〉

Partager

Métriques

Consultations de
la notice

377

Téléchargements du document

308