A Performance Evaluation of Apache Kafka in Support of Big Data Streaming Applications - Archive ouverte HAL Accéder directement au contenu
Poster De Conférence Année : 2017

A Performance Evaluation of Apache Kafka in Support of Big Data Streaming Applications

Evaluation de performances d'Apache Kafka en support aux applications Big Data de traitement de flux

Paul Le Noac'H
  • Fonction : Auteur
  • PersonId : 1023608
Luc Bougé

Résumé

Producer performances when modifying batch size for several number of nodes and a message size of 50B 7. Take-aways • The variation of the batch size shows that there is a range of batches with a better performance. • When varying the number of nodes in some scenarios: a sudden performance drop (probably due to the internal Kafka synchronizations as well as the underlying network). • Future work : evaluating reference processing frameworks (Apache Spark and Flink) Parameters : • Message size • Batch size • Acquirement strategy • Network and disk I/O threads • Message replication • Hardware 2. Contribution • Isolate the performance of each Kafka component
Fichier principal
Vignette du fichier
KerData-Paul-Lenoach.pdf (2.4 Mo) Télécharger le fichier
KerData-Paul-Lenoach (1).pdf (2.4 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01647229 , version 1 (24-11-2017)

Identifiants

  • HAL Id : hal-01647229 , version 1

Citer

Paul Le Noac'H, Alexandru Costan, Luc Bougé. A Performance Evaluation of Apache Kafka in Support of Big Data Streaming Applications. IEEE Big Data 2017, Dec 2017, Boston, United States. 2017. ⟨hal-01647229⟩
1121 Consultations
889 Téléchargements

Partager

Gmail Facebook X LinkedIn More