Demonstration des Parallel Data Generation Framework - Archive ouverte HAL Accéder directement au contenu
Poster De Conférence Année : 2011

Demonstration des Parallel Data Generation Framework

Michael Frank

Résumé

In vielen akademischen und wirtschaftlichen Anwendungen durchbrechen die Datenmengen die Petabytegrenze. Dies stellt die Datenbankforschung vor neue Aufgaben und Forschungsfelder. Petabytes an Daten werden gewöhnlich in großen Clustern oder Clouds gespeichert. Auch wenn Clouds in den letzten Jahren sehr populär geworden sind, gibt es dennoch wenige Arbeiten zum Benchmarking von Anwendungen in Clouds. In diesem Beitrag stellen wir einen Datengenerator vor, der für die Generierung von Daten in Clouds entworfen wurde. Die Architektur des Generators ist auf einfache Erweiterbarkeit und Konfigurierbarkeit ausgelegt. Die wichtigste Eigenschaft ist die vollständige Parallelverarbeitung, die einen optimalen Speedup auf einer beliebigen Anzahl an Rechnerknoten erlaubt. Die Demonstration umfasst sowohl die Erstellung eines Schemas, als auch die Generierung mit verschiedenen Parallelisierungsgraden. Um Interessenten die Definition eigener Datenbanken zu ermöglichen, ist das Framework auch online verfügbar.
Fichier non déposé

Dates et versions

hal-01354572 , version 1 (18-08-2016)

Identifiants

  • HAL Id : hal-01354572 , version 1

Citer

Tilmann Rabl, Hatem Mousselly-Sergieh, Michael Frank, Harald Kosch. Demonstration des Parallel Data Generation Framework. 14. BTW-Tagung der Gesellschaft für Informatik (GI) , Mar 2011, Kaiserslautern, Germany. Gesellschaft für Informatik, pp.730-733, 2011. ⟨hal-01354572⟩
126 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More