Caju: a content distribution system for edge networks

Guthemberg Silvestre; Sébastien Monnet; Ruby Krishnaswamy; Pierre Sens

Rapport (Rapport De Recherche) Année : 2012

Caju: a content distribution system for edge networks

(1, 2) , (1) , (2) , (1)

1
2

Guthemberg Silvestre

Fonction : Auteur
PersonId : 734750
IdHAL : guthemberg-silvestre
ORCID : 0000-0002-0273-7212
IdRef : 180892037

Large-Scale Distributed Systems and Applications

Orange Labs [Issy les Moulineaux]

Sébastien Monnet

Fonction : Auteur
PersonId : 831800

Large-Scale Distributed Systems and Applications

Ruby Krishnaswamy

Fonction : Auteur

Orange Labs [Issy les Moulineaux]

Pierre Sens

Fonction : Auteur
PersonId : 737442
IdHAL : pierre-sens
ORCID : 0000-0002-5156-7715
IdRef : 259987166

Large-Scale Distributed Systems and Applications

Résumé

More and more, users store their data in the cloud. While the content is then retrieved, the retrieval has to respect quality of service (QoS) constraints. In order to reduce transfer latency, data is replicated. The idea is make data close to users and to take advantage of providers home storage. However to minimize the cost of their platform, cloud providers need to limit the amount of storage usage. This is still more crucial for big contents. This problem is hard, the distribution of the popularity among the stored pieces of data is highly non-uniform: several pieces of data will never be accessed while others may be retrieved thousands of times. Thus, the trade-off between storage usage and QoS of data retrieval has to take into account the data popularity. This report presents our architecture gathering several storage domains composed of small-sized datacenters and edge devices; and it shows the importance of adapting the replication degree to data popularity. Our simulations, using realistic workloads, show that a simple cache mechanism provides a eight-fold ecrease in the number of SLA violations, requires up to 10 times less of storage capacity for replicas, and reduces aggregate bandwidth and number of flows by half.

Les données des utilisateurs sont de plus en plus externalisées, stockées dans des clouds. Lors de la récupération des données, une certaine qualité de service doit être respectée. Afin de réduire la latence d'accès, les données sont répliquées. L'idée est de rapprocher les données des utilisateurs, mais également, de tirer avantage des systèmes de stockage du fournisseur chez l'utilisateur (les ''boxes''). Cependant, afin de minimiser le coût de leur plate-forme les opérateurs de cloud doivent limiter la quantité de stockage utilisée. Ceci est d'autant plus important que les données sont volumineuses. Ce problème est dur, les données ne sont pas toutes également populaires, la popularité est distribuée de manière très hétérogène: certaines données ne seront jamais accédées alors que d'autres seront demandées des milliers de fois. Le bon compromis entre l'utilisation de l'espace de stockage et la qualité de service doit donc prendre en compte la popularité des données. Ce rapport présente notre architecture qui rassemble plusieurs domaines de stockage composés de data-center de petite taille et de périphériques de bordure; il montre l'importance d'adapter le degré de réplication à la popularité des données. Nos simulations, montrent qu'un simple mécanisme de cache arrive a diviser par 8 le nombre de violations de SLA (Service Level Agreement) tout en nécessitant 10 fois moins de capacité de stockage.

Domaines

Algorithme et structure de données [cs.DS]

Fichier principal

RR-8006.pdf (290.57 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Sébastien Monnet : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00712990

Soumis le : jeudi 28 juin 2012-17:05:26

Dernière modification le : mardi 11 avril 2023-15:16:28

Archivage à long terme le : jeudi 15 décembre 2016-19:34:23

Dates et versions

hal-00712990 , version 1 (28-06-2012)

Identifiants

HAL Id : hal-00712990 , version 1

Citer

Guthemberg Silvestre, Sébastien Monnet, Ruby Krishnaswamy, Pierre Sens. Caju: a content distribution system for edge networks. [Research Report] RR-8006, INRIA. 2012. ⟨hal-00712990⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UPMC CNRS INRIA INRIA-RRRT LIP6 INRIA2 LARA SORBONNE-UNIVERSITE SU-SCIENCES

177 Consultations

435 Téléchargements

Caju: a content distribution system for edge networks

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager