Social network ordering based on communities to reduce cache misses

Résumé : L'une des propriétés des graphes sociaux est leur structure en communautés, c'est-à-dire en sous-ensembles où les noeuds ont une forte densité de liens entre eux et une faible den-sité de liens avec l'extérieur. Par ailleurs, la plupart des algorithmes de fouille des réseaux sociaux comportent une exploration locale du graphe sous-jacent, ce qui amène à partir d'un noeud, à faire référence aux noeuds situés dans son voisinage. L'idée de cet article est d'exploiter la structure en communautés lors du stockage des grands graphes qui surviennent dans la fouille des réseaux so-ciaux. L'objectif est de réduire le nombre de défauts de cache avec pour conséquence l'amélioration du temps d'exécution. Après avoir formalisé le problème de numérotation des noeuds des réseaux sociaux comme un problème d'arrangement linéaire optimal qui est connu comme NP-Complet, nous proposons NumBaCo, une heuristique basée sur la struture en communautés. Nous présentons pour le score de Katz et Pagerank, des simulations comparant les structures de données classiques Bloc et Yale à leurs versions exploitant NumBaCo. Les résultats obtenus sur une machine NUMA de 32 coeurs à partir des jeux de données amazon, dblp et web-google montrent que NumBaCo contribue à diminuer les défauts de cache de 62% à 80% et le temps d'exécution de 15% à 50%.
Type de document :
Article dans une revue
Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées, INRIA, 2017, Special issue CRI 2015, Volume 24 - 2016-2017 - Special issue CRI 2015, pp.23 - 47
Liste complète des métadonnées

Littérature citée [17 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01304968
Contributeur : Thomas Messi Nguélé <>
Soumis le : mercredi 10 mai 2017 - 14:46:41
Dernière modification le : jeudi 15 juin 2017 - 09:09:21
Document(s) archivé(s) le : vendredi 11 août 2017 - 13:13:47

Fichier

ARIMA24pp23-47_1.pdf
Fichiers produits par l'(les) auteur(s)

Licence


Domaine public

Identifiants

  • HAL Id : hal-01304968, version 5

Relations

  • est une version de hal-01304968 - version mise à jour à la demande de l'editeur d'arima

Citation

Thomas Messi Nguélé, Maurice Tchuente, Jean-François Méhaut. Social network ordering based on communities to reduce cache misses. Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées, INRIA, 2017, Special issue CRI 2015, Volume 24 - 2016-2017 - Special issue CRI 2015, pp.23 - 47. 〈hal-01304968v5〉

Partager

Métriques

Consultations de la notice

195

Téléchargements de fichiers

91