Social network ordering based on communities to reduce cache misses - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Revue Africaine de Recherche en Informatique et Mathématiques Appliquées Année : 2017

Social network ordering based on communities to reduce cache misses

Numérotation des graphes sociaux basée sur les communautés pour la réduction des défauts de cache

Résumé

One of social graph's properties is the community structure, that is, subsets where nodes belonging to the same subset have a higher link density between themselves and a low link density with nodes belonging to external subsets. Futhermore, most social network mining algorithms comprise a local exploration of the underlying graph, which consists in referencing nodes in the neighborhood of a particular node. The idea of this paper is to use the community structure during the storage of large graphs that arise in social network mining. The goal is to reduce cache misses and consequently, execution time. After formalizing the problem of social network ordering as a problem of optimal linear arrangement which is known as NP-Complet, we propose NumBaCo, a heuristic based on the community structure. We present for Katz score and Pagerank, simulations that compare classic data structures Bloc and Yale to their corresponding versions that use NumBaCo. Results on a 32 cores NUMA machine using amazon, dblp and web-google datasets show that NumBaCo allows to reduce from 62% to 80% of cache misses and from 15% to 50% of execution time.
L'une des propriétés des graphes sociaux est leur structure en communautés, c'est-à-dire en sous-ensembles où les noeuds ont une forte densité de liens entre eux et une faible den-sité de liens avec l'extérieur. Par ailleurs, la plupart des algorithmes de fouille des réseaux sociaux comportent une exploration locale du graphe sous-jacent, ce qui amène à partir d'un noeud, à faire référence aux noeuds situés dans son voisinage. L'idée de cet article est d'exploiter la structure en communautés lors du stockage des grands graphes qui surviennent dans la fouille des réseaux so-ciaux. L'objectif est de réduire le nombre de défauts de cache avec pour conséquence l'amélioration du temps d'exécution. Après avoir formalisé le problème de numérotation des noeuds des réseaux sociaux comme un problème d'arrangement linéaire optimal qui est connu comme NP-Complet, nous proposons NumBaCo, une heuristique basée sur la struture en communautés. Nous présentons pour le score de Katz et Pagerank, des simulations comparant les structures de données classiques Bloc et Yale à leurs versions exploitant NumBaCo. Les résultats obtenus sur une machine NUMA de 32 coeurs à partir des jeux de données amazon, dblp et web-google montrent que NumBaCo contribue à diminuer les défauts de cache de 62% à 80% et le temps d'exécution de 15% à 50%.
Fichier principal
Vignette du fichier
arima_volume_24_messi.pdf (1.65 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01304968 , version 1 (20-04-2016)
hal-01304968 , version 2 (30-11-2016)
hal-01304968 , version 3 (07-12-2016)
hal-01304968 , version 4 (04-05-2017)
hal-01304968 , version 5 (10-05-2017)

Licence

Domaine public

Identifiants

  • HAL Id : hal-01304968 , version 4

Citer

Thomas Messi Messi Nguélé, Maurice Tchuente, Jean-François Méhaut. Social network ordering based on communities to reduce cache misses. Revue Africaine de Recherche en Informatique et Mathématiques Appliquées, 2017. ⟨hal-01304968v4⟩
658 Consultations
1206 Téléchargements

Partager

Gmail Facebook X LinkedIn More