CybergeoNetworks : un outil interactif pour l’analyse de corpus bibliométriques massifs

Résumé : La croissance du nombre des articles publiés et la multiplication des revues ont fait entrer les publications scientifiques dans le règne des données massives. Les bouleversements introduits par les usages d’Internet semblent avoir bien davantage contribué à l’explosion des références qu’ils n’ont simplifié le travail des équipes éditoriales ou facilité l’accès des utilisateurs à la littérature scientifique. Les difficultés de la maîtrise de ces données vont bien au-delà de ce que Eugène Garfield avait anticipé en créant en 1964 la base de données de l’ISI (qui devait devenir le Web of Science après rachat par Thomson Reuters). La question de la maîtrise de la littérature reste cruciale pour tout scientifique qui souhaite connaître et dresser un « état de l’art ». Elle devient encore plus difficile pour les sujets qui se situent aux interfaces de plusieurs disciplines, et qui risquent, si l’on s’en tient aux « niches » disciplinaires habituelles, d’être traités de manière partielle en réduisant la portée des solutions que la science peut apporter pour résoudre des problèmes sociaux. Les géographes en sont très conscients car depuis longtemps ils construisent une discipline à la charnière des sciences naturelles et sociales, sur des questions d’habitat et d’urbanisme, d’environnement et de santé, d’aménagement et de développement. Nous avons construit une application originale qui permet d’explorer le contenu du texte et des mots-clés des 900 articles publiés depuis 20 ans par la revue Cybergeo ainsi que l’ensemble des références citées dans ces articles ou les citant, parmi toutes les autres revues scientifiques accessibles par Google Scholar, ce qui constitue une base de données d’environ 200 000 articles avec leurs centaines de milliers de mots-clés associés. L’objectif est de permettre aux internautes de réaliser eux-mêmes à volonté des cartographies des proximités géographiques et sémantiques entre publications et entre zones géographiques en jouant avec ce corpus. Les mots-clés des articles de la revue forment des réseaux entre les articles qui les utilisent. La structure de ces réseaux nous renseigne de manière très fine sur l’existence de communautés et sur leurs évolutions dans le temps. À travers une analyse sémantique du contenu des 900 articles de la revue, l’outil permet aussi de voir le déclin de certaines spécialités ou courants ainsi que l’émergence de nouveaux thèmes. Il est également possible de construire un réseau sémantique bien plus vaste en prenant en compte à la fois les 900 articles de la revue Cybergeo, les articles cités par ces 900 articles et les articles citant ces 900 articles. L’analyse de ce réseau multidisciplinaires de 200 000 articles reflète les liens complexes entre outils, méthodes et thèmes de recherche à la croisée de plusieurs communautés disciplinaires. Une telle visualisation de réseau, typique des données massives, offre une vision globale de l'organisation de l'information au sein du d’un jeu de données multidimensionnel, et permet d'orienter les des analyses quantitatives plus ciblées (comme par exemple le calcul d'indices d'interdisciplinarité entre disciplines extraites du réseau). L’utilité de cet outil pour les auteurs est d’améliorer leur connaissance des thématiques de la revue, et de situer l’apport potentiel d’un nouvel article dans l’univers de ses références et des disciplines voisines qui peuvent être touchées. Pour l’équipe éditoriale, c’est un instrument de pilotage de la politique de la revue, qui peut choisir de maintenir sa ligne plutôt généraliste ou de se spécialiser davantage. Enfin, l’application pourrait être mise au service d’autres publications en ligne. Les grandes sociétés d’édition scientifique proposent des outils d’analyse bibliométriques permettant aux chercheurs et aux revues d’optimiser leur investissement pour se positionner au mieux sur le marché de la citation. Nous proposons ici un outil libre d’auto-analyse, conçu pour alimenter la réflexivité et l’intégrité de la recherche.
Mots-clés : COM PARIS team
Type de document :
Communication dans un congrès
Science XXL - Ce que l’abondance et la diversité des données font aux sciences sociales, Mar 2017, Paris, France. 〈https://data.hypotheses.org/1125〉
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01976040
Contributeur : Pierre-Olivier Chasset <>
Soumis le : mercredi 9 janvier 2019 - 17:14:25
Dernière modification le : jeudi 14 février 2019 - 17:31:48

Identifiants

  • HAL Id : hal-01976040, version 1

Citation

Pierre-Olivier Chasset, Hadrien Commenges, Clementine Cottineau, Christine Kosmopoulos, Denise Pumain, et al.. CybergeoNetworks : un outil interactif pour l’analyse de corpus bibliométriques massifs. Science XXL - Ce que l’abondance et la diversité des données font aux sciences sociales, Mar 2017, Paris, France. 〈https://data.hypotheses.org/1125〉. 〈hal-01976040〉

Partager

Métriques

Consultations de la notice

31