Des métadonnées et paradonnées pour mieux exploiter des données d’enquêtes pour la recherche - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2021

Des métadonnées et paradonnées pour mieux exploiter des données d’enquêtes pour la recherche

Résumé

Selon Jillian C. Wallis, Elizabeth Rolando, Christine L. Borgman [1] le partage des données se fait en fonction du type de recherche par lequel les données sont produites et réutilisées. Les données issues de la « grande science » (grandes équipes, projets à long terme, instrumentation étendue) seront volumineuses, avec une structure cohérente. À l'inverse, dans la « petite science », qui est appelée « la longue traîne » de la science, les individus et les petites équipes collectent des données pour des projets spécifiques, de petit volume, ayant un caractère local, et destinées à être utilisées uniquement par ces équipes. Elles sont moins susceptibles d'être structurées de manière à permettre un transfert facile des données entre équipes ou individus. Alors que les données issues « de la grande science » retiennent l'attention, la « petite science et la longue traîne » semblent constituer la majeure partie du financement scientifique. Rendre les données de longue traîne découvrables et réutilisables devient un défi majeur pour que le financement public soit profitable au plus grand nombre. Les institutions comme le Centre de données socio-politiques (CDSP), qui valorisent et diffusent majoritairement des données « de longue traîne » peuvent jouer un rôle majeur dans ce contexte. Depuis 15 ans, le CDSP, UMS du CNRS et de Sciences Po et partenaire de la TGIR PROGEDO [2], a développé une expertise solide dans la valorisation et l’ouverture des « petites données » de la recherche selon des principes FAIR. Il documente et diffuse notamment des enquêtes de sociologie et de science politique issues de méthodes quantitatives et qualitatives en vue de leur réutilisation. Pour ce faire, les membres du CDSP participent activement aux travaux de la communauté du standard de métadonnées Data Documentation initiative (DDI). Par ailleurs, le panel longitudinal probabiliste ELIPSS (Étude Longitudinale par Internet Pour les Sciences Sociales) a été l'occasion de collecter au CDSP de riches paradonnées - données recueillies lors du processus de collecte et qui renseignent sur celui-ci. Dans le cadre de cet atelier, nous proposons une première partie théorique sur les métadonnées et paradonnées, suivie d’une partie “prise en main” où nous étudierons de plus près les outils et procédures permettant le traitement des métadonnées et paradonnées. Le déroulé de l’atelier de deux heures serait : Métadonnées : grands principes, présentation du standard DDI, utilisé au CDSP Paradonnées : définitions, cas d’usage Outils et pratiques de documentation de données d’enquêtes selon les principes FAIR > Démonstration des pratiques d’édition, de stockage et de diffusion des métadonnées du CDSP se basant sur les spécifications DDI Lifecycle avec la suite logicielle Colectica. > Pratiques documentaires et standards applicables aux enquêtes qualitatives (plan de classement, DC, DDI, EAD) Traitement des données pour leur diffusion (anonymisation, recodages, formats pérennes, etc) Exploitation des paradonnées [1] Wallis JC, Rolando E, Borgman CL (2013) If We Share Data, Will Anyone Use Them? Data Sharing and Reuse in the Long Tail of Science and Technology. PLoS ONE 8(7): e67332. https://doi.org/10.1371/journal.pone.0067332
Fichier principal
Vignette du fichier
Des métadonnées et paradonnées pour mieux exploiter des données d’enquêtes pour la recherche.pdf (6.44 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03432005 , version 1 (17-11-2021)

Licence

Paternité - Partage selon les Conditions Initiales

Identifiants

  • HAL Id : hal-03432005 , version 1

Citer

Valentin Brunel, Paul Colin, Alina Danciu, Quentin Gallis, Emilie Groshens, et al.. Des métadonnées et paradonnées pour mieux exploiter des données d’enquêtes pour la recherche. Mate la Science ouverte, Réseau Métier MATE, 2021, Virtuel, France. ⟨hal-03432005⟩
228 Consultations
155 Téléchargements

Partager

Gmail Facebook X LinkedIn More