Modélisation des métadonnées d'un data lake en data vault

Résumé : Avec l'avènement des mégadonnées (\textit{big data}), l'informatique décisionnelle a dû trouver des solutions pour gérer des volumes et une variété de données plus grands encore que dans les entrepôts de données, qui se sont révélés mal adaptés. Les lacs de données (\textit{data lakes}) répondent à ces besoins du point du vue du stockage, mais nécessitent la gestion de métadonnées adéquates pour garantir un accès efficace aux données. Sur la base d'un modèle multidimensionnel de métadonnées conçu pour un lac de données patrimoniales présentant un défaut d'évolutivité de schéma, nous proposons dans cet article l'utilisation de la modélisation ensembliste, et plus particulièrement d'un \textit{data vault}, pour traiter ce problème. Pour montrer la faisabilité de cette approche, nous instancions notre modèle conceptuel de métadonnées en modèles logiques et physiques relationnel et orienté document, respectivement. Nous comparons également les modèles physiques en termes de stockage et de temps de réponse aux requêtes sur les métadonnées.
Type de document :
Communication dans un congrès
18e conférence sur l'Extraction et la Gestion de Connaissances (EGC 2018), Jan 2018, Paris, France. E-34, pp.257-262, 2018, Revue des Nouvelles Technologies de l'Information. 〈https://egc18.sciencesconf.org/〉
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01665547
Contributeur : Jérôme Darmont <>
Soumis le : lundi 12 février 2018 - 13:31:59
Dernière modification le : mercredi 31 octobre 2018 - 12:24:20
Document(s) archivé(s) le : jeudi 3 mai 2018 - 09:43:09

Identifiants

  • HAL Id : hal-01665547, version 1

Collections

Citation

Iuri Nogueira, Maram Romdhane, Jérôme Darmont. Modélisation des métadonnées d'un data lake en data vault. 18e conférence sur l'Extraction et la Gestion de Connaissances (EGC 2018), Jan 2018, Paris, France. E-34, pp.257-262, 2018, Revue des Nouvelles Technologies de l'Information. 〈https://egc18.sciencesconf.org/〉. 〈hal-01665547〉

Partager

Métriques

Consultations de la notice

201

Téléchargements de fichiers

730