Exploration de données massives à l'aide d'estimations de cardinalités - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Exploration de données massives à l'aide d'estimations de cardinalités

Olivier Pivert
  • Fonction : Auteur
  • PersonId : 967947

Résumé

This paper describes FuzViz, a tool to explore interactively massive relational data. FuzViz relies on a method building automatically linguistic summaries, that provide concise and intelligible insights in the data content. It offers an interactive view of these summaries, dynamically recomputed on demand. To ensure a fluid exploration of the data, FuzViz exploits the proposition of a highly efficient method for estimating the cardinality of the summary properties, estimated from statistics about the data distribution stored in the relational data base, consolidated by a sampling-based approach. The proposed workflow also involves a vocabulary inference mechanism from these statistics.
Cet article présente un outil d'exploration interactive de données massives stockées dans un système de gestion de base de données (SGBD), nommé FuzViz. Il repose sur une méthode de construction automatique de résumés linguistiques, qui fournissent une synthèse concise et intelligible du contenu des données. Il offre une vue interactive de ces résumés recalculée dynamiquement selon les demandes de l'utilisateur. Pour assurer une exploration fluide des propriétés décrites par ces résumés, FuzViz s'appuie sur la proposition d'une méthode efficace d'estimations de leurs cardinalités, produites à partir des statistiques sur la distribution des données gérées par le SGBD et consolidées par une approche basée sur un échantillonnage. L'outil propose de plus un mécanisme d'inférence de vocabulaire flou à partir de ces statistiques.
Fichier principal
Vignette du fichier
fuzviz_lfa22.pdf (498.34 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03777530 , version 1 (14-09-2022)

Identifiants

  • HAL Id : hal-03777530 , version 1

Citer

Pierre Nerzic, Grégory Smits, Olivier Pivert, Marie-Jeanne Lesot. Exploration de données massives à l'aide d'estimations de cardinalités. LFA 2022 - Rencontres francophones sur la logique floue et ses applications, Oct 2022, Toulouse, France. ⟨hal-03777530⟩
56 Consultations
17 Téléchargements

Partager

Gmail Facebook X LinkedIn More