Calcul parallèle de dépendances

Eve Garnaud 1 Nicolas Hanusse 1, 2 Sofian Maabout 1, 2 Noël Novelli 3
2 CEPAGE - Algorithmics for computationally intensive applications over wide scale distributed platforms
Université Sciences et Technologies - Bordeaux 1, Inria Bordeaux - Sud-Ouest, École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB), CNRS - Centre National de la Recherche Scientifique : UMR5800
Résumé : L'extraction de dépendances fonctionnelles (DFs) est un probléme classique qui continue de susciter de nouveaux travaux du fait des multiples exploitations possibles que cette information peut avoir. Dans cet article, nous présentons un algorithme paralléle paramétrable qui calcule les DFs exactes, DFs approchées, DFs conditionnelles (DFCs) ainsi que les clés minimales. Pour les cas des DFs exactes et des clés minimales, les tests de validité sont basés sur un calcul de nombre de valeurs distinctes. Nous étudions l'introduction des techniques d'approximation proposées á cet effet (nombre de valeurs distinctes), précisément la méthode Hyperloglog, permettant ainsi d'économiser l'espace mémoire et ouvrant la voie á une approche paralléle orientée données. Ceci est d'autant plus important quand les données sont massives. Bien que les résultats retournés dans ce dernier cas soient approximatifs, nous donnons des bornes théoriques sur les erreurs qu'on peut avoir. Une série d'expériences montrent l'efficacité de notre approche.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-00940779
Contributor : Sofian Maabout <>
Submitted on : Sunday, February 2, 2014 - 8:57:23 PM
Last modification on : Friday, March 9, 2018 - 11:24:49 AM

Identifiers

  • HAL Id : hal-00940779, version 1

Citation

Eve Garnaud, Nicolas Hanusse, Sofian Maabout, Noël Novelli. Calcul parallèle de dépendances. Bases de Données Avancées, Oct 2013, Nantes, France. pp.1-20. ⟨hal-00940779⟩

Share

Metrics

Record views

264