Résumer efficacement des flux de données massifs en fenêtre glissante

Résumé : Estimer la fréquence de n'importe quel item dans des flux de données massifs est un des problèmes majeurs de la dernière décennie. Si plusieurs solutions élégantes ont été proposées récemment, leur approximation est calculée depuis le commencement du flux. Dans un contexte applicatif en ligne, il serait préférable de collecter l'information sur un passé récent, tant pour économiser des ressources que par pertinence de l'information la plus récente. Dans cet article, nous considérons le modèle dit de fenêtre glissante et proposons deux algorithmes en ligne qui estiment la fréquence de chaque item dans la fenêtre courante. Ces algorithmes sont des (ε, δ)-approximations absolues des valeurs de fréquences réelles, utilisant une faible quantité mémoire (respectivement O(1/ε log 1/δ (log N + log n)) et O(1/τε log 1/δ (log N + log n)) bits, où N est la longueur de la fenêtre, n est le nombre d'items distincts du flux et τ est un paramètre permettant de limiter l'utilisation mémoire. Les expérimentations conduites, comparant nos solutions à celles de l'état de l'art, illustrent la validité et la robustesse de nos algorithmes.
Type de document :
Communication dans un congrès
ALGOTEL 2016 - 18èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications, May 2016, Bayonne, France. ALGOTEL 2016 - 18èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01303882
Contributeur : Yann Busnel <>
Soumis le : mardi 19 avril 2016 - 18:25:45
Dernière modification le : vendredi 24 février 2017 - 13:29:52
Document(s) archivé(s) le : mardi 15 novembre 2016 - 06:04:33

Fichier

rbm-windowing-algotel15.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01303882, version 1

Citation

Nicoló Rivetti, Yann Busnel, Achour Mostefaoui. Résumer efficacement des flux de données massifs en fenêtre glissante. ALGOTEL 2016 - 18èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications, May 2016, Bayonne, France. ALGOTEL 2016 - 18èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications. <hal-01303882>

Partager

Métriques

Consultations de
la notice

464

Téléchargements du document

90