déposer
version française rss feed
HAL : hal-00095370, version 4

Fiche détaillée  Récupérer au format
4th Colloquium on Mathematics and Computer Science, France (2006)
Versions disponibles :
Efficient estimation of the cardinality of large data sets
Philippe Chassaing 1, Lucas Gerin 1
(2006)

F.Giroire has recently proposed an algorithm which returns the approximate number of distincts elements in a large sequence of words, under strong constraints coming from the analysis of large data bases. His estimation is based on statistical properties of uniform random variables in $[0,1]$. In this note we propose an optimal estimation, using Kullback information and estimation theory.
1 :  Institut Elie Cartan Nancy (IECN)
CNRS : UMR7502 – INRIA – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine
Probabilités et statistiques
Mathématiques/Probabilités
cardinality – large multiset – approximate counting – data stream algorithms
Liste des fichiers attachés à ce document : 
PDF
EfficientEstimation.pdf(214.2 KB)
PS
EfficientEstimation.ps(751.7 KB)

tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...