HyperLogLog
est utilisé pour compter les éléments uniques. Il peut compter un grand nombre d'éléments avec un peu de mémoire. Cependant, la cardinalité renvoyée n'est PAS exacte, mais approchée avec une standard error
.
0,81 % est l'standard error
, PAS le faux positif. Pour votre instance, vous pouvez appeler PFCOUNT HLL
pour obtenir le nombre approximatif d'éléments uniques que vous mettez dans le HyperLogLog
. Le nombre renvoyé doit être compris entre [10000 * (1 - 0.81%), 10000 * (1 + 0.81%)]
.
PFADD
renvoie 1 si la cardinalité estimée est modifiée après l'exécution de la commande. Il renvoie 0, sinon. Cela n'a rien à voir avec le false positive
.
Il semble que vous ayez besoin d'un filtre Bloom, qui peut vous dire si un élément existe déjà dans un ensemble de données, avec un faux positif. Vous pouvez implémenter un Bloom Filter
avec Redis, bien sûr. Et il devrait y avoir un projet open source pour ça.