Redis 应用-HyperLogLog

Gundy 的个人博客 / 9 / 0 / 创建于 7年前

系列文章

Redis应用-分布式锁

Redis应用-异步消息队列与延时队列

Redis应用-位图

Redis应用-HyperLogLog

Redis应用-布隆过滤器

Redis应用-限流

Redis应用-Geo

如果你要统计网站的PV，你可以使用Redis计数器就好了，每来一个请求，调用一次incrby即可。但是如果要统计UV就没那么简单呢，它需要去重，当然你肯定想到了Redis中的去重的Set集合，当一个请求过来使用sadd添加用户ID,通过scard取出集合的大小。但是如果上千万的UV，使用集合来统计，就非常浪费空间了。而Redis提供的HyperLogLog数据结构正是来解决这类统计问题的，当然在数据量很大的情况下，他会有一定的误差。

HyperLogLog算法是一种非常巧妙的近似统计海量去重元素数量的算法。它内部维护了 16384 个桶（bucket）来记录各自桶的元素数量。当一个元素到来时，它会散列到其中一个桶，以一定的概率影响这个桶的计数值。因为是概率算法，所以单个桶的计数值并不准确，但是将所有的桶计数值进行调合均值累加起来，结果就会非常接近真实的计数值。

具体的原理解析可参考探索HyperLogLog算法

使用方法

HyperLogLog 使用比较简单，主要提供提供了两个指令

pfadd 增加计数
pfcount 获取计数

HyperLogLog还提供了第三个指令 pfmerge，用于将多个 pf 计数值累加在一起形成一个新的 pf 值。

比如在网站中我们有两个内容差不多的页面，运营需要将两个页面的数据进行合并。其中页面的 UV 访问量也需要合并，这时候就可以使用pfmerge。

pf 的内存只有12k

HyperLogLog 实现中用到的是 16384 个桶，也就是 2^14，每个桶的 maxbits 需要 6 个 bits 来存储，最大可以表示 maxbits=63，于是总共占用内存就是2^14 * 6 / 8 = 12k字节

本文亦在微信公众号【小道资讯】发布，欢迎扫码关注！

redis https

本作品采用《CC 协议》，转载必须注明作者和本文链接

课程读者 330 声望

暂无个人描述~

《L01 基础入门》

我们将带你从零开发一个项目并部署到线上，本课程教授 Web 开发中专业、实用的技能，如 Git 工作流、Laravel Mix 前端工作流等。

《L04 微信小程序从零到发布》

从小程序个人账户申请开始，带你一步步进行开发一个微信小程序，直到提交微信控制台上线发布。

推荐文章：

更多推荐...

Redis 实用小技巧——记一次 Redis 「大扫除」行动 12 / 6 |

手摸手带你使用 docker-compose 编排一个开发环境 22 / 15 |

Tiny RDM - 您的极简Redis数据管理利器！高效、易用、快速部署。立即体验！🚀! 欢迎各位来尝鲜. 13 / 23 |

Redis 实用小技巧——浅谈 Redis 使用规范 11 / 8 |

Redis 实用小技巧—— bitmap 应用之「位排序」 13 / 5 |

Redis 实用小技巧—— bitmap 应用之「签到统计」 18 / 14 |

讨论数量: 0

(=￣ω￣=)··· 暂无内容！

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

未填写

私信

文章归档

2 篇 2025 年 12 月 1 篇 2025 年 9 月 1 篇 2024 年 5 月 1 篇 2024 年 3 月 1 篇 2023 年 2 月 1 篇 2021 年 7 月 1 篇 2020 年 12 月 1 篇 2019 年 10 月 2 篇 2019 年 9 月 1 篇 2019 年 8 月 9 篇 2019 年 7 月 1 篇 2019 年 5 月 1 篇 2019 年 4 月 2 篇 2018 年 10 月

7个月前 Laravel AI SaaS：开箱即用的 AI 应用开发框架 7个月前 Laravel AI SaaS：开箱即用的 AI 应用开发框架 10个月前提供 claude code 中转站月卡，需要的老铁私我 2年前 laravel11使用dcat admin 2年前来聊聊laravel项目中常用的compoer包都有哪些

165 Redis 应用-限流 41 Redis 应用-异步消息队列与延时队列 22 Redis 应用-分布式锁 14 Redis 应用-Geo 12 微服务的那些事

博客标签

成为赞助商