讨论个问题！微信朋友圈的数据库是怎么设计的？

如题，微信朋友圈数据库怎么设计的，虽然这个问题很**，但是确实特么是我很久之前面试的时候，一个面试官问的。

Keep it Simple, Stupid

附言 1 · 3年前

抱歉各位，是我提的问题有问题，我应该提的详细点，这样的讨论太片面了。我觉得就讨论一个点吧！

比如我发了一个朋友圈，部分人可见，评论点赞好友之间可见（我的好友之间非好友不可见），朋友的朋友圈及时获取所有好友动态。简单的数据存储肯定是不难，难的是如何高效获取数据，数据如何存储？看到的相关方案说什么链表存储，其实想讨论的就是这个数据怎么存储相关数据关系。

笑逐颜凯

Laravel 9.x 译者 165 声望

PHP @ 蟑螂恶霸

Keep it Simple, Stupid

0 人点赞

你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程，JWT 概念及使用和 API 开发相关的进阶知识。

以构建论坛项目 LaraBBS 为线索，展开对 Laravel 框架的全面学习。应用程序架构思路贴近 Laravel 框架的设计哲学。

推荐文章：

更多推荐...

博客

Dcat-Plus-Admin：dcat-admin框架的超级增强版，开发效率提升200%！ 12 / 15 |

博客

做了一个独立开发者社区，期待大家一起交流 11 / 73 |

博客

用 Laravel12 Startkit 做了一个 composer 私有包托管平台 😂 点赞超过 20 个开源，看看需要的人多不多 28 / 19 |

如何打造令后端面试官印象深刻的简历？ 16 / 10 |

博客

花了四个月打磨的 Laravel Plus 开源 34 / 101 |

博客

冯老师的困惑 —— 一个跑了两年的 BUG 22 / 17 |

讨论数量: 34

fatrbaby

274 声望 / 首席换水官 @ 名剑风流

首先可以肯定的是，微信有N个数据库；不同的业务甚至说小功能的数据库应该都是不同的。而且我同时可以肯定，微信不会用数据库直接聚合查询来做数据统计。

3年前评论

笑逐颜凯（楼主）

阁下说的好像全对

taohua

课程读者 51 声望

坐等标准答案

3年前评论

如梦又似幻

课程读者 125 声望 / 摸鱼人 @ 屎山

可以参考下微博的数据库设计

3年前评论

笑逐颜凯（楼主）

阁下回答了又好像没回答

lidongyoo

课程读者 305 声望

朋友遇到一个面试题，微信朋友圈怎么设计？

3年前评论

笑逐颜凯（楼主）

为什么我不能打开这个地址:ghost:

lidongyoo （作者）

@笑逐颜凯开代理

lmdfx

Laravel 9.x 译者 143 声望

图片有、东西

3年前评论

balace

3 声望

想知道 learnKu 数据库怎么设计的

3年前评论

小李世界

Laravel 8.x 译者 2.0k 声望 / Doge 先锋 @ dogeow.com

本来就在床头，为什么又藏在床头了。。。 :flushed:

3年前评论

我爱大可乐

床头柜，枕头下

我还以为是藏在床头了，原来是藏在床头了

笑逐颜凯（楼主）

大佬们能不能关注一下问题的本身:see_no_evil:

PHPer技术栈

课程读者 822 声望 / 技术leader @ sinosoft

细致划分：系统与子系统、模块与组件、框架与架构
微信本身是一个系统，包含聊天、登录、支付、朋友圈等子系统。
朋友圈这个系统又包括动态、评论、点赞等子系统。
评论这个系统可能又包括防刷子系统、审核子系统、发布子系统、存储子系统。
评论审核子系统不再包含业务意义上的子系统，而是包括各个模块或者组件
这些模块或者组件本身也是另外一个维度上的系统。例如，MySQL、Redis 等是存储系统
数据库设计又分为一主一从、一主多从、多主多从，机房可以是同城双活、异地多活

3年前评论

PHPer技术栈（作者）

@笑逐颜凯用户表，用户好友表，好友权限表，取出当前账号下有朋友圈访问权限的好友动态，原始数据储存MySQL，实时数据和热点数据走redis，pivotal gemfire，消息通知和红点推送，异步处理

笑逐颜凯（楼主）

@PHPer技术栈感谢阁下抽空回答

笑逐颜凯（楼主）

其实我只是想大致知道朋友圈的设计，比如怎么快速取出一个人的朋友圈动态:see_no_evil:

PHPer技术栈（作者）

@小丑路人几个亿数据表，不得In炸了

PHPer技术栈（作者）

@小丑路人肯定的，作为一个案例分析研究，有值得学习和借鉴的点，像QQ从十万级 IM 1.X，百万级 IM 2.X，千万级 IM 3.X，亿级 IM 4.X，不同业务发展阶段，提供的解决思路也不一样

mowangjuanzi

Laravel 9.x 译者 261 声望 / PHP工程师 @ 山东起码信息科技

如果按照我自己的常规做法来说，就是使用mysql对用户进行log纪录。

然后使用ES等类似NoSQL数据库实现数据同步，然后在查询时使用 terms 进行过滤，这样就可以查询相关记录了。

然后在获取相关评论的时候，同时对你的好友进行过滤。

然后中间在插入一些广告，当然这应该是另外一个服务实现的，估计就是调用个接口的事情。

这里没考虑到的是量级的问题。问我我也回答不出，因为我没有腾讯这么大的量级。

还有什么没考虑到的可以互相沟通。

3年前评论

fatrbaby

我觉得朋友圈的对谁可见一类的，有可能不是后端处理的，有可能是前端处理的。

笑逐颜凯（楼主）

@fatrbaby 确实，前端处理会比后端简单点

mowangjuanzi （作者）

@fatrbaby 你说的这种也有可能。但是需要考虑的是量级的问题。抛开量级讲设计没意义

清风

@fatrbaby 涉及到权限的数据，怎么可能不是后端处理。不是后端处理的话，直接抓包就能看到任意好友的动态了

fatrbaby

首先，这个场景不是一个严格的权限场景，虽然可能被抓包，但无伤大雅；其次，网络通讯可以加密，就算你抓包拿到密文你也看不出来。最后我说的是"可能"，并没有言之凿凿地说一定是前端处理的。

qufo

Laravel 8.x 译者 303 声望

咳，要我去面试我会直接说不知道。确实没设计过用户量几个亿的系统。而且还仅是用户量。朋友圈数量根本是另一个数量级，马克斯告诉我们，量变会引起质变。我们设计的东西与人家在用的根本就不是一码事。
所谓夏虫不可语冰，我跟做毕业设计的小伙伴讲分库分表数据库中间件微服务群集的时候他也一脸不可置信，认为这完全没必要。这还仅仅是分库分表，何况朋友圈呢。
微信消息，朋友圈并不存储在腾讯的服务器上，至少腾讯是这么说的，那么简单了，腾讯只需要存储一小部分没被终端（手机）取回去的滞留消息和滞留朋友圈就好了。数据量可能并没有我们想象的那么大，如果腾讯是诚实的话，as we all know 。腾讯说这话的时候其实一直在眨眼的。

3年前评论

笑逐颜凯（楼主）

阁下好口才

PHPer技术栈

面试官也不会，主要是一个综合考察，临场反应

天南剑修历飞宇

课程读者 11 声望

我是这么设计的，朋友圈可以理解为“feed流”，“时间轴”。短视频、公众号文章、分享来的链接、图文等等，都是一个单独的对象，有自己独自的表结构，单独建立表，例如moment_video、moment_image，用来记录每种单独的数据结构，然后再建立一个moment表,用来记录统一的信息，比如发布者ID等。这是很常见的问题了，可以根据信息流表结构设计这个关键词去Google，by the way，laravel的多态很适合这种需求，后续数据量大的话可以再做个mongo来动静分离

3年前评论

PHPer技术栈

几个亿的用户，假设每天只有10%的发动态，动静分离也不能解决，源头点在架构设计和业务分离，多机房部署、异地容灾

ieso

1 声望

好问题，我觉得都能单独写一篇文章了。但是面试问这个是不是有点大病 :unamused:

3年前评论

PHPer技术栈

课程读者 822 声望 / 技术leader @ sinosoft

附上一个QQ架构案例分析：手机 QQ 的发展历程按照用户规模可以粗略划分为 4 个阶段：十万级、百万级、千万级、亿级，不同的用户规模，IM 后台的架构也不同，而且基本上都是用户规模先上去，然后产生各种问题，倒逼技术架构升级。

十万级 IM 1.X 最开始的手机 QQ 后台是这样的，可以说是简单得不能再简单、普通得不能再普通的一个架构了，因为当时业务刚开始，架构设计遵循的是“合适原则”和“简单原则”。

file

百万级 IM 2.X 随着业务发展到 2001 年，QQ 同时在线人数也突破了一百万。第一代架构很简单，明显不可能支撑百万级的用户规模，主要的问题有：以接入服务器的内存为例，单个在线用户的存储量约为 2KB，索引和在线状态为 50 字节，好友表 400 个好友 × 5 字节 / 好友 = 2000 字节，大致来说，2GB 内存只能支持一百万在线用户。 CPU/ 网卡包量和流量 / 交换机流量等瓶颈。单台服务器支撑不下所有在线用户 / 注册用户。 IM 2.X 的最终架构如图

file

千万级 IM 3.X 业务发展到 2005 年，QQ 同时在线人数突破了一千万。第二代架构支撑百万级用户是没问题的，但支撑千万级用户又会产生新问题，表现有：同步流量太大，状态同步服务器遇到单机瓶颈。所有在线用户的在线状态信息量太大，单台接入服务器存不下，如果在线数进一步增加，甚至单台状态同步服务器也存不下。单台状态同步服务器支撑不下所有在线用户。单台接入服务器支撑不下所有在线用户的在线状态信息。 M 3.X 的最终架构如图

file

亿级 IM 4.X 业务发展到 2010 年 3 月，QQ 同时在线人数过亿。第三代架构此时也不适应了，主要问题有：灵活性很差，比如“昵称”长度增加一半，需要两个月；增加“故乡”字段，需要两个月；最大好友数从 500 变成 1000，需要三个月。无法支撑某些关键功能，比如好友数上万、隐私权限控制、PC QQ 与手机 QQ 不可互踢、微信与 QQ 互通、异地容灾。除了不适应，还有一个更严重的问题： IM 后台从 1.0 到 3.5 都是在原来基础上做改造升级的，但是持续打补丁已经难以支撑亿级在线，IM 后台 4.0 必须从头开始，重新设计实现！架构拆分为两个主要的架构：存储架构和通信架构，重新设计的 IM 4.0 架构如图存储架构：

file 通信架构：