PHP 结合 MySQL 千万级数据处理

mysql分表思路


一张一亿的订单表,可以分成五张表,这样每张表就只有两千万数据,分担了原来一张表的压力,分表需要根据某个条件进行分,这里可以根据地区来分表,需要一个中间件来控制到底是去哪张表去找到自己想要的数据。
中间件:根据主表的自增id作为中间件(什么样的字段适合做中间件?要具备唯一性)
怎么分发?主表插入之后返回一个id,根据这个id和表的数量进行取模,余数是几就往哪张表中插入数据。
注意:子表中的id要与主表的id保持一致
以后只有插入操作会用到主表,修改,删除,读取,均不需要用到主表

PHP 结合 MySQL 千万级数据处理

redis消息队列

1,什么是消息队列?
消息传播过程中保存消息的容器
2,消息队列产生的历史原因

PHP 结合 MySQL 千万级数据处理

消息队列的特点:先进先出
把要执行的sql语句先保存在消息队列中,然后依次按照顺利异步插入的数据库中
应用:新浪,把瞬间的评论先放入消息队列,然后通过定时任务把消息队列里面的sql语句依次插入到数据库中

修改

操作子表进行修改

PHP 结合 MySQL 千万级数据处理

这样修改有一个问题,主表和子表的数据会出现不一致,如何让主表和字表数据一致?

redis队列保持主表子表数据一致

修改完成后将要修改主表的数据,存入redis队列中

PHP 结合 MySQL 千万级数据处理

然后linux定时任务(contble)循环执行redis队列中的sql语句,同步更新主表的内容

PHP 结合 MySQL 千万级数据处理

mysql分布式之分表(查,删)

查询只需要查询子表,不要查询总表

PHP 结合 MySQL 千万级数据处理

删除,先根据id找到要删除的子表,然后删除,然后往消息队列中压入一条删除总表数据的sql语句
然后执行定时任务删除总表数据

PHP 结合 MySQL 千万级数据处理

定时任务:

PHP 结合 MySQL 千万级数据处理

mysql分布式之分库

分库思路

PHP 结合 MySQL 千万级数据处理

分库原理图:

PHP 结合 MySQL 千万级数据处理

PHP 结合 MySQL 千万级数据处理

mysql分布式之分库(增)

PHP 结合 MySQL 千万级数据处理
注意:操作完一个数据库一定要把数据库连接关闭,不然mysql会以为一直连接的同一个数据库

还是取模确定加载哪个配置文件连接哪个数据库

PHP 结合 MySQL 千万级数据处理

mysql分布式之分库(改)

原理同新增

PHP 结合 MySQL 千万级数据处理

mysql分布式之分库(查,删)

原理类似

PHP 结合 MySQL 千万级数据处理
删除

PHP 结合 MySQL 千万级数据处理
执行队列

mysql分布式之缓存(memcache)的应用

将数据放入缓存中,节省数据库开销,先去缓存中查,如果有直接取出,如果没有,去数据库查,然后存入缓存中

PHP 结合 MySQL 千万级数据处理

在编辑信息之后需要删除缓存,不然一直读取的是缓存的数据而不是修改过的数据

PHP 结合 MySQL 千万级数据处理

php
本作品采用《CC 协议》,转载必须注明作者和本文链接
本帖由系统于 4个月前 自动加精
讨论数量: 4

看完文章感觉受益匪浅,有几个问题想要求教。

  1. 感觉主表仅仅是生成主键id的作用,查改删都在各分表,那么删改是否仅操作分表就可以?
  2. sql语句通过redis队列插入的话,会有延迟吧?用户发布的评论不会立即可见吧
  3. 这种体量的程序是不是基本上告别了ORM?
  4. 开头有点混乱,到底是按取模的值解决去哪个表还是按地区?
4个月前 评论
全网第一菜鸡 (楼主) 4个月前
Mr-houzi (作者) 4个月前

分表的情况下,对于分页列表,多字段筛选这种场景该怎么处理?

4个月前 评论
893355320 2周前

如果后台操作需要查询所有用户然后分页的时候,怎么操作。使用es么

4个月前 评论

@fenglin 同问,怎么分好解决,到时候统计就不好统计了直接用mysql 自带的分表就可以解决了

2周前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!