Laravel 项目深度优化过程

Double-Jin 的个人博客 / 125 / 59 / 创建于 5年前 / 更新于 4年前

简述

公司的系统是面向商户营销的CRM系统,采用的是saas模式而非独立部署，用户表200W,日活3W，日增长5000+，每天的请求量总量目前是200多W次，其中服务端的请求量主要来自前端API请求+商户ERP数据同歩+微信事件回调。以下均在抛去系统设计的问题不讨论，小公司的产品活下去才是第一要素，只能现有的情况下尽量优化，一步步摸着石头过河。

以下为2019年的方案，后续迭代暂未更新。

服务配置:

单台阿里云ECS服务器 - 12核24G （redis/nginx/php7.1/laravel5.7）
单台阿里云RDS数据库 - 2核4G (mysql)
Supervisor开多个进程跑队列任务
php的woker进程设为100个
跟据laravel优化文档做了优化https://learnku.com/articles/2020/ten-laravel-5-program-optimization-techniques
php-fpm实际并发如下（siege压测-2核4G测试环境）：
大部分简单逻辑接口并发300QPS
数据库操作多的接口并发70QPS
全查缓存接口接口并发550QPS

存在问题

当三个十万粉丝的商家同时发推文和多个商家线下门店做促销活动时，一秒点击人数过多或线下ERP消费小票、积分回传过多，服务器就会崩溃掉，服务器崩溃的时间如果超过几分钟不能响应接口，就会触发微信事件的3次重推机制和ERP回传5次重推机制，触发重推机制的情况下我们是可以关闭erp的回传，但无法停止80家商户的微信事件重推，这个时侯系统一般就会瘫痪1个多小时，瘫痪结束后又会面临数据找回的问题

一阶段方案

引入Laravel-S，利用swoole的长驻内存的机制，常驻内存后每个请求减少了一大堆的初始化开销，能一定程度的增加并发数，实测要连接数据库的接口中的并发数提升了35% ~ 50%，不连接数据库的接口中的并发数提升400% ~ 500%，整体的请求失败率大幅度降低，正式环境下每天200多W个请求整体是正常的，没有发现有内存泄漏，在整体修改不大的情况下得到这个提升是很值得满意的。在此感谢Laravel-S作者和swoole社区，以下是Laravel-S作者对数据库连接提升不大的解释

Laravel 项目深度优化过程

laravel-s文档
github.com/hhxsv5/laravel-s

在此swoole实际并发如下（siege压测-2核4G测试环境）：

大部分简单逻辑接口600QPS
数据库操作多的接口并发96QPS
全查缓存接口接口并发2000QPS

Laravel 项目深度优化过程

引入心得

任务队列和定时任务是可以直接用laravel原生的，这部份还是用php-fpm跑，不用过多改动，这样引入的过程中只用去改控制器上的业务代码，当然也可以把定时任务也写到swoole中，这样就可能得到毫秒级的定时任务。项目整体的运行模式为swoole(业务代码)+php-fpm(任务队列和定时任务)
控制器的业务逻辑中不要用$this来保存和调用变量，laravel下这一部份会被处理为单例模式的，Swoole Server下，所有单例对象会常驻于内存，这个时候单例对象的生命周期与FPM不同，单例对象依在请求结束后不会被清除，需要开发者自己维护单例的状态
认真的看文档的注意事项,文档能解决90%的问题，不能解决的加群或提issue

二阶段方案

在swoole的基础上引入负载均衡做服务器集群和分离项目内的模块（独立ERP模块、微信模块），用堆机器来提高总的并发数

负载均衡存在问题

文件如何同步 - 已解决，大部分文件已上云，小部分用nginx转发到特定服务器
日志如何收集 - 已解决，ELK日志分析系统
session、缓存如何同步 - 已解决，全局切换redis
多服务器代码同步自动更新 - 已解决，jenkins + gitee（WebHooks）

分离模块存在问题

模型、队列、事件监听器高度藕合如何分离 - 半解决，多个服务器代码相同，只是不同业务访问特定服务器

以上的问题附了代码如何自动更新外，其实都可以在项目开始前设计好，希望各位如果开新项目不妨直接考虑上负载均衡会遇到的问题，尽量文件上云，尽量不要用本地文件缓存，尽量在一开始分离模块。

后续

3台机器搭好了负载均衡，同时代码层和业务层也做了很多的优化，能加缓存接口的加缓存，能走异步的不走同步，在全解决二阶段方案现有的问题后，相信在现有的下架构是可以撑半年时间来开发业务的了。
到此，laravel的优化应该是到头了，后面就是数据库的优化、引入mq队列、引入Elasticsearch、用协程的swoole框架如hyperf、easyswoole之类的重构，这类型的框架都相对应的提供了微服务的使用。

在12月在深圳开源中国开发者大会上听了韩天峰对php的分享，也听了下午的架构专场，目前看来在对于中大型的项目上，php的生态是远远比不上java的，像Sharding-JDBC的分布式数据库、Spring Cloud的微服务实现，php在这方面上还是很初级，希望以后在面向中大型项目上的生态能更好吧，在小型项目上php已经十分优秀了。

2020年12月更新

自2019年尾完成第二阶段的改造后，2020年公司的业务量增长200%，因此2020年做了以下优化，但系统还要不断优化。

增加更多的服务器
全面使用docker
引入Elasticsearch搜索
引入阿里云polardb集群
引入阿里云日志系统
引入数据仓库
重构数据统计业务
负载均衡增加业务隔离
代码增加业务隔离

本作品采用《CC 协议》，转载必须注明作者和本文链接

未经允许禁止转载 -- 苦力小林，

本帖由 Summer 于 5年前加精

Double-Jin

318 声望

三号流水线低级开发者，苦力小林

93 人点赞

从零开发一个电商项目，功能包括电商后台、商品 & SKU 管理、购物车、订单管理、支付宝支付、微信支付、订单退款流程、优惠券等

从零开始带你一步步开发一个 Go 博客项目，让你在最短的时间内学会使用 Go 进行编码。项目结构很大程度上参考了 Laravel。

推荐文章：

更多推荐...

博客

Laravel-Admin 项目重生，我 fork 了原项目继续维护！ 22 / 34 |

分享创造

价值千万的诊所saas项目正式开源 14 / 26 |

分享创造

无需修改任何代码和扩展将你的Laravel项目性能提高20倍 104 / 101 |

工作

[求职]在郑州工作4年的程序媛的简历优化 15 / 184 |

博客

Deployer 使用攻略（真好，PHP相关项目都可以，例如 ThinkPHP） 29 / 5 |

面试 POPER 的后端开发工程师的离奇经历 40 / 105 |

讨论数量: 59

menzhu

课程读者 11 声望

代码部署方案应该很多吧，自己可以搭建jenkins，syncd或者用云服务商的持续集成，但是原理都是差不多的；日志我们使用的自建ELK，也可以使用阿里云的日志服务，挺方便的

5年前评论

oidns

@Double-Jin 瓦力可以了解一下，易用性比 jenkins 好

Double-Jin （楼主）

目前想到的就先用jenkins搭好自动更新先，不过看到很多人是jenkins+docker一起用的

好人二狗

课程读者 22 声望 / PHP @ 不可描述

超链貌似有问题

5年前评论

Double-Jin （楼主）

已修复，多谢提醒

largezhou

课程读者 682 声望 / Ctrl+CV工 @ LZzzz

多机部署，简单的话，好像有个叫 deployer 的 php 插件，部署都不用进远程

5年前评论

Double-Jin （楼主）

发现新大陆了，我去找下文章看看

jamesZhao

见习助教 20 声望

Supervisor 跑着正常吗？我用着总是死表，不知道怎么解决

5年前评论

Double-Jin （楼主）

死表跟Supervisor有什么关系？Supervisor只是监听进程的呀

jamesZhao （作者）

@Double-Jin 迷茫，重启又可以啊

_null_

相同的进程启了多个吧

三石寰宇

队列用redis，不要用mysql，mysql很容易锁表

Tsukasa_Kanzaki

113 声望

General error: 2006 MySQL server has gone away 错误有可能是MySQL服务端超时主动关闭长连接导致的，可以往这个方向排查

5年前评论

00x00

95 声望

12 核 24G建议换成多台4核4G试试

5年前评论

chigua

4 声望

你用laravel-s是不是没打开Mysql长连接选项

5年前评论

Double-Jin （楼主）

打开了的，问了下作者也没如果

Caral

课程读者 54 声望

General error: 2006 MySQL server has gone away 貌似是mysql没有断线重连，常驻进程的都有这个毛病好像
搞个断线重连机制

5年前评论

Double-Jin （楼主）

有案例能参考下吗，兄弟

lidongyoo

@Double-Jin 可以参考一下这个包 workerman/mysql

jxlwqq

课程读者 412 声望

可以直接上阿里云的kubernetes (serverless) 服务

5年前评论

阿超

26 声望

不要单机部署，你可以考虑 2核4G作为主机，前面套一程负载均衡。你的12核24G可以分成6台ECS，然后给这6台分组，每组3台。负载均衡中的7层负载中吧特定的URL导向A组，其他导向B组。然后弹性伸缩1台。这一台备用，也是母鸡，用来操作和更新软件，更新完打包成ecs镜像，然后滚动升级替换到其他的ECS。这样你特定的功能即使由于性能全部导向A组ECS，相当于你B组来负载核心业务，至少不让他挂了。

5年前评论

Double-Jin （楼主）

现在正在往那个方向走了，就差自动更新这一步

terranc

@Double-Jin 直接阿里云k8s + 云效就解决了横向水平自动扩展和发布部署的问题

terranc

想问所说的根据url导向不同的组是在哪配置的？没懂7层负载是在哪里，求解

Double-Jin （楼主）

@terranc 比如有5台服务器，那在生成图片的时侯我们可以调用A服务器来生成图片，这样图片就会存在A服务器里，在访问图片的时候在nginx端可以写一些跳转把访问图片的URL指定访问A服务器，这样就可以解决了。7层负载是什么东西？？？

terranc

@Double-Jin 额。。。其实我是针对楼主的。 @方圆百里找对手

阿超（作者）

@terranc 七层负载均衡可以让你指定一些Url被转发到后端特定的服务器

ma1232006

是的，这才是降低成本的最好办法

johnlui

326 声望

优秀的文章。

Redis 可以把很多接口缓存化，ElasticSearch 可以大幅提高搜索速度：例如某商品的关联商品。

架构上还是尽量单机，可以先尝试对 web server 和数据库提高配置，能解决大部分性能问题。负载均衡是会让不可用时间上升一个数量级的，能不用就不用，300W 这个量级还行，用好缓存的话单机没问题的。

5年前评论

Double-Jin （楼主）

现在也只是不断加机器来偷时间，奈何老板生意好，时间都去了写业务上，不能重构，技术的无奈

Leesinyii

看见大佬了，之前就是看着大佬的，composer 搭建框架入门的，哈哈，看到这个头像就好熟悉，不知道是一个人吗

梧桐树下

70 声望

牛逼呀，非常羡慕业务这么大的公司 :+1:现在我工作这里还没这个量呢

5年前评论

dongjw321

51 声望

不要单机，单机风险太大，如果出问题，全挂了。
异步处理，一些逻辑或是数据统计，放到一个异步队列里面。
微信本来就是异步的过程，把回调放到一个队列里，用固定的进程数去跑这个队列，减少同时并发对数据库的压力

5年前评论

Double-Jin （楼主）

1、2都做了，不过微信的回调再放异步也会有不好的问题，就是要是在队列中出了问题数据就补不回来了

dongjw321 （作者）

@Double-Jin 做好日志记录，不会有事的，而且微信本来还有主动接口，所以还可以手动容错。因为回调是同时的，这时候如果不限制对数据库的并发，很容易挂的

Double-Jin （楼主）

这个思路不错，不过要写多一部分主动调用报错的接口

johnlui

单机才是风险最小的，真有问题，无论是压力过大还是代码 bug，多台机器的不可用时间要高一个数量级。

dongjw321 （作者）

@johnlui 你是希望挂了，3W个用户都不能用，还是希望挂了一台，只有3000用户受影响。另外，如果用户爆发增长，单机怎么弄？当然如果是小网站，可以MYSQL,PHP,REDIS,ES统统部署在一台，没啥问题

johnlui

@dongjw321 你遇到过只挂一台机器导致部分用户不能使用的情况？切莫纸上谈兵，我正维护者几台单机组成的日 PV 200 万的系统。

johnlui

@dongjw321 我再详细说一下：所谓的只挂一台机器导致系统部分失效是极少出现的情况，绝大部分人都遇不到，而导致系统失效最常见的两大原因：代码 bug，访问量突然增加，这两种情况都是所有机器一起挂。多台机器确实有价值，在流量快速增长的情况下有价值，可以快速应对，保证服务质量。但它的代价就是不可用时间增加一个数量级。

dongjw321 （作者）

@johnlui PV200万，按高峰时间段每秒差不多100~200请求，这个数量级怎么弄都行。另外你见过因为市政把机房光纤挖断，然后运维总监被撤职的不？我见过。任何意外都有可能，你的系统越大你要考虑的极端情况就越多。不然真出问题，就很被动

已下线

Laravel 8.x 译者 601 声望 / CTO @ yunji

认真看了下文章，很赞哦。

貌似之前有差不多的业务场景，对于多机部署，当时使用的是gitlab+Jenkins，不过这个方案感觉并不是特别好，看文章的同时，有个不成熟的想法，因为是多机器，更新严格意义来说必然有先后，假如n台机器，是否可以流量切到n2/3,更新n/3机器，然后依次切换知道n都完成。
另外，数据同步当时用的是canal（监听binlog）+mq。
最后，看到提到的很多优化，那么数据库设计这一块是不是也能去尝试做一些优化，水平拆分，垂直拆分。还有引入连接池。

5年前评论

Double-Jin （楼主）

因为公司没有专业的运维，所以在选择一些服务时会优先选一些后端能维护的才选了gitlab+Jenkins，其实我是想用docker的

llocry00

课程读者 0 声望

楼主，有没有你公司的资料可以了解下阿 :blush:

5年前评论

Double-Jin （楼主）

年后的招人已经够了哟

llocry00 （作者）

@Double-Jin 不是应聘，是想了解下你们的产品，嘻嘻

Double-Jin （楼主）

@llocry00 有几百个商户的saas平台

小手冰凉

见习助教 54 声望

对国内CRM这块还挺感兴趣的，作者可以多普及下这方面的内容。

5年前评论

Double-Jin （楼主）

这就是公司业务的东西了，还是多分享下技术好一点

Double-Jin

318 声望

2020 年 12 月更新内容

4年前评论

小小海

课程读者 11 声望

最后随着业务发展越来越大。。。。就会变成java的生态了 :joy:

4年前评论

Double-Jin （楼主）

越大的系统越会要求隔离性的粒度，所以微服务一样是大系统在当前技术下的方向，但微服务会增加很多运维跟开发成本，很难两全的

air93610

前公司，微服务开发了一年多。后面流产了。。。。。别问我细节，当时我负责的是py，和研发不是一个团队

porygonCN

Laravel 8.x 译者 180 声望 / 后端开发 @ 新明辉

优化的链接有问题还是会跳转到本文章直接复制倒是可以博客：十个 Laravel 5 程序优化技巧

4年前评论

kabunx

Laravel 8.x 译者 65 声望

有个问题想请教下，多机的队列消费你们是怎么处理，如果存在多机队列是否会存在重复消费的问题，目前我用的是horizon，没有看过源码，是否可以分享下

4年前评论

Double-Jin （楼主）

在laravel里的任务队列里对分布式是没什么支持的，如果真的要做多机队列消费，只能固定每一台机器消费的队列名是唯一的即可，不懂可能就要私聊跟你说一下了

臭鼬

见习助教 185 声望

相当实在的帖子

3年前评论

air93610

3 声望

非常赞的帖子。解决了我关于负载均衡中的很多疑问。

3年前评论

程序小工

课程读者 21 声望

swoole常驻内存不能用单例, 那你们service里面怎么调用, new service 吗

2年前评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

Laravel 项目深度优化过程

简述

服务配置:

php-fpm实际并发如下（siege压测-2核4G测试环境）：

存在问题

一阶段方案

在此swoole实际并发如下（siege压测-2核4G测试环境）：

引入心得

二阶段方案

负载均衡存在问题

分离模块存在问题

后续

2020年12月更新

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

Laravel 项目深度优化过程

简述

服务配置:

php-fpm实际并发如下（siege压测-2核4G测试环境 ）：

存在问题

一阶段方案

在此swoole实际并发如下（siege压测-2核4G测试环境）：

引入心得

二阶段方案

负载均衡存在问题

分离模块存在问题

后续

2020年12月更新

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录

php-fpm实际并发如下（siege压测-2核4G测试环境）：