生产服务器 PHP-FPM 响应慢

问答 / 1191 / 31 / 创建于 3年前 / 更新于 3年前

服务器配置

64 G 内存
12 CPU

运行环境

使用的 ansible 搭建的 docker swarm 集群，目前是单服务器，因为出了问题。一直找不到原因。所以其他节点没有搭建。

出现的问题

php-fpm 响应很慢。发几个图就能很明显的看到。

prometheus 监控的服务器信息

生产服务器 PHP-FPM 响应慢

可以看到，负载不是很高。

prometheus 监控的 php-fpm 信息

生产服务器 PHP-FPM 响应慢
可以看到，有大量的响应是几百毫秒和超过 1 秒的。

低流量的时候，响应是很快的。基本在 30 ms 左右。如下图：

生产服务器 PHP-FPM 响应慢

kibana 查看的 nginx 日志信息

生产服务器 PHP-FPM 响应慢
在这里可以看到，upstream_connect_time 居然花费了 1s 多，找不到原因。

php-fpm 配置：

user = www-data
group = www-data
listen = 0.0.0.0:9000
pm = static
pm.max_children = 50
pm.start_servers = 15
pm.min_spare_servers = 10
pm.max_spare_servers = 20
pm.max_requests = 1000
request_slowlog_timeout = 0

pm.status_path = /status
ping.path = /ping

原来使用的是 dynamic 模式，响应慢，所以我换成了 static ，还是很慢。

sql 语句记录了慢日志，没有慢的 sql 语句。

我应该如何排查这个问题呢？主要是没有思路。请大牛们给一个思路啊？

服务器 php-fpm

当才华还支持不起理想时，就应该静下心来好好学习了。

qiuyuhome

课程读者 96 声望

PHP主管 @ 北京众晶锐驰科技有限公司

技术宅男

4 人点赞

我们将带你从零开发一个项目并部署到线上，本课程教授 Web 开发中专业、实用的技能，如 Git 工作流、Laravel Mix 前端工作流等。

你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程，JWT 概念及使用和 API 开发相关的进阶知识。

推荐文章：

更多推荐...

博客

PHP Annotated——2023 年 12 月 25 / 2 |

分享创造

借着Laracon的热潮，在这里留个static-php-cli的分享！ 19 / 19 |

博客

失业两个月找存在感系列——几行代码轻松实现laravel链式追踪，一分钟快速排查系统问题 23 / 19 |

工作

[求职] 陈大剩的个人简历 15 / 22 |

博客

🎈 Slow Admin - 使用Laravel和Amis快速构建你的后台 31 / 40 |

博客

Go实现支持多种协议的抓包工具——Shermie-Proxy 27 / 38 |

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

最佳答案

上午找技术老大看了一下，他分析说是 swarm 网络的问题。让我去查查。

overlay 性能问题

这个人遇到的情况，和我一样。nginx 连接 php-fpm，光是连接就花费了 1s 多。在我发的第 3 个图中可以看到。upstream_connect_time。

swarm:Very poor performance for ingress network with lots of parallel requests

这个文章，有人做了大量测试。说的就是这样的问题。

3年前评论

讨论数量: 31

忆往昔弹指间

614 声望

我就不明白你，服务器有这配置，你给我整这么点？直接调大点，按这个搞试下先：

pm = static
pm.max_children = 400
pm.start_servers = 210
pm.min_spare_servers = 20
pm.max_spare_servers = 400
pm.max_requests = 1000

另外，可以开一下慢请求日志，分析下原因（路径写自己的，别光知道抄）：

request_slowlog_timeout = 15s
slowlog = /php/slow.log

3年前评论

leo

FPM 慢请求好评

忆往昔弹指间（作者）

@cvoid 你说这句话呢，就是在侮辱CPU和操作系统，这么的，你随便打开个正常的生产linux服务器，里面跑的进程，有低于cpu * 10个数的，算我输

lidongyoo

终于有一个答对点了~，楼上一顿猛分析，一看配置才50我裂开了呀

cvoid

超过CPU个数的进程不是平白无故增加进程上下文切换么

L学习不停

@cvoid 进程数少于CPU个数也会有上下文切换。很多文章说不是进程越多越快，这句话要结合当下场景来看。就比如现在这个场景，max_children设置50就是瓶颈，需要提高子进程数量。

crackfan

@lidongyoo 基础配置异常怨谁？这些作为开发者默认都是最优！

忆往昔弹指间（作者）

@crackfan 我是这样认为的，如果你是一个中、高级运维，那么你对不起这份工资。如果你是初、中级PHP开发，还算正常，如果你是一个高级PHP开发，那么也对不起这份工资。

crackfan

@忆往昔弹指间笑死了哈哈哈~~~你是我老板？

忆往昔弹指间（作者）

@crackfan 不是说我是你老板，而是我觉得，如果是一个高级开发，环境配置的合理调优，应该是接触过的了。而如果是一个系统架构的调优，那高级开发不会也正常。

crackfan

@忆往昔弹指间你一定是你老板的香饽饽我能力有限只能做到尽量不给别人制造麻烦 o(￣︶￣)o

cvoid

@L学习不停我知道进程数少于CPU个数也会有上下文切换。我的观点是他的机子就12核只能同时处理12个进程。单接口30ms就返回I/O不可能重的。这种情况高流量我觉得CPU已经开始跑满了如果再加进程数只会因为进程太多开始频繁切换进程导致接口更慢。我也不知道对不对我等下拿自己2核4G的电脑压测一下

no_sign

进程少并不是导致慢的原因，因为ng把请求丢给php，如果php没有进程可以使用会报502，所以请求是到达不了php，也就不会是因为进程少而导致慢

no_sign

建议在代码里面做好日志处理，通过分析日志到底是哪里慢了

tu6ge-php

Laravel 8.x 译者 503 声望

需要分析一下php的代码了

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

@tu6ge-php 代码我可以保证没问题。目前的状况是，流量稍微大一点，就响应慢了，平时 php-fpm 的响应基本在 30 ms 左右。

file

3年前评论

crackfan

8 声望

首先排查sql（大概率）
其次要找到耗时php文件

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

@crackfan 低流量的时候，30 ms 左右的响应。

file

3年前评论

whcoding

125 声望

查一下 php mysql 慢查询

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

@whcoding 已经查过了，没有慢 sql 语句。因为是用 docker 部署的。php-fpm 慢查询需要 docker api 版本 1.4.1 以上，所以我使用不了。不能设置 php-fpm 慢日志。

3年前评论

putyy

136 声望

opcache开没？

3年前评论

putyy

136 声望

服务器居然买这么大....

3年前评论

忆往昔弹指间

614 声望

我就不明白你，服务器有这配置，你给我整这么点？直接调大点，按这个搞试下先：

pm = static
pm.max_children = 400
pm.start_servers = 210
pm.min_spare_servers = 20
pm.max_spare_servers = 400
pm.max_requests = 1000

另外，可以开一下慢请求日志，分析下原因（路径写自己的，别光知道抄）：

request_slowlog_timeout = 15s
slowlog = /php/slow.log

3年前评论

leo

FPM 慢请求好评

忆往昔弹指间（作者）

@cvoid 你说这句话呢，就是在侮辱CPU和操作系统，这么的，你随便打开个正常的生产linux服务器，里面跑的进程，有低于cpu * 10个数的，算我输

lidongyoo

终于有一个答对点了~，楼上一顿猛分析，一看配置才50我裂开了呀

cvoid

超过CPU个数的进程不是平白无故增加进程上下文切换么

L学习不停

crackfan

@lidongyoo 基础配置异常怨谁？这些作为开发者默认都是最优！

忆往昔弹指间（作者）

crackfan

@忆往昔弹指间笑死了哈哈哈~~~你是我老板？

忆往昔弹指间（作者）

crackfan

@忆往昔弹指间你一定是你老板的香饽饽我能力有限只能做到尽量不给别人制造麻烦 o(￣︶￣)o

cvoid

no_sign

进程少并不是导致慢的原因，因为ng把请求丢给php，如果php没有进程可以使用会报502，所以请求是到达不了php，也就不会是因为进程少而导致慢

no_sign

建议在代码里面做好日志处理，通过分析日志到底是哪里慢了

crackfan

8 声望

几百请求这样呵呵，感觉和配置关系不大还是代码哪里有优化的空间！

3年前评论

crackfan

8 声望

@qiuyuhome 注意如果n p独立容器记得使用 share_vol

3年前评论

jiangjun

70 声望 / php开发工程师 @ 红砖工厂

pm.status_path 看一下php-fpm状态，在慢请求时，是不是所有进程都是活跃状态，来判断是不是所有进程都被占了。如果不是，再往其他方面看。

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

统一回复一下，监控状态可以看到，巅峰的 running php-fpm 进程，没有超过 40 的时候，我这个服务器还运行着其他服务，目前所有的服务都在这一个服务器上，而且是多个 php-fpm 容器，运行多个网站。

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

说开启慢日志的，我也上面也提到了，因为是 docker 部署的，慢日志需要 docker api 1.4.1 以上版本，我的目前是 1.40 的版本，如果要开慢日志，那么就得升级 docker，网站服务就都需要停一下。所以没有这么做。

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

@忆往昔弹指间已回复，上面了。

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

@putyy 开了。

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

@jiangjun 这个早就分析过了。最高的时候没超过 40 。

3年前评论

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

@忆往昔弹指间我这个配置，是根据我的实际流量配置的。而且，我开了 2 个副本，所以应该不是这个原因的。

3年前评论

cheer

课程读者 64 声望

为什么低流量时没啥问题？
是否瓶颈是在服务器带宽上？或者租赁一个相同配置的服务器，内网压测一下？

3年前评论

JimChen

课程读者 112 声望

既然你们可以买这么好的服务器，在慢日志无法开启的情况下，不如先租用一台相同配置的服务器，配置可以开启fpm慢日志的，然后通过压测还原线上情况，查看fpm慢日志情况再去进一步排查

3年前评论

陈先生

课程读者 596 声望 / 慢就业指挥官 @ 灵活就业规划中心

我没记错的话 fpm慢日志是很精准的

3年前评论

Kristiano

Laravel 8.x 译者 202 声望

我也出现过这种情况，没有SQL慢语句，FPM使用dynamic 模式后使用static（据说这个改动只是减少FPM启动新的和关闭空闲进程的消耗），程序运行好的时候平均50ms以内，慢时会出现慢日志。我分析慢日志调用栈很多时候和框架启动的初始化有关，也和I/O有关。如果有条件的话应该使用堆栈调用工具查看下具体的调用信息，不过docker集群很难追踪。

3年前评论

哓东

@Kristiano 可以用压测工具压一下看看机子负载

Kristiano （作者）

我后来的分析经验来说，我想最多的可能性是系统 I/O ，譬如 curl 调用三方应用，以及频繁开闭三方程序的连接。毕竟php是短生命周期，这个过程开销很大。

qiuyuhome

课程读者 96 声望 / PHP主管 @ 北京众晶锐驰科技有限公司

上午找技术老大看了一下，他分析说是 swarm 网络的问题。让我去查查。

overlay 性能问题

这个人遇到的情况，和我一样。nginx 连接 php-fpm，光是连接就花费了 1s 多。在我发的第 3 个图中可以看到。upstream_connect_time。

swarm:Very poor performance for ingress network with lots of parallel requests

这个文章，有人做了大量测试。说的就是这样的问题。

3年前评论

arvin-hermit

164 声望

swoole tracker 或者其他性能分析工具分析一下

3年前评论

yzbfeng

49 声望

docker部署为什么不能拿到fpm慢日志?? 目录映射不出来不就好了么

3年前评论

wdnmd

课程读者 58 声望

这个时候其实k8s的优势就出来了

3年前评论

xinhuo

课程读者 95 声望

没有慢 sql ，代码也没有问题，那就应该合理怀疑一下是 fpm 的调优了，网络问题的概率我认为反而是更低的，网络再慢也不会慢到 1s，upstream_connect_time 长更可能是没有空闲的 fpm 进程可以响应，在阻塞等待。不想调 pm.max_children 那就多开两个副本，都是值得尝试的。

3年前评论

郎中航

课程读者 187 声望

值得思考的问题

3年前评论

circle

课程读者 87 声望 / web 搬砖 @ 某公司

可以试试排除法：

用 telescope 看下是不是程序或者 SQL 的问题
如不不是，看下是不是 docker 的问题，这个就得理一下项目的整体架构，看看请求是经过了哪些地方，逐一排查

3年前评论

rovast

课程读者 218 声望 / 技术经理 @ 南京

系统可观测性能力需要进一步建设。可观测性三大支柱：Logs、Traces、Metrics。目前你的 grafana 发的时序数据、kibana 看的日志，已经进行了部分的建设。但是数据间缺乏关联度，导致问题排查的眼镜还是不够。

可以尝试引入APM系统，对系统的观测能力进一步提升，尤其是 Trace 链路的观测，观察每个 span 节点的耗时信息、操作信息

3年前评论

congcong

107 声望

你好这个监控服务看着不错，这个是咋做的？

2年前评论

qiuyuhome （楼主）

prometheus + kibana + grafana + 各种 exporter

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

96 声望

PHP主管 @ 北京众晶锐驰科技有限公司

TA 的博客

纠错改进

成为赞助商

生产服务器 PHP-FPM 响应慢

服务器配置

运行环境

出现的问题

prometheus 监控的服务器信息

prometheus 监控的 php-fpm 信息

kibana 查看的 nginx 日志信息

php-fpm 配置：

推荐文章：

高认可度评论：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

生产服务器 PHP-FPM 响应慢

服务器配置

运行环境

出现的问题

prometheus 监控的服务器信息

prometheus 监控的 php-fpm 信息

kibana 查看的 nginx 日志信息

php-fpm 配置：

推荐文章：

高认可度评论：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录