服务器做了两个优化 CPU 使用率减低 40%

Summer 的个人博客 / 30 / 62 / 创建于 7年前 / 更新于 7年前

1. 问题描述

大家应该注意到了最近社区访问速度有点慢，一直以为是家里 wifi 不给力覆盖范围不够，直到 @leo 喊我说服务器太慢，CPU 爆了：

file

上 UCloud 后台看数据比较直观：

file

CPU 使用率居高不下，有时候还伴随着 MySQL 爆掉的情况，如下图。当这种情况发生时，你就会发现网页请求卡住不动：

file

经过一番调查，定位到两个问题，下面分别讲解各自的解决方案。

问题一：话题显示时实时更新查看数

file

每次页面的查看，都要触发一次数据库 UPDATE 操作，当社区帖子 PV 很高时候，瓶颈就会很明显。

解决方案

核心思路是尽量少碰到数据库，利用较快的记录器来做记录。这里选择使用 Redis 的 Hash 数据类型来存储。Redis 运行在内存中，效率将会非常高。

实现逻辑：

按照日期分开存储 view_count 到 Redis 里，按日期命名 Hash，如：laravelchina:counter_cache_2018-06-17;
字段名按照命名规则 数据表_字段名_ID，如话题表里 ID 为 1 的 view_count 字段 —— topics_view_count_1 ；
设置计划任务每天凌晨将昨天的 Hash 同步到 DB 中，并删除；

问题二：未读消息 Ajax 请求太频繁

file

登录用户情况下，每一个浏览器打开的社区页面，每过 15 秒钟就会发送一次未读消息的 Ajax 请求，像我查阅资料时，很多时候会同时打开几十个页面：

file

上图这种情况每 15 秒钟就会给服务器发送几十个请求… 看着自己写的 Bug，无奈感叹：

file

解决方案

核心思路是不论浏览器打开了多少窗口，浏览器内的所有窗口在单位时间内（15 秒），只能发送一个请求。怎么做到呢？利用现代浏览器内置的 localStorage 功能可以很容易实现：

JS 端使用 localStorage 在请求成功后记录 notification_requested_at 的值为 Date.now()；
在每一次请求发送前，拿当前时间 Date.now() 减去 notification_requested_at 时间；
如果大于 15 秒，就发送请求；
否则放弃请求，直接读取 localStorage 里的 notification_count；
请求成功后将获取到未读消息数存入 localStorage 键为 notification_count ；
每次刷新页面，JS 初始化时未读消息数存入 localStorage 键为 notification_count 。

有同学在问为啥不使用长链接，首先这里要求的实时性不需要那么高，其次，我有意保持程序架构的简单，Keep it simple and stupid ，越简单越方便维护，够用就行。

优化结果

file

看来又可以延迟升级服务器配置的时间了。性能优化的路漫漫，准备找个时间好好优化下社区程序，顺便看看能不能输出一些优化日记。听说 PHP 7.2 性能要好个 10%，现在也趋于稳定，有在考虑升级下 PHP 版本。

最后问大家一个问题：你写过最愚蠢的 Bug 是啥，分享下哈？

本作品采用《CC 协议》，转载必须注明作者和本文链接

摈弃世俗浮躁，追求技术精湛

本帖由系统于 7年前自动加精

Summer

站长 11.3k 声望

维护者 @ LearnKu.com

保持好奇，求知若饥，终身编程

311 人点赞

你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程，JWT 概念及使用和 API 开发相关的进阶知识。

以构建论坛项目 LaraBBS 为线索，展开对 Laravel 框架的全面学习。应用程序架构思路贴近 Laravel 框架的设计哲学。

推荐文章：

更多推荐...

博客

做了一个独立开发者社区，期待大家一起交流 11 / 73 |

博客

用 Laravel12 Startkit 做了一个 composer 私有包托管平台 😂 点赞超过 20 个开源，看看需要的人多不多 28 / 19 |

博客

冯老师的困惑 —— 一个跑了两年的 BUG 21 / 17 |

工作

[求职]在郑州工作4年的程序媛的简历优化 15 / 184 |

博客

学两个月前端后做了个这样的网站 10 / 17 |

目前4个月减重44.6斤，给大家分享一下，感觉整个人精神面貌好了不少~ 15 / 61 |

讨论数量: 62

月光

课程读者 232 声望 / PHP @ 一定要自由

好，服务器就是你弄爆的，开那么多页面 :smirk:

7年前评论

anniversary

Laravel 6.0 译者 45 声望

站长何不开个踩坑板块，大家都来发这类的文章。

7年前评论

小小海

课程读者 11 声望

:+1:希望多发一些这样的文章哦嘿嘿，非常不错，谢谢老大

7年前评论

gitxuzan

48 声望 / go @ 阿里巴巴

厉害

7年前评论

农村闲散劳动力

130 声望 / 搬码工 @ 搬码公司

:joy: :joy: :joy: :joy: :joy:

7年前评论

MushishiXian

课程读者 26 声望 / 程序员 @ null

学习了

7年前评论

月光

课程读者 232 声望 / PHP @ 一定要自由

好，服务器就是你弄爆的，开那么多页面 :smirk:

7年前评论

iwzh

Laravel 9.x 译者 140 声望

我也开了好几个页面查资料

7年前评论

JaguarJack

Laravel 9.x 译者 964 声望 / 开发 @ 家里蹲开发公司

的确感觉比之前流畅了

7年前评论

Musk·C·Ace

课程读者 211 声望

mark

7年前评论

Zealot

课程读者 10 声望

自从进了社区再也出不去了，全是干货。

7年前评论

侧面

课程读者 10 声望

是一个解决办法的思路，但是感觉还有更好的思路

7年前评论

rlyabc

课程读者 23 声望

希望有一套教程专门讲这种的

7年前评论

nff93

课程读者 157 声望 / 搬砖工 @ 工地

获取未读消息这个，要是前端有一个统一的锁就好了~

7年前评论

captain2021

Laravel 5.8 译者 422 声望 / 开发 @ 谈笑风生

这个很稳

7年前评论

DianWang

课程读者 333 声望 / 磁盘清理大师 @ 广州造轮子科技

这种问题在测试阶段不能用ab提前发现吗？

7年前评论

Sinchie

34 声望

@DianWang ab的时候你会发现 c10的时候一般双核服务器的负载就满了。。。

7年前评论

rswordx

课程读者 0 声望

用户在增长，服务器需要自动预警。我们游戏服务器解决方案是：守护进程分析日志，来达到实时预警（当然主要是分析用户的短期异常输入），当然服务器运行状态预警其实也很方便做（一般都是运维来解决，研发不用动手） :stuck_out_tongue_closed_eyes:。

7年前评论

Sinchie

34 声望

这是一台4核心的机器吗？我看第一张top图负载一直在5。
我在4核的云主机上压测laravel空框架，关闭session中间件，开启opcache。在c100的时候负载就18了，太吓人了。
负载4的时候cpu应该全都是100%满负荷运行。
站长有试过c多少的时候负载到4吗？

7年前评论

circle

课程读者 87 声望 / web 搬砖 @ 某公司

我最愚蠢的 bug：在 php 一个进程内，往数据库插入一条记录后随即根据 id 读取该记录发现返回为空。当初排查起来又是捕获请求，又是各种日志查看，结果最后找到原因后真的是想把自己打一顿?

7年前评论

babyObama

这样读取不出来吗？

GanymedeNil

课程读者 94 声望 / 研发工程师 @ 好未来

:joy: 阅读量这类数据不是一般都直接进radis吗

7年前评论

风中的白鸽

157 声望

消息提醒这个为什么不用长连接嘞

7年前评论

Summer

站长 11.3k 声望 / 维护者 @ LearnKu.com

@风中的白鸽就是为了保持程序架构简单，部署省事，并且这个场景中实时性要求不强。

7年前评论

Summer

站长 11.3k 声望 / 维护者 @ LearnKu.com

@canyuexiang 好久以前开发的，为了省事直接更新数据库

7年前评论

xuanjiang

94 声望

4核才并发100吗，

7年前评论

joylee109

课程读者 24 声望

社区的notification是通过发送ajax来获取的。为什么不用workerman或者swoolen从服务端推送呀。

7年前评论

W-W

课程读者 250 声望

现在的查看数还是实时更新的啊，刷新一下就能开到变化

7年前评论

W-W

课程读者 250 声望

@joylee109 Keep it simple and stupid

7年前评论

anniversary

Laravel 6.0 译者 45 声望

站长何不开个踩坑板块，大家都来发这类的文章。

7年前评论

chaofei

课程读者 50 声望

@Kevinvinvin 应该是查询数据库的值和 redis 当天值求和

7年前评论

W-W

课程读者 250 声望

@chaofei 我才也是:laughing:

7年前评论

Summer

站长 11.3k 声望 / 维护者 @ LearnKu.com

@chaofei
@Kevinvinvin 不碰数据库哈，直接更新 Redis 里的，因为是内存存储，性能要好太多了。每天凌晨再同步 Redis 到数据库里，因为要保持数据一致性。

7年前评论

阿四大四大

0 声望

多发些实用的

7年前评论

blankqwq

课程读者 92 声望 / 大学生 @ 某学校

学到了，hhh

7年前评论

justJoe

1 声望

很实用啊，刚好项目也存在这样的问题

7年前评论

chongyi

VIP 411 声望 / CTO @ 创链(广州)

我想起之前我们那个程序并发上万时，做了很多优化包括你这些，100 台顶配服务器都扛不住的恐惧。。。

7年前评论

Summer

站长 11.3k 声望 / 维护者 @ LearnKu.com

@chongyi 找个时间分享下哈

7年前评论

chongyi

VIP 411 声望 / CTO @ 创链(广州)

@Summer 好啊 :smile:

7年前评论

Aliliin

课程读者 525 声望 / Phper @ 转 Goer

经常犯的错误，每次写SQL关联查询的时候，条件没传，也硬要关联查询一次，而不写判断条件。

7年前评论

ikin

4 声望

我们做股票行情的更是，没上长连接之前，每5秒定时请求把服务器刷爆😂

7年前评论

侧面

课程读者 10 声望

哈哈，当初我做一个项目的时候辛亏讨论的人数较多，以上几点都说到了。

7年前评论

狼骑

3 声望

@Summer 大佬，特想知道本文中的【定位】这一步是怎么做的，论坛有教程吗？

7年前评论

狼骑

3 声望

@Summer 大佬，特想知道本文中的【定位】这一步是怎么做的，论坛有教程吗？

7年前评论

波波你行

22 声望

支持大佬，支持你

7年前评论

luckwang

课程读者 10 声望 / 扫地僧 @ 大理寺

想知道是怎么定位到这两个问题的

7年前评论

依剑听雨

286 声望

@chongyi 那种就只能上 swoole golang node.js 这些，异步非阻塞，常驻内存，数据库连接池。

7年前评论

chongyi

VIP 411 声望 / CTO @ 创链(广州)

@依剑听雨改用 Rust 了

7年前评论

seth-shi

847 声望

JS 端使用 localStorage 在请求成功后记录 notification_requested_at 的值为 Date.now()；
其实在请求前就更新这个值更好？

// 定时请求 message 方法
function message()
{
    if (没到时间) {
        // 把 localStorage 的值显示到页面
        return false;
    }
    // 更新当前 localStorage 的请求时间
    // ajax 请求
}

如果是先ajax请求，如果需要请求消息总数的那个页面稍慢一点，其他页面还是可以趁机去请求接口。

6年前评论

小苏小苏

见习助教 2 声望

@侧面有更好的办法可以分享出来~

6年前评论

小苏小苏

见习助教 2 声望

@狼骑同求！

6年前评论

xiaoxianlg

课程读者 4 声望

经常做开发这些都容易遇到呢。

6年前评论

小苏小苏

见习助教 2 声望

@侧面不要感觉，举出栗子来

6年前评论

yadgen

0 声望

哈哈，按照这个配置又可以好好的装逼了。

6年前评论

happywho250

课程读者 23 声望

我遇到的排查很久的bug，但是并不愚蠢，因为项目需求用了rabbitmq,用workerman做的,因为有和其他公司的rabbitmq服务建立长连接，为了避免连接断掉，执行了定时检查连接状态进行重连，但是重点在下面，大家看代码

   public static function getInsChannel(AMQPStreamConnection $rabconn)
    {
        if (empty(self::$channel)) {
            self::$channel = $rabconn->channel();
        }
        return self::$channel;
    }

这样处理在连接断掉时，就会出现问题，获取到的channel是旧连接拿到的channel，而那个连接实际已经断掉了，最后我是将这块代码抽出来，在检测到断掉且执行重连前将其销毁，最后问题解决。

6年前评论

aodaobi

课程读者 44 声望 / php菜鸟 @ 擼代碼的地里人

@ikin 我们也差不多行业，不过这一块我是使用websocket+mongodb

6年前评论

ikin

mongodb 自己建的还是云？自己建的也是蛋疼

Clear_cold_air

0 声望

学习了

6年前评论

miaotiao

课程读者 61 声望

献上我的膝盖，请收好~

6年前评论

小李世界

Laravel 8.x 译者 2.0k 声望 / Doge 先锋 @ dogeow.com

最蠢的应该是死循环吧，然后服务器远程不了，只能重启。

5年前评论

Coolest

哈哈哈哈

hesper

5 声望

哈哈同习惯开几十个页面

5年前评论

老年人

31 声望

哈哈哈，学到了

1年前评论

未进化的类人猿

课程读者 52 声望 / 后端工程师 @ Jsanity,Inc

再看当年你踩得坑

3个月前评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

服务器做了两个优化 CPU 使用率减低 40%

1. 问题描述

问题一：话题显示时实时更新查看数

问题二：未读消息 Ajax 请求太频繁

优化结果

推荐文章：

高认可度评论：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

服务器做了两个优化 CPU 使用率减低 40%

1. 问题描述

问题一：话题显示时实时更新查看数

问题二：未读消息 Ajax 请求太频繁

优化结果

推荐文章：

高认可度评论：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录