服务器崩溃、远程无法访问、阿里云诊断提示IO延迟过长，导致读写受限

问答 / 3 / 9 / 创建于 2年前 / 更新于 2年前

服务器监控情况
在晚上4点左右突然疯狂读取硬盘，一直持续
Laravel

阿里云诊断提示

当前实例的云盘在2023年11月28日 11:13:00出现读写IO延迟过长，或达到了该云盘类型的IOPS上限，导致实例云盘读写受限。

请教下如何排查，急！！

补充：
查了系统的日志 /var/log/message
发现在触发读盘时候有内存oom的信息，内存不足了，估计是内存一直保持满负荷，一跑任务就触发oom，系统读取硬盘保存现场，导致读取量暴增，超出阿里云的io限制，然后就蹦了。

这种推理有没有可能？

redfish

Laravel 12.x 译者 29 声望

暂无个人描述~

0 人点赞

我们将带你从零开发一个项目并部署到线上，本课程教授 Web 开发中专业、实用的技能，如 Git 工作流、Laravel Mix 前端工作流等。

从零开发一个电商项目，功能包括电商后台、商品 & SKU 管理、购物车、订单管理、支付宝支付、微信支付、订单退款流程、优惠券等

推荐文章：

更多推荐...

博客

Laravel-Admin 项目重生，我 fork 了原项目继续维护！ 23 / 36 |

博客

冯老师的困惑 —— 一个跑了两年的 BUG 22 / 18 |

分享创造

无需修改任何代码和扩展将你的Laravel项目性能提高20倍 104 / 101 |

分享创造

部署 Laravel 到 BT 宝塔面板，并集成阿里云 Codeup 自动部署 13 / 12 |

博客

[网安]二：记录一下，服务器又又被黑的一次。 34 / 33 |

面试 POPER 的后端开发工程师的离奇经历 40 / 105 |

讨论数量: 9

Tacks

课程读者 507 声望

磁盘 IO 密集，但是网络带宽没有明显上涨，感觉像是服务器定时任务操作之类的写磁盘，或者数据处理任务之类的。

因为执行大量的IO密集型操作，例如数据导入导出、大规模计算任务、大量的文件读写、数据库查询等，都可能导致磁盘的BPS和IOPS指标上涨。
还是结合项目，项目日志，或者其他什么日志，看一下是否半夜四点触发了什么定时任务。
另外看看是今天偶发性，还是每天都这样，今天定位不到的话，明天凌晨不知道会不会还触发。

2年前评论

redfish （楼主）

已经两次了，看日志就是半夜突然内存就满了，系统杀进程，保存现场，又重启，又杀，这样一直跑，然后阿里云就给禁掉了

redfish （楼主）

只是不知道为什么半夜内存会突然满

it_cwc

Laravel 12.x 译者 130 声望

可能是数据库慢sql或者缓存集体失效压力给到数据库了~可能 :speak_no_evil:

2年前评论

kis龍

Laravel 9.x 译者 511 声望

装个 iotop ，看看是哪个进程占用的资源
最近做了哪些调整，有没有加新功能等
是否有定时任务
简单的是找后台提交个工单，让他们帮你查看是什么问题。

2年前评论

sanders

课程读者 650 声望 / 程序员鼓励师 @ KDD

这台机器上不会是部署了数据库吧？

2年前评论

sanders （作者）

@redfish 建议使用rds的数据库，虽然也有iops限制，但都明码标价。如果当时有定时任务，可以找其他机器模拟下4点左右的定时任务场景。

redfish （楼主）

嗯，有数据库，看日志oom后第一个干掉的就是数据库，把swap加大了，今晚再观察下，估计就是内存太小，系统杀进程后读现场太多导致的。

redfish

Laravel 12.x 译者 29 声望

加swap后目前没有发现问题了。。。暂时告一段落

2年前评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

服务器崩溃、远程无法访问、阿里云诊断提示IO延迟过长，导致读写受限

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

服务器崩溃、远程无法访问、阿里云诊断提示IO延迟过长，导致读写受限

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录