为何用 supervisor 监控队列,启动后几天就会自动消失,需要注意什么
我按教程里面用supervisor监控队列,在测试的时候队列也是正常的,但是过了几天测试的时候发现队列没了,我去服务器查看队列的情况,supervisor进程直接没了,我很纳闷,不知道发生了什么事,产品没上线,所以启动后几天内队列的任务极少,我查看过日志,日志里面没有什么错误信息,这才是令我最郁闷的,什么错误也没有,supervisor进程就这样消失了,队列也没发生失败的事件,队列失败的话是会发送邮件给我的,我重新启动supervisor进程,监督了几天发现还是这种情况。我现在还没什么头绪,不知道该怎么解决这件事,百度之后有人说不要用supervisor,我个人觉得supervisor很好用,不太想放弃这个东西
关于 LearnKu
从来没碰到过此问题。用这个很久了。是不是机器内存不足导致的~
@Will 不太可能,服务器内存是8G,有60%的剩余,所以应该不是内存导致的,昨天想了想不知道是不是不同用户导致的,我使用队列的是lumen,跟laravel一样运行在www这个用户,www用户无法登陆,我是在root用户启动supervisor,不知道是不是因为不同用户导致这种情况的
是守护进程没有了,还是任务进程没有了?
两个问题:
@hareluya
@lijinma
是出现
unix:///tmp/supervisor.sock no such file整个supervisor进程都没了@裸奔的代码 那就好解决了。。
@lijinma :disappointed_relieved:是挺好解决的,直接重新启动
@裸奔的代码 ..... 明显你要解决的是
unix:///tmp/supervisor.sock no such file这个问题啊。。重新启动以后不会再遇见吗。。@lijinma 重新启动supervisor就正常运行了,我再等几天看看吧,就让他空着运行几天,如果还消失了,那就有点问题了
如果没记错,
/tmp目录应该是10天清一次,所以不要启在/tmp目录里.@裸奔的代码 过了这么久不知道你解决了没,我前段时间也遇到相同的问题,进程运行一段时间莫名挂掉,后来查看文档
startsecsThe total number of seconds which the program needs to stay running after a startup to consider the start successful (moving the process from the STARTING state to the RUNNING state). Set to 0 to indicate that the program needn’t stay running for any particular amount of time.startsecs=0后没再出现此问题
@liujianmin 啊,原来是这样,后面我直接不用队列了,最近我又用起这个supervisor,我尝试一下看看,谢谢