superviosr是一个Linux/Unix系统上的进程监控工具,他/她upervisor是一个Python开发的通用的进程管理程序,可以管理和监控Linux上面的进程,能将一个普通的命令行进程变为后台daemon,并监控进程状态,异常退出时能自动重启。不过同daemontools一样,它不能监控daemon进程。

为什么用supervisor

  • 使用简单
    supervisor提供了一种统一的方式来start、stop、monitor你的进程, 进程可以单独控制,也可以成组的控制。你可以在本地或者远程命令行或者web接口来配置Supervisor。

在linux下的很多程序通常都是一直运行着的,一般来说都需要自己编写一个能够实现进程start/stop/restart/reload功能的脚本,然后放到/etc/init.d/下面。但这样做也有很多弊端,第一我们要为每个程序编写一个类似脚本,第二,当这个进程挂掉的时候,linux不会自动重启它的,想要自动重启的话,我们还要自己写一个监控重启脚本。

而supervisor则可以完美的解决这些问题。supervisor管理进程,就是通过fork/exec的方式把这些被管理的进程,当作supervisor的子进程来启动。这样的话,我们只要在supervisor的配置文件中,把要管理的进程的可执行文件的路径写进去就OK了。第二,被管理进程作为supervisor的子进程,当子进程挂掉的时候,父进程可以准确获取子进程挂掉的信息的,所以当然也就可以对挂掉的子进程进行自动重启,当然重启还是不重启,也要看你的配置文件里面有木有设置autostart=true了。
supervisor通过INI格式配置文件进行配置,很容易掌握,它为每个进程提供了很多配置选项,可以使你很容易的重启进程或者自动的轮转日志。

  • 集中管理
    supervisor管理的进程,进程组信息,全部都写在一个ini格式的文件里就OK了。而且,我们管理supervisor的时候的可以在本地进行管理,也可以远程管理,而且supervisor提供了一个web界面,我们可以在web界面上监控,管理进程。 当然了,本地,远程和web管理的时候,需要调用supervisor的xml_rpc接口,这个也是后话。
    supervisor可以对进程组统一管理,也就是说咱们可以把需要管理的进程写到一个组里面,然后我们把这个组作为一个对象进行管理,如启动,停止,重启等等操作。而linux系统则是没有这种功能的,我们想要停止一个进程,只能一个一个的去停止,要么就自己写个脚本去批量停止。

supervisor组件

  • supervisord
    主进程,负责管理进程的server,它会根据配置文件创建指定数量的应用程序的子进程,管理子进程的整个生命周期,对crash的进程重启,对进程变化发送事件通知等。同时内置web server和XML-RPC Interface,轻松实现进程管理。。该服务的配置文件在/etc/supervisor/supervisord.conf。
  • supervisorctl
    客户端的命令行工具,提供一个类似shell的操作接口,通过它你可以连接到不同的supervisord进程上来管理它们各自的子程序,命令通过UNIX socket或者TCP来和服务通讯。用户通过命令行发送消息给supervisord,可以查看进程状态,加载配置文件,启停进程,查看进程标准输出和错误输出,远程操作等。服务端也可以要求客户端提供身份验证之后才能进行操作。
  • Web Server
    superviosr提供了web server功能,可通过web控制进程(需要设置[inethttpserver]配置项)。
  • XML-RPC Interface
    XML-RPC接口, 就像HTTP提供WEB UI一样,用来控制supervisor和由它运行的程序。

安装、配置

# 法一
yum install epel-release
yum install supervisor -y

# 法二
yum install python-setuptools
easy_install supervisor
或
pip install supervisor

# 常用命令
systemctl start supervisord
systemctl enable supervisord

supervisorctl start [app name]      #启动app进程
supervisorctl stop [app name]       #停止app进程
supervisorctl restart [app name]    #重启app进程
supervisorctl tail -f [app name]    #查看[app name]的日志
supervisorctl status            #查看当前运行的进程列表
supervisorctl update            #更新新的配置到supervisord(不会重启原来已运行的程序)
supervisorctl reload            #重启supervisorctl、管理所有进程(会重启原来已运行的程序)
supervisorctl stop groupworker  #重启所有属于名为groupworker这个分组的进程(start,restart同理)
supervisorctl stop all          #停止全部进程,注:start、restart、stop都不会载入最新的配置文
supervisorctl reread            #当一个服务由自动启动修改为手动启动时执行一下就ok
注意:如果原来的程序启动时需要带上参数,那通过supervisorctl start时应该先写一个shell脚本,然后supervisorctl运行该脚本即可。


# 默认配置写入文件,如果已经修改了supervisor.conf,这句就不要执行了
echo_supervisord_conf > /etc/supervisord.conf

# 修改配置
vim /etc/supervisord.conf

# 在supervisor中,以;开头的为注释。
如果需要网页管理,开启[inet_http_server]一项
[inet_http_server]         ;HTTP服务器,提供web管理界面
port=0.0.0.0:9001          ;Web管理后台运行的IP和端口,改为0.0.0.0不限制IP访问;如果开放到公网,需要注意安全性
username=leo               ;登录管理后台的用户名
password=123456            ;登录管理后台的密码

mark

配置简介

[unix_http_server]
file=/tmp/supervisor.sock   ;UNIX socket 文件,supervisorctl 会使用
;chmod=0700                 ;socket文件的mode,默认是0700
;chown=nobody:nogroup       ;socket文件的owner,格式:uid:gid

;[inet_http_server]         ;HTTP服务器,提供web管理界面
;port=127.0.0.1:9001        ;Web管理后台运行的IP和端口,如果开放到公网,需要注意安全性
;username=user              ;登录管理后台的用户名
;password=123               ;登录管理后台的密码

[supervisord]
logfile=/tmp/supervisord.log ;日志文件,默认是 $CWD/supervisord.log
logfile_maxbytes=50MB        ;日志文件大小,超出会rotate,默认 50MB,如果设成0,表示不限制大小
logfile_backups=10           ;日志文件保留备份数量默认10,设为0表示不备份
loglevel=info                ;日志级别,默认info,其它: debug,warn,trace
pidfile=/tmp/supervisord.pid ;pid 文件
nodaemon=false               ;是否在前台启动,默认是false,即以 daemon 的方式启动
minfds=1024                  ;可以打开的文件描述符的最小值,默认 1024
minprocs=200                 ;可以打开的进程数的最小值,默认 200

[supervisorctl]
serverurl=unix:///tmp/supervisor.sock ;通过UNIX socket连接supervisord,路径与unix_http_server部分的file一致
;serverurl=http://127.0.0.1:9001 ; 通过HTTP的方式连接supervisord

; [program:xx]是被管理的进程配置参数,xx是进程的名称
[program:xx]
command=/usr/sbin/nginx  ; 程序启动命令
autostart=true       ; 在supervisord启动的时候也自动启动
startsecs=10         ; 启动10秒后没有异常退出,就表示进程正常启动了,默认为1秒
autorestart=true     ; 程序退出后自动重启,可选值:[unexpected,true,false],默认为unexpected,表示进程意外杀死后才重启
startretries=3       ; 启动失败自动重试次数,默认是3
user=root            ; 用哪个用户启动进程,默认是root
priority=999         ; 进程启动优先级,默认999,值小的优先启动
redirect_stderr=true ; 把stderr重定向到stdout,默认false
stdout_logfile_maxbytes=20MB  ; stdout 日志文件大小,默认50MB
stdout_logfile_backups = 20   ; stdout 日志文件备份数,默认是10
; stdout 日志文件,需要注意当指定目录不存在时无法正常启动,所以需要手动创建目录(supervisord 会自动创建日志文件)
stdout_logfile=/opt/apache-tomcat-8.0.35/logs/catalina.out
stopasgroup=false     ;默认为false,进程被杀死时,是否向这个进程组发送stop信号,包括子进程
killasgroup=false     ;默认为false,向进程组发送kill信号,包括子进程

;包含其它配置文件
[include]
files = /etc/supervisord.d/*.ini    ;可以指定一个或多个以.ini结束的配置文件

包含了/etc/supervisord.d/下的ini,则建议程序配置全部放在改目录下,方便管理。


报错

supervisorctl start [app name] 报错 unix:///var/run/supervisor.sock no such file

# 解决
touch /var/run/supervisor.sock
chmod 777 /var/run/supervisor.sock
systemctl restart supervisor

参考:
https://www.cnblogs.com/xueweihan/p/6195824.html
https://www.jianshu.com/p/0226b7c59ae2
https://blog.csdn.net/xyang81/article/details/51555473
https://www.cnblogs.com/smail-bao/p/5673434.html


集中式管理(跨机器)

supervisor不支持跨机器的进程监控,一个supervisord只能监控本机上的程序,大大限制了supervisor的使用。不过由于supervisor本身支持xml-rpc,因此也有一些基于supervisor二次开发的多机器进程管理工具。比如:

参考:https://www.cnblogs.com/smail-bao/p/5673434.html



配置Nginx

# 法一
vim /etc/nginx/nginx.conf
加入:daemon off;
使nginx保持在前台运行,supervisor无法监控后台程序。

vim /etc/supervisord.d/nginx.ini
# 根据自己的情况修改

[program:nginx]
command=/usr/sbin/nginx                 ; the program (relative uses PATH, can take args)
autostart=true                          ; start at supervisord start (default: true)
autorestart=true                        ; retstart at unexpected quit (default: true)
user=root                               ; setuid to this UNIX account to run the program
stdout_logfile=/tmp/nginx.log           ; stdout log path, NONE for none; default AUTO
stdout_logfile_maxbytes=10MB            ; max # logfile bytes b4 rotation (default 50MB)
stderr_logfile=/tmp/nginxerr.log        ; stderr log path, NONE for none; default AUTO
stderr_logfile_maxbytes=10MB            ; max # logfile bytes b4 rotation (default 50MB)


# 法二
不需要改nginx配置,但是我测试的不行,报错:nginx: invalid option: ";" 但是独立执行是没问题的。

[program:nginx]
command=/usr/sbin/nginx -g 'daemon off;'   ; the program (relative uses PATH, can take args)
autostart=true                             ; start at supervisord start (default: true)
autorestart=true                           ; retstart at unexpected quit (default: true)
user=root                                  ; setuid to this UNIX account to run the program
stdout_logfile=/tmp/nginx.log              ; stdout log path, NONE for none; default AUTO
stdout_logfile_maxbytes=10MB               ; max # logfile bytes b4 rotation (default 50MB)
stderr_logfile=/tmp/nginxerr.log           ; stderr log path, NONE for none; default AUTO
stderr_logfile_maxbytes=10MB               ; max # logfile bytes b4 rotation (default 50MB)

参考:https://www.cnblogs.com/shanyimin/p/7975596.html
文章作者: Leo
本文链接:
版权声明: 本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 LeoLan的小站
系统管理 supervisor
喜欢就支持一下吧