一、干货先行——脚本(监测进程状态,不存在重启,并记录重启日志)
#!/bin/sh
#restart the kafkaConsumer_fu.py when the process died
FLAGE="/home/work/ihotel/python2.7/bin/python kafkaConsumer_fu.py"
INVOKE_LOG="./invokeKfakaConsumer.log"
if [ ! -e $INVOKE_LOG ];then
touch $INVOKE_LOG
fi
while true;do
count=`ps -ef | grep "$FLAGE" | grep -v grep`
if [ "$?" != "0" ];then
cur_time=`date +'%Y-%m-%d %H-%M-%S'`
#CUR_TIME=`date +'%Y-%m-%d %H-%M-%S'`
echo "the process have died,now it will be restart! cur_time:$cur_time" >> $INVOKE_LOG
nohup $FLAGE > /dev/null 2>&1 &
cur_time=`date +'%Y-%m-%d %H-%M-%S'`
echo "the process restart success! cur_time:$cur_time" >> $INVOKE_LOG
sleep 3600
else
echo 'the process is running...'
fi
sleep 10
done
二、涉及到的知识
ps 命令
- Linux中的ps命令是Process Status的缩写。
附:ps命令用来列出系统中当前运行的那些进程的快照,即:列出执行ps命令的那个时刻的那些进程,如果想要动态的显示进程信息,应当使用top命令。 - linux上进程有5种状态:
1.运行(正在运行或在运行队列中等待)
2.中断(休眠中, 受阻, 在等待某个条件的形成或接受到信号)
3.不可中断(收到信号不唤醒和不可运行, 进程必须等待直到有中断发生)
4.僵死(进程已终止, 但进程描述符存在, 直到父进程调用wait4()系统调用后释放)
5.停止(进程收到SIGSTOP, SIGSTP, SIGTIN, SIGTOU信号后停止运行) - ps工具标识进程的5种状态码:
D 不可中断 uninterruptible sleep (usually IO)
R 运行 runnable (on run queue)
S 中断 sleeping
T 停止 traced or stopped
Z 僵死 a defunct (”zombie”) process - ps 命令格式:
ps [option] - ps命令参数:
a 显示所有进程
-a 显示同一终端下的所有程序
-A 显示所有进程
c 显示进程的真实名称
-N 反向选择
-e 等于“-A”
e 显示环境变量
f 显示程序间的关系
-H 显示树状结构
r 显示当前终端的进程
T 显示当前终端的所有程序
u 指定用户的所有进程(当前用户)
-au 显示较详细的资讯
-aux 显示所有包含其他使用者的行程
-C<命令> 列出指定命令的状况
--lines<行数> 每页显示的行数
--width<字符数> 每页显示的字符数
--help 显示帮助信息
--version 显示版本显示 - 实例 列出当前内存中的所有程序:
ps -aux
各参数解释:
USER:该 process 属于哪个使用者账号的
PID :该 process 的号码
%CPU:该 process 使用掉的 CPU 资源百分比
%MEM:该 process 所占用的物理内存百分比
VSZ :该 process 使用掉的虚拟内存量 (Kbytes)
RSS :该 process 占用的固定的内存量 (Kbytes)
TTY :该 process 是在哪个终端机上面运作,若与终端机无关,则显示 ?,另外, tty1-tty6 是本机上面的登入者程序,若为 pts/0 等等 的,则表示为由网络连接进主机的程序。
STAT:该程序目前的状态,主要的状态有
R :该程序目前正在运作,或者是可被运作
S :该程序目前正在睡眠当中 (可说是 idle 状态),但可被某些讯号 (signal) 唤醒。
T :该程序目前正在侦测或者是停止了
Z :该程序应该已经终止,但是其父程序却无法正常的终止他,造成 zombie (疆尸) 程序的状态
START:该 process 被触发启动的时间
TIME :该 process 实际使用 CPU 运作的时间
COMMAND:该程序的实际指令
shell while循环
while test
do
oderlists
done
shell分支语句
下述约定:test:表示条件测试语句与操作,orderlists表示命令序列
- 单分支if
if test
then
orderlists
fi - 双分支if
if test
then
orderlists
else
oderlists
fi - 多分支if
if test
then
orderlists
elif test
orderlists