结束子进程以及它的子进程

在用 goreman 管理整个 TiDB 集群的时候,我发现 goreman 的 run stop 功能并不能正常的干掉 TiDB 组件,开始我觉得是我们自己代码的没有,没有很好的处理相关信号,但后来发现,TiDB 这边是压根没有收到信号,所以问题铁定在其他的地方,于是浏览下 goreman 的源码,发现使用的是 /bin/sh -c 的方式来启动的 TiDB 程序,可能就跟这个有关系。

首先,写两个简单的程序,一个是直接启动进程,另一个是使用 /bin/sh -c 的方式启动。简单起见,我们直接 sleep 很长一段时间,然后在 10 秒之后,kill 掉进程。

func child() {
    cmd := exec.Command("sleep", "600")
    start := time.Now()
    time.AfterFunc(10*time.Second, func() { cmd.Process.Kill() })
    ecmd.Run()
}

func grand_child() {
    cmd := exec.Command("/bin/sh", "-c", "sleep 1000")
    time.AfterFunc(10*time.Second, func() { cmd.Process.Kill() })
    cmd.Run()
}

启动之后,我们会发现有三个 sleep 进程,其中,31126 是 31124 的子进程。

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
31119 31124 31119 30890 pts/0    31119 S+    1000   0:00 /bin/sh -c sleep 1000
31119 31125 31119 30890 pts/0    31119 S+    1000   0:00 sleep 600
31124 31126 31119 30890 pts/0    31119 S+    1000   0:00 sleep 1000

10 秒之后,我们发现,31126 还是存在,并且没有被 kill 掉,也就是,直接 kill 31124 并不能干掉它的子进程。而且 31126 的父进程现在已经变成了 1,也就是 31126 变成了孤儿进程,然后被 init 进程给接管了。

 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
    1 31126 31119 30890 pts/0    30890 S     1000   0:00 sleep 1000

为了解决这个问题,我们需要的是 kill process group,而不是只 kill 父进程,在 Linux 里面使用的是 kill -- -PID 的方式。同时为了避免自杀,我们需要是为 /bin/sh 这边额外在创建一个新的进程组(在上面我们可以注意到,所有的 PGID 都是 31119,如果直接 kill -- -PID,会把所有相关的进程都干掉)。

在 Go 里面,我们使用 Setpgid: true 来显示的创建一个新的进程组,如下:

func grand_child() {
    cmd := exec.Command("/bin/sh", "-c", "sleep 1000")
    cmd.SysProcAttr = &syscall.SysProcAttr{Setpgid: true}
    time.AfterFunc(10*time.Second, func() {
        syscall.Kill(-cmd.Process.Pid, syscall.SIGKILL)
    })
    cmd.Run()
}

启动之后,会发现 /bin/sh 启动的进程已经使用了一个新的进程组了:

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
4517  4522  4522  3374 pts/0     4517 S     1000   0:00 /bin/sh -c sleep 1000
4522  4524  4522  3374 pts/0     4517 S     1000   0:00 sleep 1000

然后 10 秒之后,相关进程全部被 kill 掉了。

既然弄懂了 kill grand process 的方法,再看 goreman 的问题就比较容易了。在 goreman 里面,其实也有 kill process group 的代码,但是,它漏掉了最关键的 Setpgid: true,提个 PR,搞定收工。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容