初步了解如何用GDB分析Core文件

之前初步了解过Windows 下强大的调试工具WinDbg,也简单的整理了一个初级的文章《使用WinDbg、Map文件、Dump文件定位Access Violation的代码行》,在Linux 下面也有对应的功能强大的调试工具:GDB,它可以用来断点调试C/C++ 的程序,也可以用于分析Linux 下的C/C++ 程序运行崩溃产生的Core 文件……

另外对于GDB 工具,在《Linux gdb调试器用法全面解析》这篇文章中详细的介绍了怎么使用GDB 去调试C/C++ 代码

本文通过一个简单的例子展示怎么使用GDB 分析Core 文件,但就像我一直强调的,完全停留在一个很肤浅的入门级的水平,只是先让自己能有一个对GDB 的感性的认知,其实GDB 很强大,它能做的事情远不止于本文所提到的这些皮毛

本文的内容也是参考了网络上很多的文章,然后结合自己的验证整理出来的

Core文件和段错误

当一个程序奔溃时,在进程当前工作目录的Core 文件中复制了该进程的存储图像。Core 文件仅仅是一个内存映像(同时加上调试信息),主要用来调试的

通常情况下,Core 文件会包含程序运行时的内存、寄存器状态、堆栈指针、内存管理信息还有各种函数调用堆栈信息等。我们可以理解为是程序工作当前状态存储生成第一个文件,许多程序出错时都会产生一个Core 文件,通过工具分析这个文件,我们可以定位到程序异常退出时对应的堆栈调用等信息,找出问题所在并进行及时解决

段错误,就是大名鼎鼎的Segmentation Fault,这通常是由指针错误引起的。简而言之,产生段错误就是访问了错误的内存段,一般是你没有权限,或者根本就不存在对应的物理内存,尤其常见的是访问0 地址。

一般而言,段错误就是指访问的内存超出了系统所给这个程序的内存空间,通常这个值是由gdtr 来保存的,这是一个48位的寄存器,其中的32位是保存由它指向的gdt 表,后13位保存相应于gdt 的下标,最后3位包括了程序是否在内存中以及程序在CPU 中的运行级别。指向的gdt 是由以64位为一个单位的表,在这张表中就保存着程序运行的代码段以及数据段的起始地址以及与此相应的段限、页面交换、程序运行级别、内存粒度等的信息。一旦一个程序发生了越界访问,CPU 就会产生相应的异常保护,于是Segmentation fault就出现了

在编程中有以下几种做法容易导致段错误,基本都是错误地使用指针引起的:

  • 访问系统数据区,尤其是往系统保护的内存地址写数据,最常见的就是给指针以0地址
  • 内存越界(数据越界、变量类型不一致等)访问到不属于你的内存区域

程序在运行过程中如果出现段错误,那么就会收到SIGSEGV 信号,SIGSEGV 默认handler 的动作是打印“段错误”的出错信息,并产生Core 文件

GDB 断点调试以定位错误代码行

testCrash.cpp

void testCrash()
{
    int* p = 1; //p指针指向常量1 所在的内存地址
    *p = 3;     //将p指针指向的地址的值改为3,
    //因为本来p指向一个常量,是不允许被修改的
    //强行访问系统保护的内存地址就会出现段错误
}

main.cpp

#include <stdio.h>

void testCrash();

int main()
{
    testCrash();
    return 0
}

编译执行,报段错误

注意g++ 编译的时候,需要使用参数-g,否则GDB 无法找到symbol 信息,从而无法定位问题

image

断点调试

image

很明显,在GDB 断点调试的过程中,已经将错误的代码行输出了:在testCrash.cpp 的第4行,在testCrash()方法里面,而且也将错误的代码*p = 3;打印出来了

还发现进程是由于收到了SIGSEGV 信号而结束的。通过进一步的查阅文档(man 7 signal),SIGSEGV 默认handler 的动作是打印”段错误”的出错信息,并产生Core 文件

分析Core 文件

设置Core文件大小,运行程序生成Core文件

执行ulimit -c unlimited表示不限制生成的Core 文件的大小,注意这个命令只在当前的bash 下生效!然后运行这个有bug 的程序,可以看到在当前目录下生成了core文件

image

GDB 分析Core 文件

image

同样也是一步到位的定位到错误所在的代码行!

为了获取更详细的函数调用信息,在执行gdb 可执行文件 core文件启动gdb后,调用gdb的where或bt命令可以查看当时的调用栈信息!确定是什么样的函数调用栈导致的程序崩溃!

接着考虑下去,在Windows 系统下的运行程序时,可能会出现“运行时错误”,这个时侯如果恰好你的机器上又装有Windows 的编译器的话,它会弹出来一个对话框,问你是否进行调试,如果你选择是,编译器将被打开,并进入调试状态,开始调试

Linux下可以做到吗?可以让它在SIGSEGV 的handler中调用gdb

段错误时启动调试

testCrash.cpp

void testCrash()
{
    int* p = 1; //p指针指向常量1 所在的内存地址
    *p = 3;     //将p指针指向的地址的值改为3,
    //因为本来p指向一个常量,是不允许被修改的
    //强行访问系统保护的内存地址就会出现段错误
}

main.cpp

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <string.h>

void testCrash();

void dump(int signo)
{
    char buf[1024];
    char cmd[1024];
    FILE *fh;

    snprintf(buf, sizeof(buf), "/proc/%d/cmdline", getpid());
    if(!(fh = fopen(buf, "r")))
    {
        exit(0);
    }
    if(!fgets(buf, sizeof(buf), fh))
    {
        exit(0);
    }
    fclose(fh);
    if(buf[strlen(buf) - 1] == '\n')
    {
        buf[strlen(buf) - 1] = '\0';
    }
    snprintf(cmd, sizeof(cmd), "gdb %s %d", buf, getpid());
    system(cmd);

    exit(0);
}

int main()
{
    signal(SIGSEGV, &dump);
    testCrash();
    return 0;
}

编译程序

注意g++ 编译的时候,需要使用参数-g,否则GDB 无法找到symbol 信息,从而无法定位问题

image

运行程序

首先必须要切换到root 用户运行,否则因为权限问题导致无法调试,另外就是进入调试模式后执行bt 以显示程序的调用栈信息!

image

路漫漫其修远兮

以上展示的这些东西很简单,在你对Linux 进程的虚拟内存、进程的堆栈结构等没有任何了解的情况下,完全照葫芦画瓢也能简单的使用GDB

但是上面的程序、上面的代码、上面的场景都完全是一个极其理想化的场景,在这种场景下排查问题当然是很简单的

而在实际的场景中,往往比这个要复杂的多

  • 程序远不止上面的十几二十几行,可能是上万、上百万行!
  • 绝不是简单的单线程程序,可能会有多进程、多线程,这种场景该怎么调试?
  • 假如程序崩溃了,但调用的是外部提供的.so文件,根本没有对应源码,此时就无法结合代码分析了!
  • 假如编译时没有加-g 参数,那么GDB 无法找到symbol信息,那怎么办?
  • 等等等等

针对上面的这些复杂的场景,上面展示的这些GDB 的简单招式可能就没有效果了,所以就需要更深层次的研究GDB 的使用,以及GDB 调试进程、分析Core 文件背后的操作系统、编译原理层面的机制是什么

在Windows 下使用WinDbg 调试进程、分析dump 文件也是一样的情况!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,898评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,401评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,058评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,539评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,382评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,319评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,706评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,370评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,664评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,715评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,476评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,326评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,730评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,003评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,275评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,683评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,877评论 2 335

推荐阅读更多精彩内容

  • 程序调试的基本思想是“分析现象->假设错误原因->产生新的现象去验证假设”这样一个循环过程,根据现象如何假设错误原...
    Manfred_Zone阅读 16,481评论 0 26
  • 一、温故而知新 1. 内存不够怎么办 内存简单分配策略的问题地址空间不隔离内存使用效率低程序运行的地址不确定 关于...
    SeanCST阅读 7,758评论 0 27
  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 11,068评论 1 32
  • 在Linux下程序不寻常退出时,内核会在当前工作目录下生成一个core文件(是一个内存映像,同时加上调试信息)。使...
    随风化作雨阅读 44,207评论 2 15
  • 现在化妆的普及已经到03后这一代,可见化妆人群之多。在这个发展迅速的时代里,化妆已经是一件正常的不能再正常的事情,...
    guacai4093阅读 338评论 0 0