1 动态分析技术
对于动态分析技术的解释如下:
在程序运行的时候能够加入检测例程,对执行情况进行监控,并提示出错的地方。
动态分析技术会更容易检查出实际运行时出现的问题。
动态分析技术有以下特点:
动态分析工具不需要重新链接运行库或者是修改代码,使用起来很方便。
动态分析技术会让程序执行变得更慢。
动态分析技术发现的问题不太可能是误报!
动态监测工具能够为程序检测提供哪些方面的帮助,比如:
1、未经初始化的变量
2、泄漏的内存
3、访问非可用的地址空间
常见的有Valgrind,JavaScript的Jalangi,SystemTap,perf等等
2 Valgrind
常见的动态跟踪工具套件之一,能够提供内存管理、线程bug方面的检查。使用Valgrind之前最好重新对C++程序使用-g命令编译,提供丰富的调试信息。
命令格式如下
valgrind [valgrind选项] 所检测的程序[程序选项]
2.1 Valgrind选项
--tool <组件> 所使用的检测组建,比如memcheck(实际上是默认的不需要加)、cachegrind、massif等组件
-v 即verbose更为详细的模式
-q 过滤其他告警只打印错误
--trace-children=<yes> 在多进程的情况下,检查由exec创建的子进程
--leak-check=<yes> 是否对内存泄漏进行检查
--time-unit=B 调整输出的时间单元
......
2.2 Valgrind组件
- memcheck 内存检查工具,可检查的常用问题见2.3。
- cachegrind 提供程序使用缓存的情况。cg_annotate对采样进行更为细致的展示。
- callgrind 提供函数之间的调用关系图。使用callgrind_annotate对采样进行分析。使用callgrind_control可以和正在运行的程序交互,获得当前运行时的情况。
- helgrind 线程同步错误的检查工具。检查非合理使用的POSIX线程模型(比如销毁上了锁的同步量、回收仍存在已上锁同步量的内存等等问题)、由加锁顺序导致的死锁问题、数据竞争。
- drd 线程错误检测工具。支持POSIX线程编程模型。
多线程常常出现的问题有5大类:
1、数据竞争(Data Races)即没有使用锁来保证线程并发访问的安全。
2、锁竞争(Lock Contention)即一个线程持有锁的时间过长
3、死锁(Deadlock)即简单模型下一个线程持锁A,要锁B,而别的线程持锁B,要锁A。
4、伪共享(fasle sharing)即多个处理器上的线程,访问同一块cache变量,导致CPU的局部缓存总是要保持一致。由CPU的缓存一致性引起。
5、没有合理使用POSIX线程模型
- massif 堆分析工具。目的是帮助分析堆、额外分配的内存(对齐使用)的使用情况,帮助程序减少内存的使用。并能给出程序每一部分对应内存的分配情况。配合ms_print分析输出情况。
2.3 内存检查常见告警
使用非法地址
Invalid write of size X
Address XXX is 0 bytes after a block of size Y alloc'd
未初始化的空间
Uninitialized value was created by a heap allocation
内存泄漏
XX bytes in Y blocks are definitely lost in loss record...
使用未初始化的变量
Conditional jump or move depends on uninitialised value(s)
非法释放内存(比如对一个指针多次调用free或者delete)
Invalid free()
不合理的分配和释放(new匹配delete,new [] 匹配 delete [], malloc系列匹配free,在Linux平台可能不是个问题)
Mismatched free() / delete / delete []
另外,进行 --leak-check检查时还可以得到四种情况。
definitely lost 内容完全丢失,指向该块的指针都找不到
indirectly lost 不直接丢失,不是块丢失,而是指向链上的某个环节丢失
possibly lost 内容可能丢失,指向链完整,但至少有一个地址可能是恰好指到链上的内部指针
still reachable 可正常访问
参考资料
valgrind用户手册:http://valgrind.org/docs/manual/manual.html