火焰图是进行性能分析的工具,可以通过Flame Graph
获取指定程序的火焰图,目前IDEA也增添了火焰图功能,叫做CPU Profiler
Flame Graphs
Flame Graph
是一个可视化的性能分析软件,可以快速准确地识别最频繁调用的代码,最终生成交互式的SVG图片,作者是Brendan Gregg,博客链接,名字叫做“火焰图”是因为它最初的功能是用于显示CPU上的热点(正在运行的代码),看起来像火焰
这里主要讲述Java语言中通过火焰图分析CPU耗时
火焰图中X轴是所有的采样点的集合,Y轴表示栈的深度stack depth
,每个方框代表一个栈帧stack frame
或者说是一个函数,方框的宽带代表其在CPU上的时间比例(基于采样),越宽表示其运行的时间更长,或者说是调用的次数更多。从底层最宽的帧往上读,代表着函数的调用关系,不同的分叉代表不同的代码调用路径。颜色没有实际意义,只是随机选取用于栈帧之间相互区分,左右顺序也没有什么含义
通过火焰图可以快速识别和量化的CPU使用情况,也可以收集不同时间或者不同版本的火焰图,通过比较快速量化性能的变化
分析器的选择
为了生成火焰图,需要一个可以对函数栈轨迹进行采样的分析器,对于Java,可以使用两种类型的分析器:
- 系统分析器
System profilers
:例如Linux perf_events
,它可以分析系统代码路径,例如libjvm,GC和内核,但不能分析Java方法 - JVM分析器
JVM profilers
:例如hprof
,Lightweight Java Profiler (LJP)
,可以显示Java方法,但不显示系统代码路径
perf
,也叫作Performance Counters for Linux (PCL)
,perf_events
或perf tools
,是一个Linux性能分析工具,是Linux 内核的一部分,面向事件通过采样进行性能分析,有两种采样方法:硬件,主要利用CPU的PMU(Performance Monitoring Unit)计数器统计事件次数,比如L1 Cache失效的次数,分支预测失败的次数;软件,例如利用tracepoint作为探测点进行采样
缺失Java函数信息的原因:
- JVM内部即时编译器JIT,不会公开传统的符号表供系统分析器读取
- JVM默认使用帧指针寄存器(x86-64上的RBP)作为通用寄存器,与传统的栈不同
解决:
- 使用开源JVMTI代理
perf-map-agent
,创建/tmp/perf-<pid>.map
文件,内部列出符号地址(十六进制),大小和符号名称。perf_events
默认查找此文件,如果找到,则将其用于符号转换 - 使用
-XX:+PreserveFramePointer
,以便perf
可以精准的获取栈结构,会导致一定的性能损耗
使用
- 安装
perf
查看系统上是否有perf
,如果没有就按照提示安装
sudo apt install linux-tools-common
sudo apt install linux-tools-4.15.0-46-generic
- 确保JDK版本Java 8 update 60 build 19及以上,该版本添加了
-XX:+PreserveFramePointer
选项的支持 - 安装
perf-map-agent
sudo bash
apt-get install cmake
export JAVA_HOME=/path-to-your-new-jdk8
cd /destination-for-perf-map-agent # I use /usr/lib/jvm
git clone --depth=1 https://github.com/jvm-profiling-tools/perf-map-agent
cd perf-map-agent
cmake .
make
会产生一个out
目录,内部包含attach-main.jar
- 安装FlameGraph,包含perl脚本,可以对捕获的采样数据进行处理,生成火焰图
git clone --depth=1 https://github.com/brendangregg/FlameGraph
- 具体使用
首先是启动目标Java程序
然后进行CPU采样30秒
sudo perf record -F 99 -a -g -- sleep 30
参数的含义,具体可以查看sudo perf record -h
-F
指定频率即每秒采样数,这里以99赫兹的频率
-a
对所有进程进行采样,可以使用-p
指定进程
指定Java目标进程的PID,缓存符号表,其中attach-main.jar
文件来自perf-map-agent
java -cp attach-main.jar:$JAVA_HOME/lib/tools.jar net.virtualvoid.perf.AttachOnce PID
sudo chown root /tmp/perf-*.map
对采样数据进行处理,生成SVG类型的火焰图,其中的stackcollapse-perf.pl
和flamegraph.pl
来自FlameGraph
sudo perf script | stackcollapse-perf.pl | \
flamegraph.pl --color=java --hash > flamegraph.svg
或者使用jmaps脚本,自动的为所有Java进程创建符号文件
sudo perf record -F 99 -a -g -- sleep 30; sudo jmaps
sudo perf script | stackcollapse-perf.pl | \
flamegraph.pl --color=java --hash > flamegraph.svg
CPU Profiler
比上一个方式简单,IntelliJ IDEA 2018.3版本引用该功能,类似于火焰图,目前还是测试版本,只支持Linux和Mac
-
Ctrl+Shift+A
打开Find Action对话框,输入Experimental features
,勾选idea.profiler.enabled
,启用该功能
- 安装perf,并进行配置
//直接配置
sudo sh -c 'echo 1 >/proc/sys/kernel/perf_event_paranoid'
sudo sh -c 'echo 0 >/proc/sys/kernel/kptr_restrict'
//永久配置
sudo sh -c 'echo kernel.perf_event_paranoid=1 >> /etc/sysctl.d/99-perf.conf'
sudo sh -c 'echo kernel.kptr_restrict=0 >> /etc/sysctl.d/99-perf.conf'
sudo sh -c 'sysctl --system'
- 启动执行,点击菜单栏
Run | Run 'xxxxx' with Async Profiler
,执行完成后可以查看CPU Profiler
选项卡
在CPU Profiler工具窗口中,收集的数据显示在三个选项卡上 - 火焰图,调用树和方法列表。 火焰图左侧列出了应用程序相关的线程,可以查看每个线程单独的火焰图信息
其他工具
- VTune:Intel自家的性能分析工具,可以分析CPU热点代码,内存,IO,GPU等等,支持多种语言,可以获取到Java程序函数的调用所占时间的信息,不过正版是需要付费的
- jvisualvm:JDK自带的分析工具,可以在
Sampler
界面进行CPU或Memory采样,获取函数的运行时间,或者不同数据类型的对象在内存中的占比
他们能够统计函数耗时,但是没有火焰图直观
参考文献:
Java in Flames
CPU Profiler