jvm内存泄漏问题排查分析笔记

当发现服务器可能存在内存泄漏时（怎么发现？频繁gc但是堆内存降不下来，进程内存爆了就有可能是发生内存泄漏了），怎么去定位发生的原因以及解决的方法。

首先，在分析内存前可以先通过代码猜测一下可能存在内存泄漏的部分，因为线上要想拿到dump下来的出问题的服务器的内存文件一般会耗时很久，这个时间我们可以通过分析最近的版本更新内容、或者有没有新添加的代码导致了内存泄漏，这个可以通过查看svn或者git的提交，内存泄漏的问题也可能是跨版本的，比如更新的版本1出现的内存泄漏，但是内存增长很缓慢，到版本2停服更新前都没有暴露，然后版本2维护的时间比版本1要长一些，结果内存增长到瓶颈就挂了，当然这是比较特殊的情况。更多的还是当前版本更新的内容引起的。

java服务器我们可以让运维使用：jmap -histo:live pid命令，打印出异常进程的对象数量信息，同时找一个线上正常的进程的做对比，找出对象数量明显异常的对象，jvm gc无法回收的最大可能性就是存在大量强引用的异常对象，并且这些对象持续增长，因为某些原因没有被回收导致堆内存一直增加直到达到设置参数的极限。

如下图所示：

image.png

终端分屏的上面为异常的对象数量，下方为正常的，可以非常明显的看出这个对象数量肯定是存在问题的，于是我们可以基本定位到这个类的代码存在漏洞。然后引用也有可能是联动的，就是一个对象数量的增长会带动另外一个对象数量同样增长，因为对象1引用了对象2，对象1不释放，那么对象2同样也不会释放，所以我们在找寻异常对象时同样需要判断该对象是不是源头，是不是是被带动增长的。

这个需要怎么判断呢？每个服务端肯定会有一个数据实体的，当请求服务端时需要构造这么一个对象，这里以游戏服务端为例，在游戏服务端里面就是一个Player对象，玩家相关的模块都会挂在这个对象上面，那么其实我们首先需要观察的就是该对象数量是否异常，如果该对象数量明显不对，那么这个异常一般跟该对象的行为有关，因为即使相关模块出问题，很难反过来影响该对象的增长，如果有那就更好找了，没有则再继续分析。

如我们上面的分析，可以发现ActivityService这个对象数量不对，而且这个也是跟Player对象有关系的，那么我们就可以从这里入手。如果你在查阅ActivityService这个类的代码已经发现问题所在，那么当然是皆大欢喜，但是如果仍旧无法定位或者依旧存疑，那么这个时候内存应该dump下来了，我们可以通过分析内存进一步确认问题的原因。

dump内存可以使用指令：jmap -dump:live,format=b,file=heap.bin <pid>

分析内存我们可以使用MAT（Memory Analysis Tools）工具，MAT工具的安装和使用网上已经有很多教程了，就不赘述了，该工具功能非常强大，是分析Java堆内存的利器。

我们先用MAT打开dump下来的二进制文件，然后点击 Histogram，查看内存中的对象数量：

image.png

我们先看我们首要怀疑的Player对象，可以看到目前有14437个对象，这个对象是否正常我们对比正常服的情况，这里明显是不对的，因此我们通过
MAT工具找到这些Player对象为什么不会被回收：

image.png

先分类一下该对象的引用，得出下图结果：

image.png

可以发现只有2个软引用的Player对象，其余的都是GC ROOT，如果存在GC ROOT，对象就不会被回收。

然后我们继续跟踪这些对象是被什么强引用：

image.png

得到的结果是：

image.png

如图可知，有14425的定时器在引用着这些Player对象，因为这些future没有在执行完毕或者在玩家下线等条件去移除，导致这些定时器一直存在，这个时候问题的根源就找到了，至于怎么去定位更细节的问题产生原因，这个就涉及具体的业务细节了。

当然MAT的功能肯定不止这些，我们通过该工具查看到这些对象在内存中具体的值，

image.png

如里面的每个task的内容都可以查看到，同时还可以对比对象，这个工具非常好玩，有待继续挖掘！

希望对你有所帮助。

Regards，
codjust

最后编辑于：2018.02.24 12:02:15

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,802评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,109评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,683评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,458评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,452评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,505评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,901评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,550评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,763评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,556评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,629评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,330评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,898评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,897评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,140评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,807评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,339评论 2赞 342

jvm内存泄漏问题排查分析笔记

推荐阅读更多精彩内容