一、RabbitMQ内存占用排查
1.定位 linux 系统内存占用最高进程
(1)输入 top 指令
nqs@nqs-yq-haitao-order-1488355883912:~$ top
然后输入大写的 M(Shift+m),基于内存占用倒序,找到占用最大内存的进程,如果内存占用最大的为 beam.smp 则为 RabbitMQ 进程占用。
2.定位 RabbitMQ 内部组建内存占用情况
(1)进入 RabbitMQ 指令目录
nqs@nqs-yq-haitao-order-1488355883912:~$ cd ~/rabbitmq_server-3.6.6/sbin/
(2) 查看 RabbitMQ 内存占用情况
nqs@nqs-yq-haitao-order-1488355883912:~/rabbitmq_server-3.6.6/sbin$ ./rabbitmqctl status
内存参数详解:
(1)内存占用总数
参数:
total
描述:
RabbitMQ 进程内存总占用量,单位 B(字节)
(2)RabbitMQ 连接
参数:
connection_readers
connection_writers
connection_channels
connection_other
描述:
这部分主要包含了连接和通道(channel)所消耗的内存,也包含了SSL系统所使用的内存。
(3)队列
参数:
queue_procs
queue_slave_procs
描述:
队列占用的内存指的是队列进程消耗的,并不包含消息体(在二进制中)。当内存不足时,这部分的内存将交换到磁盘上。
(4)插件
参数:
plugins
描述:
插件使用的内存不包含连接rabbit服务器的Erlang客户端和数据库所占用的部分,通常包含像一些协议插件如STOMP和MQTT。
注:有出现过队列数量配置过多 RabbitMQ_Manager插件内存占用过高的情况。
(5)其它进程内存
参数:
other_proc
描述:
除了上面所提到的以外的进程所消耗的部分,这里的进程是erlang虚拟机中的概念,最近被GC回收的内存会展现在这里。
(6)Mnesia
参数:
mnesia
描述:
Mnesia保存了一份磁盘上的数据拷贝到内存,意味着当有大量队列、交换机、绑定、用户信息或虚拟主机时会消耗大量的内存。
(7)管理数据库
参数:
mgmt_db
描述:
前提是启用了管理插件,在集群中它只会出现在一个节点中。
(8)message store索引
参数:
msg_index
描述:
保存了所有消息的索引,包括那些被交换到磁盘上的消息。
(9)其它ETS表
参数:
other_ets
描述:
除了上面三个集合以外的内存表。
(10)二进制
参数:
binary
描述:
erlang虚拟机所使用的共享二进制数据,消息体的内存消耗包含在这部分。
(11)代码
参数:
code
描述:
代码所消耗的内存,一般为常量。
(12)Atoms
参数:
atom
描述:
atoms消耗的内存,一般为常量。
(13)其它系统内存
参数:
other_system
描述:
Erlang所消耗的其他内存,比如可用文件描述符的统计。
3.RabbitMQ 流控阀值设置
目前官方默认内存流控阀值设置为0.4,即RabbitMQ 进程内存占用到系统总内存的百分之四十生产者会发生流控。
RabbitMQ 流控机制主要是一个自身保护机制,由于 RabbitMQ 是基于Erlang 开发,RabbitMQ 将每个队列设计为一个 Erlang 进程,Erlang 进程GC也是采用分代策略,当新老生代一起参与Major GC时,Erlang虚拟机会新开内存,根据root set将存活的对象拷贝至新空间,这个过程会造成新老内存空间同时存在,极端情况下,一个队列可能短期内需要两倍的内存占用量,所以内存流控阀值设置为0.4相对是一个比较安全的值,设置太高,有可能系统内存被全部占用导致系统进程 kill RabbitMQ进程,设置过低导致内存使用率不高。
二、Erlang 进程内存占用排查
1.进入 Erlang 终端
nqs@nqs-yq-haitao-order-1488355883912:~$ erl
2.查看内存占用
1> erlang:memory().
3.查看进程数量
如果内存占用情况主要为Erlang进程,查询下 Erlang 进程数,确定是否由于过多进程造成。
2> erlang:system_info(process_count).
4.查看进程占用内存信息
基于内存占用降序获取前20条进程记录信息
3> spawn(fun()->etop:start([{output,text},{interval,5},{lines,20},{sort,memory}])end).
注:
output:指定输出方式
interval:内存信息刷新间隔时间
lines:显示内存记录行数
sort:排序规则(上文指令基于内存用量倒排)
5.查看指定进程详情
1> erlang:process_info(pid(0,26,0)).
注:0,26,0 为上图中进程 id,不过由于"."是指令结束字符所以"."替换为","
参数名称 | 描述 |
---|---|
dictionary | 进程字典中所有的数据项 |
registerd_name | 注册的名字 |
status | 进程状态 |
links | 所有链接进程 |
monitored_by | 所有监控当前进程的进程 |
monitors | 所有被当前进程监控的进程 |
trap_exit | 是否捕获exit信号 |
current_function | 当前进程执行的函数,{M, F, A} |
current_location | 进程在模块中的位置,{M, F, A, [{file, FileName}, {line, Num}]} |
current_stacktrace | 以current_location的格式列出堆栈跟踪信息 |
initial_call | 进程初始入口函数,如spawn时的入口函数,{M, F, A} |
memory | 进程占用的内存大小(包含所有堆,栈等),以bytes为单位 |
message_queue_len | 进程邮箱中的待处理消息个数 |
messages | 返回进程邮箱中的所有消息,该调用之前务必通过message_queue_len确认消息条数,否则消息过多时,调用非常危险 |
reductions | 进程规约数 |