linux服务器性能监控-nmon(二)

读过我之前文章的同学会发现,如果在做服务器性能监控的过程中要一个命令一个命令的敲,那显然非常的麻烦,而且不实际。监控命令只更适用于某些场景下的分析和定位,无法直接形成一些图形化的界面以便我们更直观的分析问题。
Nmon 是一个分析aix和linux性能的免费工具,出自IBM,其采集的数据通过nmon_analyser生成报表,简单直白。

示例图

一、下载

二、运行和使用

本文以centos6操作系统为例。

1.启动nmon

将tar包上传至linux并解压,进入解压文件夹可看到如下内容:

[root@localhost nmon]# ls
AgentV200R001Linux64_20100401.tar.gz  nmon_x86_fedora10    nmon_x86_rhel45  nmon_x86_sles10  nmon_x86_ubuntu810
MonitorAgent                          nmon_x86_opensuse10  nmon_x86_rhel52  nmon_x86_sles9

因为一些依赖包的关系,所以在使用nmon的过程中会遇到不同的问题,建议安装前先执行以下命令:

yum install glibc.i686 ncurses-devel.i686 redhat-lsb -y 

接着启动该工具,在命令行执行

[root@localhost nmon]# ./nmon_x86_rhel52

效果如下

+nmon-12a------[H for help]---Hostname=localhost-----Refresh= 2secs ---08:35.46---------------+
|                                                                                            |
|  ------------------------------       For help type H or ...                               |
|  #    #  #    #   ####   #    #        nmon -?  - hint                                     |
|  ##   #  ##  ##  #    #  ##   #        nmon -h  - full                                     |
|  # #  #  # ## #  #    #  # #  #                                                            |
|  #  # #  #    #  #    #  #  # #       To start the same way every time                     |
|  #   ##  #    #  #    #  #   ##        set the NMON ksh variable                           |
|  #    #  #    #   ####   #    #                                                            |
|  ------------------------------                                                            |
|                                                                                            |
|  Use these keys to toggle statistics on/off:                                               |
|     c = CPU        l = CPU Long-term   - = Faster screen updates                           |
|     m = Memory     j = Filesystems     + = Slower screen updates                           |
|     d = Disks      n = Network         V = Virtual Memory                                  |
|     r = Resource   N = NFS             v = Verbose hints                                   |
|     k = kernel     t = Top-processes   . = only busy disks/procs                           |
|     h = more options                   q = Quit                                            |
|--------------------------------------------------------------------------------------------|
|                                                                                            |

单个字母表示对应监控点的快捷键,只要输入相应的字母,即可显示相应的资源耗用情况,输入c、m、d后显示效果如下(显示了cpu、内存、磁盘的使用情况):

+nmon-12a------[H for help]---Hostname=localhost-----Refresh= 2secs ---08:40.30---------------+
| CPU Utilisation ---------------------------------------------------------------------------|
|                           +-------------------------------------------------+              |
|CPU  User%  Sys% Wait% Idle|0          |25         |50          |75       100|              |
| 1   0.0   0.5   0.0   99.5| >                                               |              |
|                           +-------------------------------------------------+              |
| Memory Stats ------------------------------------------------------------------------------|
|                RAM     High      Low     Swap                                              |
| Total MB       498.7      0.0    498.7   2016.0                                            |
| Free  MB       229.3      0.0    229.3   2016.0                                            |
| Free Percent    46.0%     0.0%    46.0%   100.0%                                           |
|             MB                  MB                  MB                                     |
|                      Cached=    91.3     Active=   137.0                                   |
| Buffers=    12.1 Swapcached=     0.0  Inactive =    82.8                                   |
| Dirty  =     0.0 Writeback =     0.0  Mapped   =    19.3                                   |
| Slab   =    39.8 Commit_AS =   536.2 PageTables=     2.3                                   |
| Disk I/O -----(/proc/diskstats)--------all data is Kbytes per second-----------------------|
|DiskName Busy  Read WriteKB|0          |25         |50          |75       100|              |
|sda        0%    0.0    0.0| >                                               |              |
|sda1       0%    0.0    0.0|>                                                |              |
|sda2       0%    0.0    0.0| >                                               |              |
|dm-0       0%    0.0    0.0| >                                               |              |
|dm-1       0%    0.0    0.0|>                                                |              |
|--------------------------------------------------------------------------------------------|

具体的参数含义在这里就先不做介绍了,如果不理解,请读我前一篇文章。

2.如何使用nmon

[root@localhost nmon]# ./nmon_x86_rhel52 -fT -s 5 -c 5
[root@localhost zww]# ll | grep *.nmon
-rw-r--r--. 1 root root   16719 11月  9 08:57 localhost_161109_0857.nmon

输入命令后,将自动在当前目录生成一个 hostname_timeSeries.nmon 的文件(hostname 为当前见识的服务器的主机名)如: localhost_161109_0857.nmon。
命令的含义是,-f输出文件,-T输出最耗自愿的进程,-s收集数据的时间间隔,-c收集次数。

  • -s 5:每 5 秒进行一次数据采集
  • -c 5: 一共采集5次

如果想在后台运行nmon,可使用nohup:

[root@besttest zww]# nohup ./nmon_x86_rhel52 -fT -s 1 -c 10

问题来了,如果我们在做稳定性测试,系统需要持续监控12小时以上,那么我们生成的nmon文件就会非常大,会远远超出excel表格所能支撑的数据量,我们该怎么办?
解决方案是将nmon命令加入系统定时任务,分时段执行,这样生成的文件就不会太大。一般每小时生成一个nmon文件,1秒采样一次。

[root@localhost nmon]# vi /etc/crontab

在crontab中添加如下内容:

*   */1    *    *     *   ./tmp/nmon/nmon_x86_rhel52 -fT -s 1 -c 3600

/tmp/nmon是我的执行文件所在路径。

3.关闭nmon

若存在后台运行的nmon进程或未运行结束的nmon进程,可通过ps或top等其它命令将进程ID查出,然后通过kill -9 pid杀掉进程。

三、结果分析

在上面,我们通过配置定时任务生成了.nmon文件,在这里我们介绍如何转换结果文件以及转换出来的excel都包含了哪些内容。

1.结果文件转换

使用官方提供的nmon_analyser进行转换,下载地址如下:

将文件下载后,点击带有analyser的excel,点击 Analyse nmon data按钮,选择.nmon文件打开,即可开始转换,转换结束后生成excel文件。
tips:建议使用office excel,因为部分wps版本无法使用该analyser文件。在使用过程中一定要启用宏才可顺利装载和转换文件,office要在信任中心启用宏,而wps下载一个vba模块安装后才能启用宏,具体操作步骤请自行百度。
最终转换结果(部分)如下图所示:

SYS_SUMM
CPU_ALL
DISK_SUMM
MEM

2.指标含义

在转换成功之后,会有很多的表和很多的参数,是不是看到眼花?没关系,下面给大家贴出来,详细介绍了包括每个sheet的含义以及sheet中主要指标的含义。

  • nmon分析文件各sheet含义


    nmon分析文件各sheet含义
  • nmon分析文件详细指标详解


    nmon分析文件详细指标详解

看到这里,大家也发现了,对于这些表,如果逐个仔细的看是不切实际的,我们应该把握重点,找到关键点,顺着关键点往下看。比如在SYS_SUM中明显看到CPU高,那么之后我们关注的sheet应该是CPU 以及IO相关的sheet,查看到底是sys占用CPU高还是user占用CPU高,再顺着CPU和IO相关的这些表进一步分析,进一步查看对应的表格,以此类推,而不是全都看。

  • nmon关键指标列表


    nmon关键指标列表

3.小结

对于nmon,在掌握了它的结果文件中参数的含义之后,按照文中提供的分析思路,抓住关键点一步一步进行分析,进而能够确定系统层面所表现出来的瓶颈所在。至于更进一步的分析瓶颈出现的原因,那是后面的内容了,nmon的工作到这里就可以结束了。
此外,还有几点nmon的分析经验:

  • 在观察曲线变化时
    应关注一些有明显变化(很高或很低)的时间点,系统在做哪些操作,因为这可能是一个隐患,必须了解清楚。
  • 关于CPU
    多核CPU如果只有一个CPU使用率高,说明程序使用CPU不合理,需要调整。
  • 关于磁盘
    Disk %Busy 最好不要持续超过20%。
  • 关于网络
    首先默认性能测试是内网,其次加上现在的网卡、路由都是千兆万兆甚至更高级别的设备,默认不关注NET的表格,除非你所做的系统对网络的要求特别高,否则一般不必关注它。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容