监控软件介绍

企业级监控软件

cacti:www.cacti.net 绘图 没有报警 (仙人掌)
nagios:www.nagios.org 报警机制比较完善,不能绘图
zabbix:www.zabbix.com 绘图炫 监控 报警 自我修复
ganglia:
==========================================================

系统监控需求:

对于linux内核所提供的一些程序查看服务器的状态信息不方便,所以出现一些监控软件,这些监控软件不仅可以监控linux主机,windows主机,也可以监控网络设备,如:交换机,路由器,硬件防火墙入侵检测系统等。早期出现的监控软件叫cacti,用于监控网络设备的,后来发现它的展示图像功能很好,所以就用他来监控主机了,cacti能将服务器状态信息以图像的方式展示出来。随着应用的发展,软件不能只局限于看到服务器的状态信息,还需要设定监控值触发报警机制,而cacti本身没有报警的功能,需要借助于插件来实现,但是插件不是很完善,会出现误报的情况,所以后来出现了nagios和zabbix软件。nagios软件能搜集数据,展示图像,本身自带报警功能且配置简单,报警较为准确,支持邮件报警、短信报警(需购买短信网关)。zabbix能搜集数据,展示图像,且支持的报警方式有很多。目前最为流行的监控软件是zabbix,很多IDC机房监控服务器状态信息和网络设备状态信息都用的是zabbix。

监控软件需要具备的功能:
1、收集数据。 1.shell 2.SNMP 3.专用agent
2、保存数据。数据收集过来之后是需要保存起来的
3、图像展示。通过数据进行查看没有图像看的直接
4、报警系统。

收集数据首选是专用的,但是使用SNMP协议相对于其他的有优势,它可以监听物理设备,对于交换机和路由器上是不能装软件的,但是默认情况下SNMP协议是开启的,所以可以通过SNMP协议来监控他们。

SNMP协议

简单网络管理协议早期出现在网络里面,任何厂家的网络设备都支持该协议,故各个监控软件也都支持SNMP协议,从而可以获取被监控端Linux主机、windows主机和网络设备上的数据。
SNMP目前有三个版本:v1 v2 v3。v1使用community团体名进行认证,支持trap陷阱;v2比v1多了一些功能;v3增加了安全机制。通过SNMP协议搜集数据,监控端称之为NMS,被监控端称之为AGENT。双方在搜集数据的时候依赖于社区(为了保证双方是值的信任的节点),其实就是在监控端和被监控端设置同一个明文密码,密码通过允许你监控我,我可以把数据传送给你。SNMP默认团体名为public是ro的,还有一种团体名是private读写的(意味着监控端可以修改被监控端的数据信息,不建议使用,网络设备上有private,linux里面没有)。
SNMP协议启用之后,产生161/udp端口,监控端可以和161端口通讯获取数据信息。默认情况SNMP每隔一段时间轮询一下被监控端,如果被监控端数量比较庞大,那么监控端的压力会增大,监控页面上获取的数据会有延迟,而trap是用来实现被动监控的,由被监控端主动把信息传递到监控端。
使用协议之后采用MIBs库获得数据,最早期的时候用于管理社会上的机制的。例如要管理全球的学生信息、图书馆的书,教育程度的分布等等

MIB库,管理信息库:
中国 1 北京 1 一中 1
美国 2 杭州 2 二中 2
存放OID和监控对象名称的对应关系文件。通过SNMP协议获取某一台主机的状态数据实际上就是在获取那台主机上所支持的MIB库里面的信息,MIB支持获取操作系统的信息,网卡,cpu的信息。

windows主机启用SNMP协议:
windows控制面板——程序和功能——打开或关闭windows功能——里面就由简单网络管理协议(SNMP)——勾选上就可以

linux主机启用SNMP协议:装net-snmp net-snmp-utils软件

常见监控解决方案

早期,网络环境中的设备数量尚且不多的时候,人们需要监控的仅仅是几台服务器、一些交换机以及少量的其他设备。首先就需要有方法将人们关心的各项数据从设备中提取出来,然后再考虑如何集中化的展示出来。
为了满足提取各项数据的需求,互联网工程工作小组(IETF,Internet Engineering Task Force)定义并发布了简单网络管理协议(SNMP)。该协议能够支持网络管理系统,用以监控连接到网络上的各种设备。Linux系统当然也支持该协议。人们可以使用SNMP协议获取主机CPU、内存、磁盘、网卡流量等数据,很多商业网络设备如路由器、交换机等基本也支持SNMP协议。
最初,人们用脚本将获取到的SNMP数据存入数据库中,然后再使用一种名为MRTG的软件根据获取的数据绘制图表来分析数据的变化。MRTG(Multi Router Traffic Grapher),顾名思义,这款软件最初是设计用于监控网络链路流量负载的。它可以用过SNMP获取到设备的流量信息,并根据这些信息绘制成图表并保存为PNG格式的图片,再将这些PNG图片以HTML页面的方式显示给用户。

不过,MRTG展示的页面和图表曲线相对简陋,它在一张图片中最多只能绘制两个数据的变化曲线,并且由于是PNG格式的静态图片,所以无法针对某一时间进行细化展示。为了解决这个问题,人们又开发了RRDTOOL工具。
RRDTOOL(Round Robin Database Tool)是一个强大的绘图引擎。RRDTOOL可以使用自己的环状数据库(RRD)来记录绘图数据,也可以使用关系型数据库,例如MySQL来纪录数据。利用RRDTOOL我们就可以将获取到的SNMP数据通过RRDTOOL进行实时绘图,这么一来,想看什么时候的数据,只要调取那个时间的监控数据,让RRDTOOL帮我们画一张图出来就可以直观又清晰的查看了。目前,几乎所有的开源监控软件都在使用RRDTOOL作为图形绘制引擎。不过,直接使用RRDTOOL绘图操作起来很麻烦。同时,现如今的数据中心动辄成百上千的设备,一个个的去提取、绘制、监控显然是不现实的事情。况且,不同的设备监控的对象和方法也不同。有些数据依靠SNMP也提取不到(例如MySQL查询缓存命中率)。我们迫切的需要一个可以支持多种不同的监控手段,同时具有分类组织图形并且可以按照分类页面的方式展示这些图形的工具。另外,考虑到企业组织结构越来越复杂,参与监控的人员往往属于不同的部门或者工作组,不同的人也应该限定具有不同层级的监控浏览权限。除此之外,还有很多各种各样杂七杂八的需求不一而足。所以,现如今的监控软件不可以再像MRTG那样仅仅画张图就了事,还需要考虑更加丰富的功能。
Cacti 是一套基于PHP、MySQL、SNMP 及RRDTool 开发的监测图形分析工具。它提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结构、主机以及任何一张图,还可以与轻量级目录服务(LDAP)结合进行用户验证,同时也能自己编写模板,功能非常强大完善界面友好。可是随着设备的不断增多,Cacti 的运行机制就不能满足我们的需求了。Cacti 是使用轮询的方式由主服务器向设备发送数据请求来获取设备上状态数据信息的,如果设备不断增多,这个轮询的过程就非常的耗时,轮询的结果就不能即时的反应设备的状态了。

Cacti 监控关注的是对数据的展示,却不关注数据异常后的反馈。如果凌晨3 点的时候设备的某个数据出现异常,除非监控人员在屏幕前发现这个异常变化,否则是没有任何报警机制能够让我们道出现了异常。这个时候我们就需要一种可以根据我们预设阀值报警的工具。自动化监控报警服务有很多,其中商业应用比较昂贵且多以硬件为主,开源自动化监控报警服务中最著名的也是应用最广泛的是Nagios。
Nagios 是一款开源的免费网络监控报警服务,能有效监控Windows、Linux 和Unix 的主机状态,交换机、路由器和防火墙等网络设置,打印机、网络投影、网络摄像等设备。在系统或服务状态异常时发出邮件或短信报警第一时间通知运维人员,在状态恢复后发出正常的邮件或短信通知。Nagios 有完善的插件功能,可以方便的根据应用服务扩展功能。Nagios 可以使用服务-代理(Server-Agent)方式获取主机信息,也可以使用SNMP 方式获取设备信息。使用服务器-代理(Server-Agent)方式在每个主机上运行代理软件,主机上的代理软件主动提交数据信息,可以避免服务器轮询带来的延迟和非实时性等问题。

Nagios 已经可以支持由数万台服务器或上千台网络设备组成的云技术平台的监控,它可以充分发挥自动化运维技术特点在设备和人力资源减少成本。只是Nagios 无法将多个相同应用集群的数据集合起来,也不能监控到集群中特殊节点的迁移和恢复。一个新的监控服务根据这个需求被设计出来,它就是Ganglia。
Ganglia 是UC Berkeley 发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia 的核心包含gmond、gmetad 以及一个Web 前端。主要是用来监控系统性能,如:CPU 、内存、硬盘利用率,I/O 负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用,目前是监控HADOOP 的官方推荐服务。

Ganglia 分为服务器端、客户端和一个Web 前端,其中gmetad 是服务器端,gmond 是客户端。服务器端只有一个,而被监控服务器均安装客户端。Ganglia 采用Internet IPv4 类D 地址中的的组播进行数据请求。gmetad 发送一个请求到一个组播地址,由于使用组播方式gmetad 只需发送一次请求包即可完成对所有gmond 的轮询。然后gmond 通过这个请求将采集到的数据返回给gmetad,gmetad 将数据保存在数据库中,通过RRDTool 绘制图表,然后通过Web 界面展示分类的页面。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,482评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,377评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,762评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,273评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,289评论 5 373
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,046评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,351评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,988评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,476评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,948评论 2 324
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,064评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,712评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,261评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,264评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,486评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,511评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,802评论 2 345