Q:用Zabbix怎么去监控IBM的power服务器(硬件方面的)
A:硬件监控,ipmi 和SNMP,带外管理口集成
Q:ipmi获取数据有时候回拉不到
A:ipmi的监控zabbix低版本的的确轮训会很差,有这个问题,Zabbix在升级版本中也一直对这块做了优化,尽量用高版本的Zabbix
Q:ipmi 监控IBM服务器硬件的时候经常获取不到数据,监控效果很差
A:是的,Zabbix的每个版本都有所优化,ipmi也有相应的配置参数,相对调整也可以加快轮训
Q:业务监控怎么做的
A:我们是分两层做的,一个业务本身可用性监控,一个是依赖监控,然后建立关系
Q:有用容器做Zabbix-server进程的案例吗?
A:有,做过
Q:业务数据怎么做
A:业务数据需要单独做,我们通常是独立做一个应用再与我们的平台集成,集成主要在显示层
Q:Oracle的监控,能详细说说吗
A:我们让DBA独立写的监控脚本,放弃了orabbix
Q:zabbix案例中最多监控多少设备?实施
A:看item
Q:你们代码开源了吗?
A:我们研发了很久,投入很大,代码暂时不开源,计划明年开放一部分功能
Q:老师你好,能讲讲Zabbix对docker容器的监控方案吗?
A:基本:运行状态数量、统计数量、版本、暂停状态数量、停止状态数量
自动发现:IO读写操作字节数、容器状态、CPU使用率百分比、磁盘使用、内存限制值、内存使用率、网络收发字节、总缓存、交换分区、运行时间等等
Q:Zabbix Server作为监控处理中心,怎么做高可用?
A:WEB层,DB层,Proxy,层层实现,建议做一层冷备
Q:请问,如何做预警?
A:3.0以上就已经有这个功能了,通过类似Forecast这样的函数实现,Forecast
Q:这两个函数效果一般,有没有更好的办法?
A:原生的只要这两个,可以结合多种表达式做优化。
Q:监控触发报警的阀值,能根据历史采样数据做到动态设置吗
A:现在还不行,trigger还是静态的,需要做二次开发
Q:您好!如何把不同的磁盘分区报警发给不同的人,如WebLogic分区告警发给中间件管理员,oracle分区报警发给数据库管理员,有什么好办法吗?
A:通过告警和报表订阅实现,Zabbix原生还没有
Q:容器上跑Zabbix-server的坑能讲讲吗?
A:我们2015年用docker跑过,发现了一些问题,比如说JDBC当时没有提供,监控不了数据库,最近的版本还没有尝试。
Q:Zabbix-server的高可用,一般用什么组件实现?zookeeper?keepalive?还是其他的?
A:我们用keepalive
Q:刚才你提到的IBM的小机的带外管理口是指HMC管理口吗
A:是的,拿Zabbix监控硬件需要掌握原厂的MIB库
Q:请介绍下如何做告警收敛的?
A:我们做了管理上的收敛,Zabbix原生可以配置告警依赖,另外触发器事件模式配置单重等,计划未来在实践不尝试去做告警的智能收敛,这个步骤我们会相对谨慎,宁可适当多发,也不漏发,避免影响监控的覆盖率和准确率
Q:监控触发报警的阀值,能根据历史采样数据做到动态设置吗,有结合一些数据挖掘算法的案例吗
A:需要二开
Q:Zabbix和自动化部署工具,如salt集成有这方面的经验吗?
A:做过一些测试,使用salt自动部署需要解决的问题
1. rpm包的打包(这个问题不大,官方有提供)
2. rpm 安装(pkg模块)
3. 配置文件调整(file模块)
4. 服务自启动(service)
5. 配置文件的适配(使用salt的pillar实现)
基本上涉及salt的pkg(包管理模块)、file(文件管理模块)、service(服务管理模块)、pillar模块这四个模块。
Q:Zabbix的版本升级有没有坑?
A:按官方提示操作,逐渐升级版本
1. 不建议跨版本升级,因为版本间可能有表字段的变更,版本跨越太大可能导致系统无法运行
2. 如果非要跨版本升级的话,建议将主机和模板导出,部署完再做导入
3. 如果不是研究的话,版本升级不建议太激进