前言
传统虚机监控一般采用类似Zabbix的方案,但容器出现之后,再使用Zabbix agent来采集数据的话就显得有些吃力了,如果每个容器都像OS那样监控,则metric数量将会非常巨大,而且这些数据很可能几分钟之后就没有意义了(容器已经停止或漂移),且容器的指标汇总更应该是按照APP甚至POD维度。
如果只是过渡方案,或者想将容器监控统一到公司现有的Zabbix中,可以参考zabbix-docker-monitoring,有很多模板如:zabbix-template-app-docker.xml
参考文章:https://segmentfault.com/a/1190000007568413
Docker原生监控
常用方式:
- docker ps/top/logs
- docker stats
- docker Remote API
- docker 伪文件系统
docker stats
该命令默认以流式方式输出,如果想打印出最新的数据并立即退出,可以使用 no-stream=true 参数。
可以指定一个已停止的容器,但是停止的容器不返回任何数据。
例如:
Remote API
Docker Remote API是一个取代远程命令行界面(rcli)的REST API
如:curl http://127.0.0.1:4243/containers/json
可以使用API来获取监控数据并集成到其他系统,注意不要给Docker daemon带来性能负担,如果你一台主机有很多容器,非常频繁的采集可能会大量占据CPU
伪文件系统
以下操作的环境为:Centos7系统 docker17.03版本
docker stats的数据来自于/sys/fs/cgroup下的文件
mem usage那一列的值,来自于
/sys/fs/cgroup/memory/docker/[containerId]/memory.usage_in_bytes
如果没限制内存,Limit = machine_mem,否则来自于
/sys/fs/cgroup/memory/docker/[id]/memory.limit_in_bytes
内存使用率 = memory.usage_in_bytes/memory.limit_in_bytes
一般情况下,cgroup文件夹下的内容包括CPU、内存、磁盘、网络等信息:
如memory下的文件有:
几个常用的指标含义:
memory.stat中的信息是最全的:
更多资料参考:cgroup memory
原理分析:Libcontainer 深度解析
总结
优缺点:
- 优点:原生,很方便的看到当前宿主机上所有容器的CPU、内存、网络流量等数据。
- 缺点:只能统计当前宿主机的所有容器,数据是实时的,没有存储,没有报警,没有可视化。
备注:
- 1.如果你没有限制容器内存,那么docker stats将显示您的主机的内存总量。但它并不意味着你的每个容器都能访问那么多的内存
- 2.默认时stats命令会每隔1秒钟刷新一次,如果只看当前状态:docker stats --no-stream
- 3.指定查看某个容器的资源可以指定名称或PID: docker stats --no-stream registry 1493
本文为容器监控实践系列文章,完整内容见:container-monitor-book