对于我们做运维的来说,监控是最基本的东西,不过在初创公司很多计划是跟不上项目架构变化的,项目中会不断加入各种服务和组件,监控指标也大都不太相同,令人头痛。
幸好终于解放了一些...
最近公司微服务拆分的速度越来越快,很多小服务都有单独的存储和中间件(redis,cassandra,mysql,elastic search,kafka,rabbitmq), 针对服务的metric和中间件的无侵入的监控也越来越复杂, 刚开始大家都在想是不是需要自己写脚本收集指标。
最近偶然发现了 signalfx 提供了很多 collected 收集的各种中间件的 metrics, 最棒的是他们的github docs里还给出了他们在产品里提供的监控性能指标和非常详细的解释(url: https://github.com/signalfx/integrations/tree/master/collectd-elasticsearch/docs),看到这些参数后就觉得这个正符合我们的监控需求,然后下载,安装,三下五除二,10分钟就把metrics 显示到了 grafana 上,我在DataDog上也看了很多关于这些中间件的metrics说明,但是确没有像signalfx这样系统的整理并且把collected相关插件开源出来,million thanks for signalfx!!!