公司新做了个双机房,在把老机房流量完全切到新机房后,发现应用的响应耗时逐渐增加了。首先检查了应用的健康状态,通过检查日志发现能够正常响应,但是所有接口的耗时都明显增加了。由此开始怀疑是不是与数据库的网络出现问题了,但经过网络同事排查,并没有发现问题。因此考虑是不是负载均衡的问题,最初F5使用的负载均衡算法是“基于原地址”的,这样是考虑为了保持会话,那么发现有很大的流量被导入到了其中一台,因此那台机器的响应耗时也比其他的高。之后因为是底层服务应用,没有会话,因此就将负载均衡算法调整到了“轮询”,之后发现原来耗时高的那台服务器耗时逐渐降下来了,但另外一台又开始高上去了,最后又将算法调整到了“按最小连接数”,发现所有服务器的耗时开始均匀了,但都有所提高。之后,检查服务器的资源情况发现,老机房的是三台物理机,且每台是24核cpu,48g内存,而新机房是三台虚拟机,4核cpu,32g内存,最后为新机房增加cpu到16核,解决问题。
记一次应用响应慢的排查过程
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...