HAProxy 负载均衡实现代理
HAProxy vs Nginx 技术项目
Nginx vs HAProxy vs LVS 负载平衡器优缺点比较
HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,
支持虚拟主机,它是免费、快速并且可靠的一种解决方案
HAProxy特别适用于那些负载特大的web站点, 这些站点通常又需
要会话保持或七层处理。HAProxy运行在当前的硬件上,完全可
以支持数以万计的并发连接。并且它的运行模式使得它可以很简
单安全的整合进您当前的架构中, 同时可以保护你的web服务器不
被暴露到网络上。
1.7.3 2017-02-28
1.7 20170403
1.6 20170404
1.5 20161225
1.4 20160314
1.3 20160314
1.3.15 20150201
1.3.14 20090727
1.2 20080525
1.1 20080525
1.0 20011230
其支持从4层至7层的网络交换,即覆盖所有的TCP协议。就是说,Haproxy 甚至还支持 Mysql 的均衡负载。。
如果说在功能上,能以proxy反向代理方式实现 WEB均衡负载,这样的产品有很多。包括
Nginx,
Nginx(""engine x"") 是一个高性能的 HTTP 和 反向代理 服务器,也是一个 IMAP/POP3/SMTP 代理服务器 。
Nginx是由 Igor Sysoev 为俄罗斯访问量第二的Rambler.ru 站点开发的,它已经在该站点运行超过四年多了。
Igor 将源代码以类BSD许可证的形式发布。自Nginx 发布四年来,Nginx 已经因为它的稳定性、丰富的功能集、
示例配置文件和低系统资源的消耗而闻名了。目前国内各大门户网站已经部署了Nginx,如新浪、网易、腾讯等;
国内几个重要的视频分享网站也部署了Nginx,如六房间、酷6等。新近发现Nginx 技术在国内日趋火热,越来越
多的网站开始部署Nginx。
ApacheProxy
lighttpd,Cheroke
HAProxy version 1.4.0.3 20100226
但其配置简单,拥有非常不错的服务器健康检查功能还有专门的系统状态监控页面,当其代理的后端服务器出现故障,
HAProxy会自动将该服务器摘除,
故障恢复后再自动将该服务器加入
另外, 版本1.3 是处于活跃开发阶段的版本, 它支持如下新特性:
l 内容交换 : 可以根据请求(request)的任何一部分 来选择一组服务器, 比如请求的 URI , Host头(header) ,
cookie , 以及其他任何东西. 当然,对那些静态分离的站点来说,对此特性还有更多的需求。
l 全透明代理 : 可以用 客户端IP地址 或者任何其他地址来连接后端服务器. 这个特性仅在Linux 2.4/2.6内
核打了cttproxy 补丁后才可以使用. 这个特性也使得为某特殊服务器处理部分流量同时又不修改服务器的地址成为可能。
l 基于树的更快的调度器 : 1.2.16以上的版本要求所有的超时都设成同样的值以支持数以万计的全速连接.
这个特性已经移植到1.2.17.
l 内核TCP拼接 : 避免了内核到用户然后用户到内核端的数据拷贝, 提高了吞吐量同时又降低了CPU使用率 .
Haproxy 1.3支持Linux L7SW 以满足在商用硬件上数Gbps 的吞吐的需求。
l 连接拒绝 : 因为维护一个连接的打开的开销是很低的,有时我们很需要限制攻击蠕虫(attack bots),也就是说限
制它们的连接打开从而限制它们的危害。 这个已经为一个陷于小型DDoS攻击的网站开发了而且已经拯救了很多站点。
l 细微的头部处理 : 使得编写基于header的规则更为简单,同时可以处理URI的某部分。
l 快而可靠的头部处理 : 使用完全RFC2616 兼容的完整性检查对一般的请求全部进行分析和索引仅仅需要不到2ms
的时间。
l 模块化设计 : 允许更多人加入进此项目,调试也非常简单. poller已经分离, 已经使得它们的开发简单了很多.
HTTP已经从TCP分离出来了,这样增加新的七层特性变得非常简单. 其他子系统也会很快实现模块化
l 投机I/O 处理 : 在一个套接字就绪前就尝试从它读取数据。poller仅推测哪个可能就绪哪个没有,尝试猜测,
并且如果成功,一些开销很大的系统调用就可以省去了。如果失败,就会调用这些系统调用。已知的使用Linux
epoll()已经净提升起码10%了。
l ACLs : 使用任意规则的任意组合作为某动作的执行条件。
l TCP 协议检查 : 结合ACL来对请求的任意部分进行检查,然后再进行转发。这就可以执行协议验证而不是盲目的
进行转发。比如说允许SSL但拒绝SSH。
l 更多的负载均衡算法 : 现在,动态加权轮循(Dynamic Round Robin),加权源地址哈希(Weighted Source Hash),
加权URL哈希和加权参数哈希(Weighted Parameter Hash)已经实现。其他算法比如Weighted Measured Response
Time也很快会实现。
但要明确一点的,Haproxy 并不是 Http 服务器。以上提到所有带反向代理均衡负载的产品,都清一色是 WEB
服务器。简单说,就是他们能自个儿提供静态(html,jpg,gif..)或动态(php,cgi..)文件的传输以及处理。而
Haproxy 仅仅,而且专门是一款的用于均衡负载的应用代理。其自身并不能提供http服务。
但其配置简单,拥有非常不错的服务器健康检查功能还有专门的系统状态监控页面,当其代理的后端服务器出现故障,
HAProxy会自动将该服务器摘除,故障恢复后再自动将该服务器加入。自1.3版本开始还引入了frontend,backend,frontend
根据任意HTTP请求头内容做规则匹配,然后把请求定向到相关的backend。 Haproxy 单独进行均衡负载的性能最强,超过了Nginx。
然而 Nginx + Haproxy 的搭配性能最弱,应该是跟通过了2层反向代理有关。
所以想用 Haproxy 替代 Nginx 所自带的均衡负载功能将会令性能打折。
但虽然如此 Haproxy 对均衡负载功能远比 Nginx 成熟,例如session粘贴,cookies 引导等都是 nginx 所没有的。
参考以下
https://my.oschina.net/duxuefeng/blog/35232
http://www.cnblogs.com/firewing/archive/2012/11/06/2756553.html