编译自:
load-balancer
本文讲述如何配置 nginx 为 HTTP 负载均衡调度器。
目录:
- 概述
- 将访问流量分发到一组服务器
- 选择调度算法
- 设置权重
- 服务器慢启动
- 启用连接保持
- 限制连接数
- 被动的健康监测
- 主动的健康监测
- 在多个 worker 进程间共享数据
- 使用 DNS 配置负载均衡
- 对 Microsoft Exchange Servers 进行负载均衡
- 在运行时修改配置
概述
负载均衡是普遍使用的技术,使用负载均衡架构有很多优点:
- 可提高资源利用率
- 增加系统吞吐量的上限
- 降低响应延迟
- 可保证容错的配置
这个视频 讲述了利用 nginx 构建大规模,高可靠的 web 服务所用到的技术。
nginx 的 HTTP 负载均衡有多种部署场景:very efficient HTTP load balancer。
将访问流量分发到一组服务器
首先使用 upstream 指令定义一组服务器,upstream 指令应定义在 http 上下文中。
组内的服务使用 server 指令定义(不要跟定义虚拟服务器的 server 区块混淆)。下面的例子中,定义了一个组名为 backend 的服务器:
http {
upstream backend {
server backend1.example.com weight=5;
server backend2.example.com;
server 192.0.0.1 backup;
}
}
要将请求转发给这一组服务器,使用 proxy_pass 指令指定该组服务器(or fastcgi_pass, memcached_pass, uwsgi_pass, scgi_pass depending on the protocol):
server {
location / {
proxy_pass http://backend;
}
}
这两个配置合起来是这样的:
http {
upstream backend {
server backend1.example.com;
server backend2.example.com;
server 192.0.0.1 backup;
}
server {
location / {
proxy_pass http://backend;
}
}
}
此例中,backend 服务器组有两个服务器运行相同的应用,另一个作为 backup 服务器,当其他两个服务器都失效时,将请求转发给 backup 服务器。
选择调度算法
nginx 支持 4 种调度算法:
-
“轮询” 算法:根据服务器的权重,请求被依次分发给每个后端服务器,权重高的服务器分配更多的请求。这个算法是默认算法(没有指令用于启用 轮询 算法):
upstream backend { server backend1.example.com; server backend2.example.com; }
-
“最小连接数算法”:请求被分发给 当前活动连接数 最少的服务器,并考虑权重:
upstream backend { least_conn; server backend1.example.com; server backend2.example.com; }
-
“ip_hash算法”:根据请求的源地址IP,决定发送给哪一个服务器。ip_hash 算法使用 IPv4 地址的前三个十进制地址段,IPv6 的整个地址段计算 hash 值。该算法可保证来自同一个地址的请求被转发至同一个后端服务器,除非该后端服务失效。
upstream backend { ip_hash; server backend1.example.com; server backend2.example.com; }
如果需要将一个后端服务器暂时移除,可将其标记为 down。本该转发给该服务器的请求,将被自动转发给组内的下一个服务器。
upstream backend { server backend1.example.com; server backend2.example.com; server backend3.example.com down; }
-
普通的hash算法:用自定义的 key 计算 hash 值。key 可以是文本、变量或变量与文本的组合。例如:key 可以是 IP源地址、端口 或者 URI:
upstream backend { hash $request_uri consistent; server backend1.example.com; server backend2.example.com; }
参数 consistent 是可选的,它是 hash 指令的参数,用于开启 ketama 持久 hash 负载均衡。请求将基于用户自定义的 key 计算出的 hash 值进行分发。如果后端服务器组中添加或者移除一个服务器,只有少部分的 key 被重新映射。当后端服务器是缓存服务器或其他关心连接状态的服务器时,这种算法对缓存命中的影响会最小化。
设置权重
前面讲过,nginx 默认使用 轮询 算法,根据权重分发请求。server 指令的参数 weight 用于设置服务器的权重,默认为 1:
upstream backend {
server backend1.example.com weight=5;
server backend2.example.com;
server 192.0.0.1 backup;
}
此例中,第一个服务器权重为 5,其他权重为 1,第三个服务器为备份服务器,除非其他服务器都失效,否则 nginx 不会分发请求给它。这样的话,每 6 个请求中,有 5 个会分发给第一个服务器,有 1 个分发给第二个服务器。
服务器慢启动
商业版 nginx 功能
启用连接保持
商业版 nginx 功能
限制连接数
商业版 nginx 功能
被动的健康监测
nginx 所实现的反向代理包含“被动”的服务器健康检测功能。
如果 nginx 对于后端服务器的检查,收到了包含错误的失败响应,nginx 将其标记为 failed,
并且在一段时间内不再分发请求给该服务器。
max_fail 指令用于设置:在 fail_timeout 期间内,发生几次连续失败检测,才认定该服务器为失效。max_fail 默认设置为 1。当设置为 0,意味着不对该服务器进行健康检查。
fail_timeout 也定义了在多久没有收到来自应用服务器的响应后,将其标记为 failed。默认值为 10s
当一个服务器被标记为 failed,等过了 fail_timeout 时间之后,nginx 又 开始尝试分发用户请求给该服务器,以测试该服务器是否可正常服务,如果成功,该服务器被标记为 live。
upstream backend {
server backend1.example.com;
server backend2.example.com max_fails=3 fail_timeout=30s;
server backend3.example.com max_fails=2;
}
要注意的是,如果在 upstream 组内只有一个服务器,max_fails,fail_timeout 参数将被忽略,这个服务器永远不会被认为失效。
以下是商业版 nginx 功能,暂时不做叙述。
主动的健康监测
在多个 worker 进程间共享数据
使用 DNS 配置负载均衡
对 Microsoft Exchange Servers 进行负载均衡
在运行时修改配置
版权信息:
本文编译自 nginx.com