Nginx负载均衡


负载均衡简介

在如今的互联网应用中,用户访问量的激增使得单台服务器无法承受巨大的流量负载。为了提高系统的可扩展性和可靠性,负载均衡(Load Balancing)成为了必不可少的技术手段之一。而Nginx,作为一种轻量级、高性能的HTTP和反向代理服务器,常被用作负载均衡器来均衡多个后端服务器之间的流量。今天我们将详细介绍如何通过Nginx部署负载均衡服务。 负载均衡是一种将用户请求均匀分发到多台服务器上的技术,目的是通过多台服务器共同承载流量,以提高整体系统的性能、稳定性和可用性。其主要优势包括:

  • 提高可用性:当一台服务器宕机时,负载均衡器可以将请求分发到其他正常的服务器上,从而避免单点故障。
  • 提高扩展性:可以通过增加更多的服务器节点来处理更高的并发量。
  • 提升性能:均衡分发请求,避免单一服务器资源耗尽,提供更流畅的用户体验。

Nginx 负载均衡策略

Nginx 提供了多种负载均衡策略来分发流量,你可以根据业务需求灵活选择:

  • 轮询(Round Robin)
    • 这是 Nginx 的默认策略。它会按照顺序将请求依次分发给每个服务器,不考虑每个服务器的负载情况。这种方式简单有效,适合服务器性能相似的场景。
  • 最少连接(Least Connections)
    • 该策略将请求分发给当前处理连接数最少的服务器,适合连接数波动较大的场景,如长连接服务。
  • IP 哈希(IP Hash)
    • 通过请求的客户端IP进行哈希运算,将来自同一IP地址的请求分发到同一台服务器上,适合有会话保持需求的场景。
  • 权重(Weight)
    • 为不同的服务器分配权重,Nginx 将根据设置的权重值来分发请求,权重越高的服务器将承担更多的流量,适合服务器性能不均衡的场景。

负载均衡配置

作为代理服务器,一般都需要向上游服务器的集群转发请求。这里的负载均衡是指选择一种策略,尽量把请求平均地分布到每一台上游服务器上。

1.1 upstream 块

语法: upstream name {...} 配置块: http

  • upstream块定义了一个上游服务器的集群,便于反向代理中的 proxy_pass 使用。例如
    upstream backend {
        server backend1.example.com;
        server backend2.example.com;
        server backend3.example.com;
    }

    server {
        location / {
          proxy_pass http://backend;
        }
    }

1.2 server

语法: server name [parameters]; 配置块: upstream

  • server 配置项 指定了一台上游服务器的名字,这个名字可以是域名IP地址端口UNIX句柄等,在其后还可以跟下列参数。
    • weight=number: 设置向这台上游服务器转发的权重,默认为1。
    • max_fails=number: 该选项与 fail_timeout 配合使用,指在 fail_timeout 时间段内,如果向当前的上游服务器转发失败次数超过 number,则认为在当前的 fail_timeout 时间段内这台上游服务器不可用。max fails 默认为1,如果设置为 0,则表示不检查失败次数。
    • fail_timeout=time: fail_timeout 表示该时间段内转发失败多少次后就认为上游服务器暂时不可用,用于优化反向代理功能。它与向上游服务器建立连接的超时时间、读取上游服务器的响应超时时间等完全无关。fail_timeout 默认为10秒。
    • down: 表示所在的上游服务器永久下线,只在使用ip_hash 配置项时才有用
    • backup: 在使用 ip_hash 配置项时它是无效的。它表示所在的上游服务器只是备份服务器,只有在所有的非备份上游服务器都失效后,才会向所在的上游服务器转发请求。
upstream backend {
    server backendl.example.com weight=5; 
    server 127.0.0.1:8080 max_fails=3 fail_timeout=30s;
    server unix:/tmp/backend3;
}

1.3 ip_hash

语法: ip_hash; 配置块: upstream

  • 在有些场景下,我们可能会希望来自某一个用户的请求始终落到固定的一台上游服务器中。例如,假设上游服务器会缓存一些信息,如果同一个用户的请求任意地转发到集群中的任一台上游服务器中,那么每一台上游服务器都有可能会缓存同一份信息,这既会造成资源的浪费,也会难以有效地管理缓存信息。ip_hash 就是用以解决上述问题的,它首先根据客户端的 IP 地址计算出一个 key,将 key 按照 upstream 集群里的上游服务器数量进行取模,然后以取模后的结果把请求转发到相应的上游服务器中。这样就确保了同一个客户端的请求只会转发到指定的上游服务器中。

  • ip_hash与weight(权重)配置不可同时使用。如果 upstream 集群中有一台上游服务器暂时不可用,不能直接删除该配置,而是要 down 参数标识,确保转发策略的一贯性。例如:

    upstream backend {
        ip_hash;
        server  backend1.example.com;
        server  backend2.example.com;
        server  backend3.example.com down;
        server  backend4.example.com;
    }

1.4 least_conn

语法: least_conn; 配置块: upstream

最少连接数算法(Least Connections),这种算法会根据每个后端服务器的当前连接数来决定将请求分发到哪个服务器,从而实现负载均衡。连接数最少的服务器将优先接收新的请求。

http {
    upstream backend {
        # 最小连接数负载均衡算法
        least_conn;

        # 后端服务器列表
        server 192.168.1.100:80;
        server 192.168.1.101:80;
    }

    server {
        listen 80;

        location / {
            proxy_pass http://backend;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
            proxy_set_header X-Forwarded-Proto $scheme;
        }
    }
}

1.5 记录日志时支持的变量

  • 如果需要将负载均衡时的一些信息记录到 access_log 日志中,那么在定义日志格式时可以使用负载均衡功能提供的变量。
变量名 意义
$upstream_addr 处理请求的上游服务器地址
$upstream_cache_status 表示是否命中缓存,取值范围: MISSEXPIREDUPDATINGSTALEHIT
$upstream_status 上游服务器返回的响应中的 HTTP 响应码
$upstream_response_time 上游服务器的响应时间,精度到毫秒
$upstream_http_$HEADER HTTP的头部,如upstream_http_host
log_format timing '$remote_addr - $remote_user [$time_local] $request ' 'upstream_response_time $upstream_response_time' 'msec $msec request_time $request time';

log_format up_head '$remote_addr - $remote_user [$time_local] $request ' 'upstream_http_content_ type $upstream_http_content_type';

2.反向代理基本配置

2.1 proxy_pass

语法: proxy_pass URL; 配置块: location、if

  • 此配置项将当前请求反向代理到 URL 参数指定的服务器上,URL 可以是主机名或 IP 地址加端口的形式,例如:
proxy_pass http://localhost:8000/uri/;

也可以是UNIX句柄:

proxy_pass http://unix:/path/to/backend.socket:/uri/;

还可以如上节负载均衡中所示,直接使用 upstream 块,例如:

    upstream backend {
        ...
    }
    server {
        location / {
            proxy_pass http://backend;
        }
    }

用户可以把HTTP 转换成更安全的 HTTPS,例如:

proxy_pass https://192.168.0.1;

默认情况下反向代理是不会转发请求中的 Host 头部的。如果需要转发,那么必须加上配置:

proxy_set header Host $host;

2.2 proxy method

语法: proxy_method method;

配置块: http、server、location

此配置项表示转发时的协议方法名。例如设置为:

proxy_method POST;

那么客户端发来的 GET 请求在转发时方法名也会改为 POST。

2.3 proxy_hide_header

语法: proxy_hide_header the_header; 配置块: http、server、location

  • Nginx会将上游服务器的响应转发给客户端,但默认不会转发以下HTTP 头部字段: DateServerX-PadX-Accel-*。使用proxy_hide_header 后可以任意地指定哪些HTTP头部字段不能被转发。例如:
proxy_hide_header Cache-Control;
proxy_hide_header MicrosoftofficeWebServer;

2.4 proxy_pass_header

语法: proxy_pass_header the_header;

配置块: http、server、location

  • 与proxy_pass_header功能相反,proxy_pass header 会将原来禁止转发的header设置为允许转发。例如:
proxy_pass_header X-Accel-Redirect;

2.5 proxy_pass_request_body

语法: proxy_pass_request_body on|off; 默认: proxy_pass_request_body on; 配置块: http、server、location

  • 作用为确定是否向上游服务器发送 HTTP 包体部分

2.6 proxy_pass_request_headers

语法: proxy_pass_request_headers on|off; 默认: proxy_pass_request_headers on; 配置块:http、server、location

  • 作用为确定是否转发 HTTP 头部。

2.7 proxy_redirect

语法: proxy_redirect [ default | off | redirect replacement ]; 默认: proxy_redirect default; 配置块: http、server、location

  • 当上游服务器返回的响应是重定向或刷新请求(如HTTP 应码是 301 或者 302)时,proxy_redirect 可以重设 HTTP 头部的 locationrefresh字段。例如,如果上游服务器发出的响应是 302重定向请求,location 字段的URI是 http://1ocalhost:8000/two/some/uri/,那么在下面的配置情况下,实际转发给客户端的location是 http://frontend/one/some/uri/
proxy_redirect http://localhost:8000/two/ http://frontend/one/;
  • 这里还可以使用 ngx-http-core-module 提供的变量来设置新的location字段。例如:
proxy_redirect http://localhost:8000/  http://$host:$server_port/;
  • 也可以省略 replacement 参数中的主机名部分,这时会用虚拟主机名称来填充。例如:
proxy_redirect http://localhost:8000/two/ /one/;

使用 off 参数时,将使 location 或者 refresh 字段维持不变。例如:

proxy_redirect off;
  • 使用默认的 default参数时,会按照 proxy_pass 配置项和所属的 location 配置项重组发往客户端的 location 头部。例如,下面两种配置效果是一样的:
location /one/ {
   proxy_pass http://upstream:port/two/;
   proxy_redirect default;
}

location /one/ {
    proxy_pass http://upstream:port/two/; 
    proxy_redirect http://upstream:port/two/ /one/;
}

2.8 proxy_next_upstream

语法: proxy_next [error | timeout | invalid_header | http_500 | http_502 | http_503 | http_504 | http_404 | off ]; 默认: proxy_next_upstream error timeout; 配置块: http、server、location

  • 此配置项表示当向一台上游服务器转发请求出现错误时,继续换一台上游服务器处理这个请求。上游服务器一旦开始发送应答,Nginx 反向代理服务器会立刻把应答包转发给客户端。因此,一旦 Nginx 开始向客户端发送响应包,之后的过程中若出现错误也是不允许换下一台上游服务器继续处理的。这很好理解,这样才可以更好地保证客户端只收到来自一个上游服务器的应答。proxy_next_upstream的参数用来说明在哪些情况下会继续选择下一台上游服务器转发请求
    • error: 当向上游服务器发起连接、发送请求、读取响应时出错
    • timeout: 发送请求或读取响应时发生超时。
    • invalid_header: 上游服务器发送的响应是不合法的。
    • http_500:上游服务器返回的HTTP 响应码是500
    • http_502:上游服务器返回的HTTP响应码是502
    • http 503:上游服务器返回的HTTP 响应码是503。
    • http _504:上游服务器返回的HTTP 响应码是504。
    • http_404:上游服务器返回的HTTP 响应码是404。
    • off:关闭proxy_next_upstream功能一出错就选择另一台上游服务器再次转发

Nginx的反向代理模块还提供了很多种配置,如设置连接的超时时间、临时文件如何存储,以及最重要的如何缓存上游服务器响应等功能。