集群.md 9.2 KB
Newer Older
C
CyC2018 已提交
1 2 3 4 5 6 7 8 9 10 11 12
<!-- GFM-TOC -->
* [一、负载均衡](#一负载均衡)
    * [负载均衡算法](#负载均衡算法)
    * [转发实现](#转发实现)
* [二、集群下的 Session 管理](#二集群下的-session-管理)
    * [Sticky Session](#sticky-session)
    * [Session Replication](#session-replication)
    * [Session Server](#session-server)
<!-- GFM-TOC -->


# 一、负载均衡
C
CyC2018 已提交
13

C
CyC2018 已提交
14
集群中的应用服务器(节点)通常被设计成无状态,用户可以请求任何一个节点。
C
CyC2018 已提交
15 16 17 18 19

负载均衡器会根据集群中每个节点的负载情况,将用户请求转发到合适的节点上。

负载均衡器可以用来实现高可用以及伸缩性:

C
CyC2018 已提交
20 21
- 高可用:当某个节点故障时,负载均衡器会将用户请求转发到另外的节点上,从而保证所有服务持续可用;
- 伸缩性:根据系统整体负载情况,可以很容易地添加或移除节点。
C
CyC2018 已提交
22

C
CyC2018 已提交
23
负载均衡器运行过程包含两个部分:
C
CyC2018 已提交
24

C
CyC2018 已提交
25 26
1. 根据负载均衡算法得到转发的节点;
2. 进行转发。
C
CyC2018 已提交
27

C
CyC2018 已提交
28
## 负载均衡算法
C
CyC2018 已提交
29

C
CyC2018 已提交
30
### 1. 轮询(Round Robin)
C
CyC2018 已提交
31 32 33

轮询算法把每个请求轮流发送到每个服务器上。

C
CyC2018 已提交
34
下图中,一共有 6 个客户端产生了 6 个请求,这 6 个请求按 (1, 2, 3, 4, 5, 6) 的顺序发送。(1, 3, 5) 的请求会被发送到服务器 1,(2, 4, 6) 的请求会被发送到服务器 2。
C
CyC2018 已提交
35

C
CyC2018 已提交
36
<div align="center"> <img src="pics/b02fcffd-ed09-4ef9-bc5f-8f0e0383eb1a.jpg"/> </div><br>
C
CyC2018 已提交
37

C
CyC2018 已提交
38
该算法比较适合每个服务器的性能差不多的场景,如果有性能存在差异的情况下,那么性能较差的服务器可能无法承担过大的负载(下图的 Server 2)。
C
CyC2018 已提交
39

C
CyC2018 已提交
40
<div align="center"> <img src="pics/73c72e75-193c-4092-aa43-b9c6703c4a22.jpg"/> </div><br>
C
CyC2018 已提交
41

C
CyC2018 已提交
42
### 2. 加权轮询(Weighted Round Robbin)
C
CyC2018 已提交
43 44 45

加权轮询是在轮询的基础上,根据服务器的性能差异,为服务器赋予一定的权值,性能高的服务器分配更高的权值。

C
CyC2018 已提交
46
例如下图中,服务器 1 被赋予的权值为 5,服务器 2 被赋予的权值为 1,那么 (1, 2, 3, 4, 5) 请求会被发送到服务器 1,(6) 请求会被发送到服务器 2。
C
CyC2018 已提交
47

C
CyC2018 已提交
48
<div align="center"> <img src="pics/92691356-4f7a-46ec-9921-13055d3dcb12.jpg"/> </div><br>
C
CyC2018 已提交
49

C
CyC2018 已提交
50
### 3. 最少连接(least Connections)
C
CyC2018 已提交
51 52 53

由于每个请求的连接时间不一样,使用轮询或者加权轮询算法的话,可能会让一台服务器当前连接数过大,而另一台服务器的连接过小,造成负载不均衡。

C
CyC2018 已提交
54
例如下图中,(1, 3, 5) 请求会被发送到服务器 1,但是 (1, 3) 很快就断开连接,此时只有 (5) 请求连接服务器 1;(2, 4, 6) 请求被发送到服务器 2,只有 (2) 的连接断开,此时 (6, 4) 请求连接服务器 2。该系统继续运行时,服务器 2 会承担过大的负载。
C
CyC2018 已提交
55

C
CyC2018 已提交
56
<div align="center"> <img src="pics/8089a19a-6239-47a0-bf69-54203117d4dc.jpg"/> </div><br>
C
CyC2018 已提交
57 58 59

最少连接算法就是将请求发送给当前最少连接数的服务器上。

C
CyC2018 已提交
60
例如下图中,服务器 1 当前连接数最小,那么新到来的请求 6 就会被发送到服务器 1 上。
C
CyC2018 已提交
61

C
CyC2018 已提交
62
<div align="center"> <img src="pics/181edd46-e640-472a-9119-a697de0d2a82.jpg"/> </div><br>
C
CyC2018 已提交
63

C
CyC2018 已提交
64
### 4. 加权最少连接(Weighted Least Connection)
C
CyC2018 已提交
65 66 67

在最少连接的基础上,根据服务器的性能为每台服务器分配权重,再根据权重计算出每台服务器能处理的连接数。

C
CyC2018 已提交
68
### 5. 随机算法(Random)
C
CyC2018 已提交
69 70 71 72 73

把请求随机发送到服务器上。

和轮询算法类似,该算法比较适合服务器性能差不多的场景。

C
CyC2018 已提交
74
<div align="center"> <img src="pics/67173c9f-ac87-496a-bd0a-0b1a5cfa735a.jpg"/> </div><br>
C
CyC2018 已提交
75

C
CyC2018 已提交
76
### 6. 源地址哈希法 (IP Hash)
C
CyC2018 已提交
77

C
CyC2018 已提交
78
源地址哈希通过对客户端 IP 计算哈希值之后,再对服务器数量取模得到目标服务器的序号。
C
CyC2018 已提交
79

C
CyC2018 已提交
80
可以保证同一 IP 的客户端的请求会转发到同一台服务器上,用来实现会话粘滞(Sticky Session)
C
CyC2018 已提交
81

C
CyC2018 已提交
82
<div align="center"> <img src="pics/9d3c6bfb-4c4c-4b77-9410-56b3f82106d1.jpg"/> </div><br>
C
CyC2018 已提交
83

C
CyC2018 已提交
84
## 转发实现
C
CyC2018 已提交
85

C
CyC2018 已提交
86
### 1. HTTP 重定向
C
CyC2018 已提交
87

C
CyC2018 已提交
88
HTTP 重定向负载均衡服务器使用某种负载均衡算法计算得到服务器的 IP 地址之后,将该地址写入 HTTP 重定向报文中,状态码为 302。客户端收到重定向报文之后,需要重新向服务器发起请求。
C
CyC2018 已提交
89 90 91

缺点:

C
CyC2018 已提交
92 93
- 需要两次请求,因此访问延迟比较高;
- HTTP 负载均衡器处理能力有限,会限制集群的规模。
C
CyC2018 已提交
94 95 96

该负载均衡转发的缺点比较明显,实际场景中很少使用它。

C
CyC2018 已提交
97
<div align="center"> <img src="pics/131550414680831.gif"/> </div><br>
C
CyC2018 已提交
98

C
CyC2018 已提交
99
### 2. DNS 域名解析
C
CyC2018 已提交
100

C
CyC2018 已提交
101
在 DNS 解析域名的同时使用负载均衡算法计算服务器 IP 地址。
C
CyC2018 已提交
102 103 104

优点:

C
CyC2018 已提交
105
- DNS 能够根据地理位置进行域名解析,返回离用户最近的服务器 IP 地址。
C
CyC2018 已提交
106 107 108

缺点:

C
CyC2018 已提交
109
- 由于 DNS 具有多级结构,每一级的域名记录都可能被缓存,当下线一台服务器需要修改 DNS 记录时,需要过很长一段时间才能生效。
C
CyC2018 已提交
110

C
CyC2018 已提交
111
大型网站基本使用了 DNS 做为第一级负载均衡手段,然后在内部使用其它方式做第二级负载均衡。也就是说,域名解析的结果为内部的负载均衡服务器 IP 地址。
C
CyC2018 已提交
112

C
CyC2018 已提交
113
<div align="center"> <img src="pics/141550414746389.gif"/> </div><br>
C
CyC2018 已提交
114

C
CyC2018 已提交
115
### 3. 反向代理服务器
C
CyC2018 已提交
116 117 118

反向代理服务器位于源服务器前面,用户的请求需要先经过反向代理服务器才能到达源服务器。反向代理可以用来进行缓存、日志记录等,同时也可以用来做为负载均衡服务器。

C
CyC2018 已提交
119
在这种负载均衡转发方式下,客户端不直接请求源服务器,因此源服务器不需要外部 IP 地址,而反向代理需要配置内部和外部两套 IP 地址。
C
CyC2018 已提交
120 121 122

优点:

C
CyC2018 已提交
123
- 与其它功能集成在一起,部署简单。
C
CyC2018 已提交
124 125 126

缺点:

C
CyC2018 已提交
127
- 所有请求和响应都需要经过反向代理服务器,它可能会成为性能瓶颈。
C
CyC2018 已提交
128

C
CyC2018 已提交
129
### 4. 网络层
C
CyC2018 已提交
130

C
CyC2018 已提交
131
在操作系统内核进程获取网络数据包,根据负载均衡算法计算源服务器的 IP 地址,并修改请求数据包的目的 IP 地址,最后进行转发。
C
CyC2018 已提交
132 133 134 135 136

源服务器返回的响应也需要经过负载均衡服务器,通常是让负载均衡服务器同时作为集群的网关服务器来实现。

优点:

C
CyC2018 已提交
137
- 在内核进程中进行处理,性能比较高。
C
CyC2018 已提交
138 139 140

缺点:

C
CyC2018 已提交
141
- 和反向代理一样,所有的请求和响应都经过负载均衡服务器,会成为性能瓶颈。
C
CyC2018 已提交
142

C
CyC2018 已提交
143
### 5. 链路层
C
CyC2018 已提交
144

C
CyC2018 已提交
145
在链路层根据负载均衡算法计算源服务器的 MAC 地址,并修改请求数据包的目的 MAC 地址,并进行转发。
C
CyC2018 已提交
146

C
CyC2018 已提交
147
通过配置源服务器的虚拟 IP 地址和负载均衡服务器的 IP 地址一致,从而不需要修改 IP 地址就可以进行转发。也正因为 IP 地址一样,所以源服务器的响应不需要转发回负载均衡服务器,可以直接转发给客户端,避免了负载均衡服务器的成为瓶颈。
C
CyC2018 已提交
148

C
CyC2018 已提交
149
这是一种三角传输模式,被称为直接路由。对于提供下载和视频服务的网站来说,直接路由避免了大量的网络传输数据经过负载均衡服务器。
C
CyC2018 已提交
150

C
CyC2018 已提交
151
这是目前大型网站使用最广负载均衡转发方式,在 Linux 平台可以使用的负载均衡服务器为 LVS(Linux Virtual Server)。
C
CyC2018 已提交
152 153 154

参考:

C
CyC2018 已提交
155 156
- [Comparing Load Balancing Algorithms](http://www.jscape.com/blog/load-balancing-algorithms)
- [Redirection and Load Balancing](http://slideplayer.com/slide/6599069/#)
C
CyC2018 已提交
157

C
CyC2018 已提交
158
# 二、集群下的 Session 管理
C
CyC2018 已提交
159

C
CyC2018 已提交
160
一个用户的 Session 信息如果存储在一个服务器上,那么当负载均衡器把用户的下一个请求转发到另一个服务器,由于服务器没有用户的 Session 信息,那么该用户就需要重新进行登录等操作。
C
CyC2018 已提交
161

C
CyC2018 已提交
162
## Sticky Session
C
CyC2018 已提交
163

C
CyC2018 已提交
164
需要配置负载均衡器,使得一个用户的所有请求都路由到同一个服务器,这样就可以把用户的 Session 存放在该服务器中。
C
CyC2018 已提交
165 166 167

缺点:

C
CyC2018 已提交
168
- 当服务器宕机时,将丢失该服务器上的所有 Session。
C
CyC2018 已提交
169

C
CyC2018 已提交
170
<div align="center"> <img src="pics/6aee49d3-f6c6-4d14-a81a-080c290de875.jpg"/> </div><br>
C
CyC2018 已提交
171

C
CyC2018 已提交
172
## Session Replication
C
CyC2018 已提交
173

C
CyC2018 已提交
174
在服务器之间进行 Session 同步操作,每个服务器都有所有用户的 Session 信息,因此用户可以向任何一个服务器进行请求。
C
CyC2018 已提交
175 176 177

缺点:

C
CyC2018 已提交
178 179
- 占用过多内存;
- 同步过程占用网络带宽以及服务器处理器时间。
C
CyC2018 已提交
180

C
CyC2018 已提交
181
<div align="center"> <img src="pics/7f403a7a-5228-42c0-af1c-b21635c77016.jpg"/> </div><br>
C
CyC2018 已提交
182

C
CyC2018 已提交
183
## Session Server
C
CyC2018 已提交
184

C
CyC2018 已提交
185
使用一个单独的服务器存储 Session 数据,可以使用传统的 MySQL,也使用 Redis 或者 Memcached 这种内存型数据库。
C
CyC2018 已提交
186 187 188

优点:

C
CyC2018 已提交
189
- 为了使得大型网站具有伸缩性,集群中的应用服务器通常需要保持无状态,那么应用服务器不能存储用户的会话信息。Session Server 将用户的会话信息单独进行存储,从而保证了应用服务器的无状态。
C
CyC2018 已提交
190 191 192

缺点:

C
CyC2018 已提交
193
- 需要去实现存取 Session 的代码。
C
CyC2018 已提交
194

C
CyC2018 已提交
195
<div align="center"> <img src="pics/27fce0c6-8262-4d11-abb4-243faa2a2eef.jpg"/> </div><br>
C
CyC2018 已提交
196 197 198

参考:

C
CyC2018 已提交
199
- [Session Management using Spring Session with JDBC DataStore](https://sivalabs.in/2018/02/session-management-using-spring-session-jdbc-datastore/)
C
CyC2018 已提交
200

C
CyC2018 已提交
201 202 203 204 205 206 207




<div align="center">欢迎关注公众号,获取最新文章!</div>


C
CyC2018 已提交
208
<div align="center"><img width="180px" src="https://cyc-1256109796.cos.ap-guangzhou.myqcloud.com/%E5%85%AC%E4%BC%97%E5%8F%B7.jpg"></img></div>