README.md 8.0 KB
Newer Older
Z
zhouzj 已提交
1
# IdGenerator  SnowFlake 雪花算法 原生多语言版本 顶尖优化 超强效能
Z
init  
zhouzj 已提交
2

Z
edit  
zhouzj 已提交
3
## 介绍
Z
zhouzj 已提交
4

yitter's avatar
yitter 已提交
5
1.一个全新的雪花漂移算法,使生成的ID更短、速度更快。 
Z
zhouzj 已提交
6

Z
zhouzj 已提交
7
2.核心在于缩短ID长度的同时,还能拥有极高瞬时并发处理量(保守值 50W/0.1s)。 
Z
zhouzj 已提交
8

Z
zhouzj 已提交
9
3.原生支持 C#/Java/Go/Rust/C 等语言,并由 Rust 提供 PHP、Python、Node.js、Ruby 等语言多线程安全调用库(FFI)。
Z
edit  
zhouzj 已提交
10

Z
zhouzj 已提交
11 12 13 14 15 16 17

## 技术支持

开源地址:https://gitee.com/yitter/idgenerator

QQ群:646049993

Z
zhouzj 已提交
18 19
## 需求来源

Z
zhouzj 已提交
20
1.作为架构设计的你,想要解决数据库主键唯一的问题,特别是在分布式系统多数据库的时候。
Z
zhouzj 已提交
21

Z
zhouzj 已提交
22
2.你希望这个主键是用最少的存储空间,索引速度更快,Select、Insert 和 Update 更迅速。
Z
zhouzj 已提交
23

Z
zhouzj 已提交
24
3.你要考虑在分库分表(合库合表)时,主键值可直接使用,并能反映业务时序。
Z
zhouzj 已提交
25

Z
zhouzj 已提交
26
4.如果这样的主键值太长,超过前端 JS Number 类型最大值,须把 Long 型转换为 String 型,你会觉得有点沮丧。
Z
zhouzj 已提交
27

Z
zhouzj 已提交
28
5.哪怕 Guid 能自增,但占用空间大,索引速度慢,所以你也不想用它。
Z
zhouzj 已提交
29

Z
zhouzj 已提交
30
6.你的应用实例可能超过50个,每个并发请求可达10W/s。
Z
zhouzj 已提交
31

Z
zhouzj 已提交
32 33
7.在容器环境部署应用(水平扩展、自动伸缩)。

Z
zhouzj 已提交
34 35 36
8.你可不想 Id 生成器依赖 redis 的自增操作。

9.你希望系统运行 100 年以上。
Z
zhouzj 已提交
37 38


Z
zhouzj 已提交
39
## 传统算法问题
Z
zhouzj 已提交
40 41 42

1.生成的ID太长。

Z
zhouzj 已提交
43
2.瞬时并发量不够。
Z
zhouzj 已提交
44

Z
zhouzj 已提交
45
3.不能解决时间回拨问题。
Z
zhouzj 已提交
46

Z
zhouzj 已提交
47
4.不支持后补生成前序ID。
Z
zhouzj 已提交
48

Z
zhouzj 已提交
49
5.依赖外部存储系统。
Z
zhouzj 已提交
50 51


Z
zhouzj 已提交
52
## 新算法特点
Z
edit  
zhouzj 已提交
53

Z
zhouzj 已提交
54
1.整形数字,随时间单调递增(不一定连续),长度更短,用50年都不会超过 js Number类型最大值。(默认配置 WorkerId 是6bit,自增数是6bit)
Z
edit  
zhouzj 已提交
55

Z
zhouzj 已提交
56
2.速度更快,是传统雪花算法的2-5倍,0.1秒可生成50万个。(i7笔记本,默认算法配置6bit+6bit)
Z
edit  
zhouzj 已提交
57

Z
zhouzj 已提交
58
3.支持时间回拨处理。比如服务器时间回拨1秒,本算法能自动适应生成临界时间的唯一ID。
Z
edit  
zhouzj 已提交
59

Z
zhouzj 已提交
60
4.支持手工插入新ID。当业务需要在历史时间生成新ID时,用本算法的预留位能生成5000个每秒。
Z
edit  
zhouzj 已提交
61

Z
zhouzj 已提交
62
5.漂移时能外发通知事件。让调用方确切知道算法漂移记录,Log并发调用量。
Z
edit  
zhouzj 已提交
63

Z
zhouzj 已提交
64
6.不依赖任何外部缓存和数据库。(当然 WorkerId 须由外部指定)
Z
edit  
zhouzj 已提交
65

yitter's avatar
yitter 已提交
66 67
7.基础功能,开箱即用,无需配置文件、数据库连接等。

Z
edit  
zhouzj 已提交
68

Z
zhouzj 已提交
69
## 性能数据
Z
zhouzj 已提交
70
(参数:10位自增序列,1000次漂移最大值)
Z
zhouzj 已提交
71
| 连续请求量 |  5K  |  5W  |  50W  |
Z
zhouzj 已提交
72 73
|  ----  | ----  |  ----  | ----  |
| 传统雪花算法 | 0.0045s | 0.053s  |  0.556s |
Z
zhouzj 已提交
74
| 雪花漂移算法  | 0.0015s | 0.012s |  0.113s |
Z
zhouzj 已提交
75

Z
edit  
zhouzj 已提交
76
## 效果
Z
edit  
zhouzj 已提交
77

Z
zhouzj 已提交
78
1.js Number 类型最大数值:9007199254740992,本算法在保持并发性能(5W+/0.01s)和最大64个 WorkerId(6bit)的同时,能用70年才到 js Number Max 值。
Z
edit  
zhouzj 已提交
79

Z
zhouzj 已提交
80
2.增加WorkerId位数到8bit(256节点)时,15年达到 js Number Max 值。
Z
edit  
zhouzj 已提交
81

Z
zhouzj 已提交
82
3.极致性能:500W/s~3000W/s。
Z
edit  
zhouzj 已提交
83

Z
edit  
zhouzj 已提交
84
4.所有测试数据均基于8代低压i7计算。
Z
edit  
zhouzj 已提交
85

Z
zhouzj 已提交
86 87 88 89
#### 生成的ID

默认配置:
```
yitter's avatar
yitter 已提交
90
WorkerIdBitLength = 6
Z
zhouzj 已提交
91 92 93 94 95 96 97 98 99 100 101 102 103 104 105
SeqBitLength = 6
```

ID示例(基于默认配置):
```
129053495681099        (本算法运行1年)
387750301904971        (运行3年)
646093214093387        (运行5年)
1292658282840139       (运行10年)
9007199254740992       (js Number 最大值)
165399880288699493     (普通雪花算法生成的ID)
```
本算法生成的 ID 值,是 js Number 最大值的 1%-10%,是普通雪花算法值的千分之一,而计算能力却超过普通雪花算法。


Z
edit  
zhouzj 已提交
106
## 适用范围
Z
edit  
zhouzj 已提交
107 108 109 110 111

1.小型、中型、大型需要全局唯一Id(不用Guid)的项目。

2.分布式项目。

Z
edit  
zhouzj 已提交
112
3.不想将 Long 型转 String 给前端用的项目。(若前端支持bigint,则可不转类型)
Z
edit  
zhouzj 已提交
113 114


Z
edit  
zhouzj 已提交
115
## 如何处理时间回拨
Z
zhouzj 已提交
116
1.当发生系统时间回拨时,算法采用过去时序的预留序数生成新的ID。
Z
edit  
zhouzj 已提交
117

Z
zhouzj 已提交
118
2.默认每秒生成100个(速度可调整)。
Z
edit  
zhouzj 已提交
119 120 121

3.回拨生成的ID序号,默认靠前,也可以调整为靠后。

Z
zhouzj 已提交
122
4.允许时间回拨至本算法预设基数(参数可调)。
Z
edit  
zhouzj 已提交
123

Z
edit  
zhouzj 已提交
124

Z
edit  
zhouzj 已提交
125 126 127 128 129 130 131 132
## 能用多久

1.在默认配置下,ID可用 71000 年不重复。

2.在支持 1024 个工作节点时,ID可用 4480 年不重复。

3.在支持 4096 个工作节点时,ID可用 1120 年不重复。

Z
zhouzj 已提交
133
4.以上所有工作节点,均拥有 50W/0.1s 瞬时处理速度。
Z
edit  
zhouzj 已提交
134

Z
zhouzj 已提交
135 136 137 138
#### 默认配置

1.WorkerIdBitLength=6,能支持64个 WorkerId,编号0~63。

Z
zhouzj 已提交
139
2.可通过减少 WorkerIdBitLength 到1~4(为4时最大支持WorkerId为2^4=16个),以减少Id长度。
Z
zhouzj 已提交
140

Z
zhouzj 已提交
141
3.SeqBitLength=6,能支持每秒并发5W请求时,平均处理速度不超过 0.005 s。(不同语言略有差别,最高性能不超过0.002s,平均不超过0.005s)
Z
zhouzj 已提交
142 143 144

4.可通过增加 SeqBitLength,支持更高的每秒并发数。默认配置能很高效地支持每秒 5W 并发请求,若要求更高,可适当增加 SeqBitLength 到 8~16,但这将增加Id长度。

Z
edit  
zhouzj 已提交
145

Z
zhouzj 已提交
146 147
## ★★集成建议★★

Z
zhouzj 已提交
148 149
#### 常规集成

Z
zhouzj 已提交
150
1.用单例模式调用。外部集成方使用更多的实例并行调用本算法,不会增加ID产出效能,因为本算法采用单线程模式生成ID。
Z
zhouzj 已提交
151

Z
zhouzj 已提交
152
2.指定唯一的 WorkerId。必须由外部系统确保 WorkerId 的全局唯一性,并赋值给本算法入口方法。
Z
zhouzj 已提交
153

Z
zhouzj 已提交
154 155
3.单机多实例部署时使用不同 WorkerId。并非所有实现都支持跨进程的并发唯一,保险起见,在同一主机上部署多应用实例时,请确保各 WorkerId 唯一。

yitter's avatar
yitter 已提交
156
4.异常处理。算法会抛出所有 Exception,外部系统应 catch 异常并做好应对处理,以免引发更大的系统崩溃。
Z
zhouzj 已提交
157

Z
zhouzj 已提交
158
5.认真理解 IdGeneratorOptions 的定义,这对集成和使用本算法有帮助。
Z
zhouzj 已提交
159

Z
zhouzj 已提交
160
6.使用雪花漂移算法。虽然代码里包含了传统雪花算法的定义,并且你可以在入口处指定(Method=2)来启用传统算法,但仍建议你使用雪花漂移算法(Method=1,默认的),毕竟它具有更好的伸缩力和更高的性能。
Z
zhouzj 已提交
161

Z
zhouzj 已提交
162
7.不要修改核心算法。本算法内部参数较多,逻辑较为复杂,在你尚未掌握核心逻辑时,请勿尝试修改核心代码且用于生产环境,除非通过大量细致、科学的测试验证。
Z
zhouzj 已提交
163 164


Z
zhouzj 已提交
165 166
####  大型分布式集成

yitter's avatar
yitter 已提交
167
1.可增加 WorkerIdBitLength 到最大20,支持 1,048,576 个节点,且不影响上述并发性能。[算法支持]
Z
zhouzj 已提交
168

Z
zhouzj 已提交
169
2.采用中心化 IdGenerator 集群,生成可用 Id 列表,存入 Redis 队列供节点消费。此时64个中心化节点数足够大型互联网项目使用。[需集成方扩展实现]
Z
zhouzj 已提交
170

Z
zhouzj 已提交
171
3.以上2条二选一即可,采用方法2一般是因为不想增加最终 ID 长度,但节点数超过64个。
Z
zhouzj 已提交
172

Z
zhouzj 已提交
173
4.任何加大 WorkerIdBitLength 或 SeqBitLength 的设置,都可能会增加 ID 的长度。
Z
zhouzj 已提交
174

Z
zhouzj 已提交
175 176
#### 配置变更

Z
zhouzj 已提交
177
配置变更指是系统运行一段时间后,再变更运行参数(IdGeneratorOptions选项值),请注意:
Z
zhouzj 已提交
178

Z
zhouzj 已提交
179
1.最重要的一条原则是:BaseTime **只能往前**(比老值更小、距离现在更远)赋值,原因是往后赋值极大可能产生相同的时间戳。[**不推荐**在系统运行之后调整 BaseTime]
Z
zhouzj 已提交
180 181 182

2.任何时候增加 WorkerIdBitLength 或 SeqBitLength,都是可以的,但是慎用 “减小”的操作,因为这可能导致在未来某天生成的 ID 与过去老配置时相同。[允许在系统运行之后**增加**任何一个 BitLength 值]

Z
zhouzj 已提交
183
3.如果必须减小 WorkerIdBitLength 或 SeqBitLength 其中的一项,一定要满足一个条件:新的两个 BitLength 之和要大于 老的值之和。[**不推荐**在运行之后缩小任何一个 BitLength 值]
Z
zhouzj 已提交
184

Z
zhouzj 已提交
185
4.上述3条规则,并未在本算法内做逻辑控制,集成方应根据上述规则做好影响评估,确认无误后,再实施配置变更。
Z
zhouzj 已提交
186

Z
zhouzj 已提交
187

Z
edit  
zhouzj 已提交
188
## 代码示例
Z
zhouzj 已提交
189

Z
zhouzj 已提交
190 191 192
C#:[查看示例][1]

Java:[查看示例][2]
Z
edit  
zhouzj 已提交
193

Z
zhouzj 已提交
194 195
Go:[查看示例][3]

Z
zhouzj 已提交
196 197 198
Rust:[查看示例][4]


Z
zhouzj 已提交
199 200 201 202
即将推出 PHP 扩展调用版本。



Z
zhouzj 已提交
203
[1]: https://gitee.com/yitter/idgenerator/tree/master/C%23.NET
Z
zhouzj 已提交
204
[2]: https://gitee.com/yitter/idgenerator/tree/master/Java
Z
zhouzj 已提交
205
[3]: https://gitee.com/yitter/idgenerator/tree/master/Go
Z
zhouzj 已提交
206
[4]: https://gitee.com/yitter/idgenerator/tree/master/Rust