README.md 14.6 KB
Newer Older
yitter's avatar
yitter 已提交
1
# 比雪花算法更好用的数据主键新算法
yitter's avatar
yitter 已提交
2

yitter's avatar
yitter 已提交
3 4 5 6 7 8 9 10
## 💎 技术支持

开源地址1:https://github.com/yitter/idgenerator

开源地址2:https://gitee.com/yitter/idgenerator

QQ群:646049993

yitter's avatar
yitter 已提交
11
## 💎 基本介绍
yitter's avatar
yitter 已提交
12 13 14

<font color="#11aaff" size="5"></font> 一个全新的雪花漂移算法,生成的ID更短、速度更快。 

yitter's avatar
yitter 已提交
15
<font color="#11aaff" size="5"></font> 核心在于缩短ID长度的同时,具备极高QPS(保守值 50W/0.1s)。 
yitter's avatar
yitter 已提交
16

yitter's avatar
yitter 已提交
17
<font color="#11aaff" size="5"></font> 原生支持 C#/Java/Go/Rust/C 等语言,并提供 PHP、Python、Node.js、Ruby 等语言多线程安全调用库(FFI)。
yitter's avatar
yitter 已提交
18

yitter's avatar
yitter 已提交
19
<font color="#11aaff" size="5"></font> 支持 k8s 等容器环境自动扩容(自动注册 WorkerId)。
yitter's avatar
yitter 已提交
20

yitter's avatar
yitter 已提交
21
<font color="#11aaff" size="5"></font> 可在单机或分布式环境中生成唯一ID。
yitter's avatar
yitter 已提交
22

yitter's avatar
yitter 已提交
23
<font color="#11aaff" size="5"></font> 这是计算机历史上最全面的雪花ID生成器,未来会超越自己。(目前还未发现更好的,或许你可以😀)
yitter's avatar
yitter 已提交
24

yitter's avatar
yitter 已提交
25

yitter's avatar
yitter 已提交
26 27 28 29
## 为什么要雪花ID?

🌀 因为大厂都在用,推特、百度、美团、滴滴等等。

yitter's avatar
yitter 已提交
30
🌀 大厂们不但自己用,而且开源:[百度][81] | [美团][82] | [滴滴][83] | [雪花ID鼻祖-推特][80]
yitter's avatar
yitter 已提交
31

yitter's avatar
yitter 已提交
32
🌀 雪花ID是走向分布式架构的垫脚石,如果只会Guid和数据库自增,怎么敢说会分布式系统架构。
yitter's avatar
yitter 已提交
33 34

🌀 雪花ID适合小项目、大项目、超级大项目。
yitter's avatar
yitter 已提交
35 36 37 38 39 40

🌀 要想进大厂,先学会雪花ID。


## 为什么不用大厂开源?

yitter's avatar
yitter 已提交
41
❄ 简而言之,大厂的雪花算法分为“经典雪花算法”和“号段雪花算法”两种,其中“号段雪花算法”依赖网络或外部存储系统,不适合“非大厂”,另外“号段雪花算法”存在业务表达上的缺陷。
yitter's avatar
yitter 已提交
42

yitter's avatar
yitter 已提交
43
❄ 至于大厂的“经典雪花算法”,其实就是推特雪花算法的特定语言翻译,未曾见过大厂在“ID长度和生成性能”方面,做过极致的优化,而这正式本算法——雪花漂移算法的核心所在。
yitter's avatar
yitter 已提交
44

yitter's avatar
yitter 已提交
45
❄ 大厂开源都是优先为己所用,没有一家支持多语言,而这正式本算法——雪花漂移算法送给大家的福利,无论你是想学语言入门还是想学(或想用)雪花ID,这里都能让你有所收获。
yitter's avatar
yitter 已提交
46 47


yitter's avatar
yitter 已提交
48
## 需求来源
yitter's avatar
yitter 已提交
49

yitter's avatar
yitter 已提交
50
<font color="green" size="5">💧</font>  作为架构设计的你,想要解决数据库主键唯一的问题,特别是在分布式系统多数据库的时候。
yitter's avatar
yitter 已提交
51

yitter's avatar
yitter 已提交
52
<font color="green" size="5">💧</font>  你希望这个主键是用最少的存储空间,索引速度更快,Select、Insert 和 Update 更迅速。
yitter's avatar
yitter 已提交
53

yitter's avatar
yitter 已提交
54
<font color="green" size="5">💧</font>  你要考虑在分库分表(合库合表)时,主键值可直接使用,并能反映业务时序。
yitter's avatar
yitter 已提交
55

yitter's avatar
yitter 已提交
56
<font color="green" size="5">💧</font>  如果这样的主键值太长,超过前端 JS Number 类型最大值,须把 Long 型转换为 String 型,你会觉得有点沮丧。
yitter's avatar
yitter 已提交
57

yitter's avatar
yitter 已提交
58
<font color="green" size="5">💧</font>  尽管 Guid 能自增,但占用空间大,索引速度慢,你也不想用它。
yitter's avatar
yitter 已提交
59

yitter's avatar
yitter 已提交
60
<font color="green" size="5">💧</font>  应用实例可能超过50个,每个并发请求可达10W/s。
yitter's avatar
yitter 已提交
61

yitter's avatar
yitter 已提交
62
<font color="green" size="5">💧</font>  在容器环境部署应用(水平扩展、自动伸缩)。
yitter's avatar
yitter 已提交
63

yitter's avatar
yitter 已提交
64
<font color="green" size="5">💧</font>  不想依赖 redis 的自增操作。
yitter's avatar
yitter 已提交
65

yitter's avatar
yitter 已提交
66
<font color="green" size="5">💧</font>  你希望系统运行 100 年以上。
yitter's avatar
yitter 已提交
67 68


yitter's avatar
yitter 已提交
69
## 传统算法问题
yitter's avatar
yitter 已提交
70 71 72 73 74 75 76 77 78

❌ 生成的ID太长。

❌ 瞬时并发量不够。

❌ 不能解决时间回拨问题。

❌ 不支持后补生成前序ID。

yitter's avatar
yitter 已提交
79
❌ 可能依赖外部存储系统。
yitter's avatar
yitter 已提交
80 81


yitter's avatar
yitter 已提交
82
## 新算法特点
yitter's avatar
yitter 已提交
83

yitter's avatar
yitter 已提交
84
<font color="green" size="5"></font> 整形数字,随时间单调递增(不一定连续),长度更短,用50年都不会超过 js Number类型最大值。(默认配置 WorkerId 是6bit,序列数是6bit)
yitter's avatar
yitter 已提交
85 86 87

<font color="green" size="5"></font> 速度更快,是传统雪花算法的2-5倍,0.1秒可生成50万个。(i7笔记本,默认算法配置6bit+6bit)

yitter's avatar
yitter 已提交
88
<font color="green" size="5"></font> 支持时间回拨处理。比如服务器时间回拨1秒,本算法能自动适应生成临界时间的唯一ID。
yitter's avatar
yitter 已提交
89

yitter's avatar
yitter 已提交
90
<font color="green" size="5"></font> 支持手工插入新ID。当业务需要在历史时间生成新ID时,用本算法的预留位能生成5000个每秒。
yitter's avatar
yitter 已提交
91

yitter's avatar
yitter 已提交
92
<font color="green" size="5"></font> 不依赖任何外部缓存和数据库。(k8s环境下自动注册 WorkerId 的动态库依赖 redis)
yitter's avatar
yitter 已提交
93 94 95 96

<font color="green" size="5"></font> 基础功能,开箱即用,无需配置文件、数据库连接等。


yitter's avatar
yitter 已提交
97
## 性能数据
yitter's avatar
yitter 已提交
98

yitter's avatar
yitter 已提交
99 100 101 102 103 104
(参数:10位自增序列,1000次漂移最大值)
| 连续请求量 |  5K  |  5W  |  50W  |
|  ----  | ----  |  ----  | ----  |
| 传统雪花算法 | 0.0045s | 0.053s  |  0.556s |
| 雪花漂移算法  | 0.0015s | 0.012s |  0.113s |

yitter's avatar
yitter 已提交
105
💍 极致性能:500W/s~3000W/s。(所有测试数据均基于8代低压i7计算。)
yitter's avatar
yitter 已提交
106

yitter's avatar
yitter 已提交
107
## 适用范围
yitter's avatar
yitter 已提交
108

yitter's avatar
yitter 已提交
109
🔷小型、中型、大型需要全局唯一Id(不用Guid)的项目。
yitter's avatar
yitter 已提交
110

yitter's avatar
yitter 已提交
111
🔷 单机或分布式项目。
yitter's avatar
yitter 已提交
112

yitter's avatar
yitter 已提交
113
🔷不想将 Long 型转 String 给前端用的项目。
yitter's avatar
yitter 已提交
114 115


yitter's avatar
yitter 已提交
116
## 如何处理时间回拨
yitter's avatar
yitter 已提交
117

yitter's avatar
yitter 已提交
118
🔶 当发生系统时间回拨时,算法采用过去时序的预留序数生成新的ID。
yitter's avatar
yitter 已提交
119

yitter's avatar
yitter 已提交
120 121 122 123 124
🔶 回拨生成的ID序号,默认靠前,也可以调整为靠后。

🔶 允许时间回拨至本算法预设基数(参数可调)。


yitter's avatar
yitter 已提交
125
## 💎 ID组成
yitter's avatar
yitter 已提交
126

yitter's avatar
yitter 已提交
127
 * 本算法生成的ID由3部分组成(沿用雪花算法定义):
yitter's avatar
yitter 已提交
128
 * +-------------------------+--------------+----------+
yitter's avatar
yitter 已提交
129
 * | 1.相对基础时间的时间差 | 2.WorkerId | 3.序列数 |
yitter's avatar
yitter 已提交
130
 * +-------------------------+--------------+----------+
yitter's avatar
yitter 已提交
131
 * +-------------------------+---- 6 bits ---+- 6 bits -+
yitter's avatar
yitter 已提交
132
 * 
yitter's avatar
yitter 已提交
133 134
 * 第1部分,时间差,是生成ID时的系统时间减去 BaseTime 的总时间差(毫秒单位)。
 * 第2部分,WorkerId,是区分不同机器或不同应用的唯一ID,最大值由 WorkerIdBitLength(默认6)限定。
yitter's avatar
yitter 已提交
135
 * 第3部分,序列数,是每毫秒下的序列数,由参数中的 SeqBitLength(默认6)限定。
yitter's avatar
yitter 已提交
136

yitter's avatar
yitter 已提交
137
## 💎 ID示例
yitter's avatar
yitter 已提交
138

yitter's avatar
yitter 已提交
139
🟣 本算法生成的 ID ,是一串整数,最多8字节。以下是基于默认配置生成的ID:
yitter's avatar
yitter 已提交
140 141 142 143 144 145 146 147 148
```
129053495681099        (本算法运行1年)
387750301904971        (运行3年)
646093214093387        (运行5年)
1292658282840139       (运行10年)
9007199254740992       (js Number 最大值)
165399880288699493     (普通雪花算法生成的ID)
```

yitter's avatar
yitter 已提交
149
🟣 本算法生成的 ID 值,是 js Number 最大值的 1%-10%,是普通雪花算法值的千分之一,而计算能力却超过普通雪花算法。
yitter's avatar
yitter 已提交
150

yitter's avatar
yitter 已提交
151
🟣 js Number 类型最大数值:9007199254740992,本算法在保持并发性能(5W+/0.01s)和最大64个 WorkerId(6bit)的同时,能用70年才到 js Number Max 值。
yitter's avatar
yitter 已提交
152 153


yitter's avatar
yitter 已提交
154
### 长度估算
yitter's avatar
yitter 已提交
155

yitter's avatar
yitter 已提交
156
```
yitter's avatar
yitter 已提交
157
💍 每增加 1位 WorkerIdBitLength 或 SeqBitLength,生成的ID数字值将会乘以2(基础长度可参考前“ID示例”),反之则除以2。
yitter's avatar
yitter 已提交
158
```
yitter's avatar
yitter 已提交
159

yitter's avatar
yitter 已提交
160
### 能用多久
yitter's avatar
yitter 已提交
161 162 163 164 165 166 167 168

🔵 在默认配置下,ID可用 71000 年不重复。

🔵 在支持 1024 个工作节点时,ID可用 4480 年不重复。

🔵 在支持 4096 个工作节点时,ID可用 1120 年不重复。


yitter's avatar
yitter 已提交
169
## 💎 参数设置
yitter's avatar
yitter 已提交
170

yitter's avatar
yitter 已提交
171
<font color="#11aaff" size="5"></font> <font color=blue>***WorkerIdBitLength***</font>,机器码位长,决定 WorkerId 的最大值,默认值6,取值范围 [1, 19],实际上有些语言采用 无符号ushort(uint16) 类型接收该参数,所以最大值是16,如果是采用有符号short(int16),则最大值为15。
yitter's avatar
yitter 已提交
172

yitter's avatar
yitter 已提交
173
<font color="#11aaff" size="5"></font> <font color=blue>***WorkerId***</font>,机器码,**最重要参数**,无默认值,必须由外部设定,默认情况下最大值63,理论最大值 2^WorkerIdBitLength-1(实际上根据语言的实现不同可能会限定在 65535 或 32767,原理同 WorkerIdBitLength 的规则)。不同机器或不同应用实例不可相同,你可通过应用程序配置该值,也可通过调用外部服务获取值。针对自动注册WorkerId需求,本算法提供默认实现:通过 redis 自动注册 WorkerId 的动态库,详见“Tools\AutoRegisterWorkerId”。
yitter's avatar
yitter 已提交
174

yitter's avatar
yitter 已提交
175 176
<font color="#11aaff" size="5"></font> <font color=blue>***SeqBitLength***</font>,序列数位长,默认值6,取值范围 [3, 21](建议不小于4),决定每毫秒生成的 ID 个数。规则要求:WorkerIdBitLength + SeqBitLength 不超过 22。

yitter's avatar
yitter 已提交
177
<font color="#11aaff" size="5"></font> <font color=blue>***MinSeqNumber***</font>,最小序列数,默认值5,取值范围 [5, MaxSeqNumber],每毫秒的前5个序列数对应编号0-4是保留位,其中1-4是时间回拨相应预留位,0是手工新值预留位。
yitter's avatar
yitter 已提交
178

yitter's avatar
yitter 已提交
179
<font color="#11aaff" size="5"></font> <font color=blue>***MaxSeqNumber***</font>,最大序列数,设置范围 [MinSeqNumber, 2^SeqBitLength-1],默认值0,表示最大序列数取最大值(2^SeqBitLength-1),不为0时,用该设置值为最大序列数,一般无需设置最大序列数,除非多机共享WorkerId分段生成ID(此时还要正确设置最小序列数)。
yitter's avatar
yitter 已提交
180 181


yitter's avatar
yitter 已提交
182
## 💎 常规集成
yitter's avatar
yitter 已提交
183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198

1️⃣ 用单例模式调用。外部集成方使用更多的实例并行调用本算法,不会增加ID产出效能,因为本算法采用单线程模式生成ID。

2️⃣ 指定唯一的 WorkerId。必须由外部系统确保 WorkerId 的全局唯一性,并赋值给本算法入口方法。

3️⃣ 单机多实例部署时使用不同 WorkerId。并非所有实现都支持跨进程的并发唯一,保险起见,在同一主机上部署多应用实例时,请确保各 WorkerId 唯一。

4️⃣ 异常处理。算法会抛出所有 Exception,外部系统应 catch 异常并做好应对处理,以免引发更大的系统崩溃。

5️⃣ 认真理解 IdGeneratorOptions 的定义,这对集成和使用本算法有帮助。

6️⃣ 使用雪花漂移算法。虽然代码里包含了传统雪花算法的定义,并且你可以在入口处指定(Method=2)来启用传统算法,但仍建议你使用雪花漂移算法(Method=1,默认的),毕竟它具有更好的伸缩力和更高的性能。

7️⃣ 不要修改核心算法。本算法内部参数较多,逻辑较为复杂,在你尚未掌握核心逻辑时,请勿尝试修改核心代码且用于生产环境,除非通过大量细致、科学的测试验证。


yitter's avatar
yitter 已提交
199
## 💎 配置变更
yitter's avatar
yitter 已提交
200 201 202 203 204 205 206 207 208 209 210 211

配置变更指是系统运行一段时间后,再变更运行参数(IdGeneratorOptions选项值),请注意:

🔴 1.最重要的一条原则是:BaseTime **只能往前**(比老值更小、距离现在更远)赋值,原因是往后赋值极大可能产生相同的时间戳。[**不推荐**在系统运行之后调整 BaseTime]

🔴 2.任何时候增加 WorkerIdBitLength 或 SeqBitLength,都是可以的,但是慎用 “减小”的操作,因为这可能导致在未来某天生成的 ID 与过去老配置时相同。[允许在系统运行之后**增加**任何一个 BitLength 值]

🔴 3.如果必须减小 WorkerIdBitLength 或 SeqBitLength 其中的一项,一定要满足一个条件:新的两个 BitLength 之和要大于 老的值之和。[**不推荐**在运行之后缩小任何一个 BitLength 值]

🔴 4.上述3条规则,并未在本算法内做逻辑控制,集成方应根据上述规则做好影响评估,确认无误后,再实施配置变更。


yitter's avatar
yitter 已提交
212 213
## 自动注册WorkerId

yitter's avatar
yitter 已提交
214
🔍 唯一ID生成器,依赖WorkerId,当业务服务需要水平无差别复制时,就要求它能自动注册全局唯一WorkerId,然后才能根据它生产唯一ID。
yitter's avatar
yitter 已提交
215

yitter's avatar
yitter 已提交
216 217 218 219
🔍 本算法提供一个开源动态库(go语言实现),能在容器 k8s(或其它容器化集群) 环境下,通过 redis 自动注册 WorkerId。

🔍 通过redis注册WorkerId,并不是唯一的方法。你也可以自己开发一个配置中心服务,各个应用服务启动时,通过配置中心获取唯一 WorkerId。

yitter's avatar
yitter 已提交
220 221
🔍 当然,如果你的服务不需要自动扩展,你就不必自动注册WorkerId,而是为每个应用手工设定一个唯一值。

yitter's avatar
yitter 已提交
222 223

动态库下载链接:https://gitee.com/yitter/idgenerator/attach_files/662372/download/regworkerid_lib_v1.0.zip
yitter's avatar
yitter 已提交
224 225 226 227

动态库接口定义:
```
// 注册一个 WorkerId,会先注销所有本机已注册的记录
yitter's avatar
yitter 已提交
228 229 230 231
// ip: redis 服务器地址
// port: redis 端口
// password: redis 访问密码,可为空字符串“”
// maxWorkerId: 最大 WorkerId
yitter's avatar
yitter 已提交
232 233 234 235 236 237 238 239
extern __declspec(dllexport) GoInt32 RegisterOne(char* ip, GoInt32 port, char* password, GoInt32 maxWorkerId);

// 注销本机已注册的 WorkerId
extern __declspec(dllexport) void UnRegister();

// 检查本地WorkerId是否有效(0-有效,其它-无效)
extern __declspec(dllexport) GoInt32 Validate(GoInt32 workerId);
```
yitter's avatar
yitter 已提交
240

yitter's avatar
yitter 已提交
241
## 💎 已实现的语言
yitter's avatar
yitter 已提交
242

yitter's avatar
yitter 已提交
243
| 语言 |  github  |  gitee  | 
yitter's avatar
yitter 已提交
244
|  ----  | ----  |  ----  |
yitter's avatar
yitter 已提交
245 246 247 248 249
| 🌲 C# | [查看示例][1]  | [查看示例][11]  | 
| 🌲 Java | [查看示例][2]  | [查看示例][21]  |  
| 🌲 Go| [查看示例][3]  | [查看示例][31]  |  
| 🌲 Rust | [查看示例][4]  | [查看示例][41]  |  
| 🌲 C | [查看示例][5]  | [查看示例][51]  |  
yitter's avatar
yitter 已提交
250
| 🌲 PHP扩展 | [查看示例][7]  | [查看示例][71]  |  
yitter's avatar
yitter 已提交
251
| 🌲 Vlang | [查看示例][6]  | [查看示例][61]  |  
yitter's avatar
yitter 已提交
252 253 254

如果你有其它语言的实现需求,不妨试着自己写一个,或者给我留言。

yitter's avatar
yitter 已提交
255

yitter's avatar
yitter 已提交
256 257
[![Giteye chart](https://chart.giteye.net/gitee/yitter/idgenerator/YEBB8LQN.png)](https://giteye.net/chart/YEBB8LQN)

yitter's avatar
yitter 已提交
258

yitter's avatar
yitter 已提交
259
[1]: https://github.com/yitter/idgenerator/tree/master/%23.NET
yitter's avatar
yitter 已提交
260 261 262 263 264
[2]: https://github.com/yitter/idgenerator/tree/master/Java
[3]: https://github.com/yitter/idgenerator/tree/master/Go
[4]: https://github.com/yitter/idgenerator/tree/master/Rust
[5]: https://github.com/yitter/idgenerator/tree/master/C
[6]: https://github.com/yitter/idgenerator/tree/master/ZeOthers/Vlang
yitter's avatar
yitter 已提交
265
[7]: https://github.com/yitter/idgenerator/tree/master/PHP
yitter's avatar
yitter 已提交
266

yitter's avatar
yitter 已提交
267 268 269 270 271
[11]: https://gitee.com/yitter/idgenerator/tree/master/%23.NET
[21]: https://gitee.com/yitter/idgenerator/tree/master/Java
[31]: https://gitee.com/yitter/idgenerator/tree/master/Go
[41]: https://gite.com/yitter/idgenerator/tree/master/Rust
[51]: https://gitee.com/yitter/idgenerator/tree/master/C
yitter's avatar
yitter 已提交
272
[61]: https://gitee.com/yitter/idgenerator/tree/master/ZeOthers/Vlang
yitter's avatar
yitter 已提交
273
[71]: https://gitee.com/yitter/idgenerator/tree/master/PHP
yitter's avatar
yitter 已提交
274 275 276 277 278 279

[80]: https://github.com/twitter-archive/snowflake
[81]: https://github.com/baidu/uid-generator
[82]: https://github.com/Meituan-Dianping/Leaf
[83]: https://github.com/didi/tinyid