分布式唯一ID-雪花算法-CFANZ编程社区

于今日，看到了久违的太阳，在此纪念一下。

于今日，终于看到久违的太阳

下面步入正题。

在复杂的分布式系统中，常常需要为某条数据或消息生成一个全局唯一的标识。例如请求的 RequestId，支付流水号，订单号等。

因此分布式唯一ID的生成方案不可或缺，对于这个唯一ID有以下要求：

另外作为分布式系统中一个基础的服务，对于服务的高吞吐，高可用也有严格的要求。

唯一ID的生成方案主要可以概括为两类：

我们部门目前使用的是雪花算法，下面也主要讲雪花算法相关的实现。

该算法使用分段思想，通过时间戳 + 机器ID + 自增序列组合生成一个长度为 64 位的 Long 类型ID。

具体实现主要涉及以下核心点：

下面是 id 生成的公式：

long id = ((timestamp - twepoch) << timestampLeftShift) | (workerId << workerIdShift) | sequence;

可以看到时间戳信息 = timestamp - twepoch，其中 timestamp 为当前时间，而 twepoch 则是自定义的一个起始时间，为什么需要这个时间呢？

时间戳信息占总长的 41 bit ，如果直接用当前时间作为时间戳信息，则会浪费 41 bit 能表示的数据集中绝大部分，故让其减去 twepoch，twepoch 一般设置为系统投入生产的时间。

另外 41 bit 时间戳最多能表示 69 年，如果用完了怎么办？

互联网行业，能活 69 年的企业已经很不容易了（手动狗头），即使真活了那么久，系统可能也经历了多次重构，所以暂且不考虑这个问题。

美团 Leaf-snowflake 的实现中是通过 zookeeper 为集群中每个节点生成唯一的工作节点ID。

个人觉得，如果单纯只是想生成唯一的工作节点ID，没有必要引入
zookeeper，可以根据 HostName + IP地址编码的方式生成节点ID（我们便是如此）。

自增序列号的作用是防止同一毫秒，同一节点产生重复的ID，占 12 bit，最大为 4095。

如果同一毫秒同一节点存在多个生成ID的请求，则会触发自增序列自增，
如果自增序列打满了，则会阻塞到下一毫秒。

另外每当时间戳发生变更（当前时间戳与上一次生成的时间戳作比较），都会重置自增序列的值，如果想让ID分布足够散列，可以重置到一个随机值。

如何判断自增序列打满了，算法中通过与运算的方式，sequenceMask 为自增序列的掩码（低12位都为1，其余位为0），如果结果 sequence = 0，则说明自增序列被打满溢出了。

sequence = (sequence + 1) & sequenceMask;

即系统时间发生了回退，如果不做处理，则会生成重复ID。

针对这个问题，每次生成id后，记录一个最后生成时间 lastTimestamp，可以用来判断系统时钟是否发生倒退(currentTimestamp < lastTimestamp)。

如果发生了倒退，可以有如下几种处理方案：

节点间时间不同步，可能会导致ID不满足严格的单调递增。

举个例子：存在两个节点 worker1，worker2，worker1 的时钟落后于 worker2，即使 worker1 上的 ID 后生成，也可能小于 worker2 先生成的 ID。

如果业务对于 ID 的单调递增有严格要求，则需要解决这个问题，美团 Leaf-snowflake 是通过启动时，节点间的时间协商解决这个问题的。

假设当前节点的系统时间为 currentTime，集群内节点的平均系统时间为 averageTime，如果 currentTime - averageTime > 阈值，则认为当前节点的时间发生大步长偏移，当前节点启动失败并触发报警。

安全性指的是生成的ID是否存在信息泄露的危险。

比如：如果订单号是简单的自增（每次+1），那么竞争对手只要前后两天同一时间，分别下一单，然后通过订单号相减就能推测你们这一天之间的订单量了，你说安不安全。

当然雪花算法满足安全性要求，它的ID主要是根据时间戳生成的，并没有和订单的增长逻辑直接关联，另外自增序列 sequence 的随机散列也可以保证信息安全。

综上所述，雪花算法满足分布式唯一ID对于唯一性，单调递增性，安全性的要求，无论在实现复杂度，还是性能方面都有很大的优势，且，能适用于大部分业务场景。