天天看點

Twitter雪花算法-分布式ID生成解決方案

xl_echo編輯整理

百戰不敗,依不自稱常勝,百敗不頹,依能奮力前行。——這才是真正的堪稱強大!

如果一個表資料量每天都在猛增的話,那麼我們不能給該表設定自增。但是不自增我們怎麼保證ID的唯一性呢?

  • UUID(缺點:太長、沒法排序)
  • Redis(缺點:必須依賴Redis)
  • Oracle序列号(缺點:用Oracle才能使用)

這種情況下我們需要自己編寫一套算法,并将資料庫分片,通過中間鍵來完成資料分布。那麼久要求我們的算法ID不能重複,彌補以上缺點。這裡我們推薦Twitter-Snowflake算法。

Twitter-Snowflake算法産生的背景相當簡單,為了滿足Twitter每秒上萬條消息的請求,每條消息都必須配置設定一條唯一的id,這些id還需要一些大緻的順序(友善用戶端排序),并且在分布式系統中不同機器産生的id必須不同。

Snowflake算法核心

把時間戳,工作機器id,序列号組合在一起。

除了最高位bit标記為不可用以外,其餘三組bit占位均可浮動,看具體的業務需求而定。預設情況下41bit的時間戳可以支援該算法使用到2082年,10bit的工作機器id可以支援1023台機器,序列号支援1毫秒産生4095個自增序列id。下文會具體分析。

結構為:

Twitter雪花算法-分布式ID生成解決方案

在上面的字元串中,第一位為未使用(實際上也可作為long的符号位),接下來的41位為毫秒級時間,然後5位datacenter辨別位,5位機器ID(并不算辨別符,實際是為線程辨別),然後12位該毫秒内的目前毫秒内的計數,加起來剛好64位,為一個Long型。

這樣的好處是,整體上按照時間自增排序,并且整個分布式系統内不會産生ID碰撞(由datacenter和機器ID作區分),并且效率較高,經測試,snowflake每秒能夠産生26萬ID左右,完全滿足需要。

package util;

import java.lang.management.ManagementFactory;
import java.net.InetAddress;
import java.net.NetworkInterface;

/**
 * <p>名稱:IdWorker.java</p>
 * <p>描述:分布式自增長ID</p>
 * <pre>
 *     Twitter的 Snowflake JAVA實作方案
 * </pre>
 * 核心代碼為其IdWorker這個類實作,其原理結構如下,我分别用一個0表示一位,用—分割開部分的作用:
 * 1||0---0000000000 0000000000 0000000000 0000000000 0 --- 00000 ---00000 ---000000000000
 * 在上面的字元串中,第一位為未使用(實際上也可作為long的符号位),接下來的41位為毫秒級時間,
 * 然後5位datacenter辨別位,5位機器ID(并不算辨別符,實際是為線程辨別),
 * 然後12位該毫秒内的目前毫秒内的計數,加起來剛好64位,為一個Long型。
 * 這樣的好處是,整體上按照時間自增排序,并且整個分布式系統内不會産生ID碰撞(由datacenter和機器ID作區分),
 * 并且效率較高,經測試,snowflake每秒能夠産生26萬ID左右,完全滿足需要。
 * <p>
 * 64位ID (42(毫秒)+5(機器ID)+5(業務編碼)+12(重複累加))
 *
 * @author Polim
 */
public class IdWorker {
    // 時間起始标記點,作為基準,一般取系統的最近時間(一旦确定不能變動)
    private final static long twepoch = 1288834974657L;
    // 機器辨別位數
    private final static long workerIdBits = 5L;
    // 資料中心辨別位數
    private final static long datacenterIdBits = 5L;
    // 機器ID最大值
    private final static long maxWorkerId = -1L ^ (-1L << workerIdBits);
    // 資料中心ID最大值
    private final static long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
    // 毫秒内自增位
    private final static long sequenceBits = 12L;
    // 機器ID偏左移12位
    private final static long workerIdShift = sequenceBits;
    // 資料中心ID左移17位
    private final static long datacenterIdShift = sequenceBits + workerIdBits;
    // 時間毫秒左移22位
    private final static long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

    private final static long sequenceMask = -1L ^ (-1L << sequenceBits);
    /* 上次生産id時間戳 */
    private static long lastTimestamp = -1L;
    // 0,并發控制
    private long sequence = 0L;

    private final long workerId;
    // 資料辨別id部分
    private final long datacenterId;

    public IdWorker(){
        this.datacenterId = getDatacenterId(maxDatacenterId);
        this.workerId = getMaxWorkerId(datacenterId, maxWorkerId);
    }
    /**
     * @param workerId
     *            工作機器ID
     * @param datacenterId
     *            序列号
     */
    public IdWorker(long workerId, long datacenterId) {
        if (workerId > maxWorkerId || workerId < 0) {
            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
        }
        if (datacenterId > maxDatacenterId || datacenterId < 0) {
            throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
        }
        this.workerId = workerId;
        this.datacenterId = datacenterId;
    }
    /**
     * 擷取下一個ID
     *
     * @return
     */
    public synchronized long nextId() {
        long timestamp = timeGen();
        if (timestamp < lastTimestamp) {
            throw new RuntimeException(String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }

        if (lastTimestamp == timestamp) {
            // 目前毫秒内,則+1
            sequence = (sequence + 1) & sequenceMask;
            if (sequence == 0) {
                // 目前毫秒内計數滿了,則等待下一秒
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            sequence = 0L;
        }
        lastTimestamp = timestamp;
        // ID偏移組合生成最終的ID,并傳回ID
        long nextId = ((timestamp - twepoch) << timestampLeftShift)
                | (datacenterId << datacenterIdShift)
                | (workerId << workerIdShift) | sequence;

        return nextId;
    }

    private long tilNextMillis(final long lastTimestamp) {
        long timestamp = this.timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = this.timeGen();
        }
        return timestamp;
    }

    private long timeGen() {
        return System.currentTimeMillis();
    }

    /**
     * <p>
     * 擷取 maxWorkerId
     * </p>
     */
    protected static long getMaxWorkerId(long datacenterId, long maxWorkerId) {
        StringBuffer mpid = new StringBuffer();
        mpid.append(datacenterId);
        String name = ManagementFactory.getRuntimeMXBean().getName();
        if (!name.isEmpty()) {
         /*
          * GET jvmPid
          */
            mpid.append(name.split("@")[0]);
        }
      /*
       * MAC + PID 的 hashcode 擷取16個低位
       */
        return (mpid.toString().hashCode() & 0xffff) % (maxWorkerId + 1);
    }

    /**
     * <p>
     * 資料辨別id部分
     * </p>
     */
    protected static long getDatacenterId(long maxDatacenterId) {
        long id = 0L;
        try {
            InetAddress ip = InetAddress.getLocalHost();
            NetworkInterface network = NetworkInterface.getByInetAddress(ip);
            if (network == null) {
                id = 1L;
            } else {
                byte[] mac = network.getHardwareAddress();
                id = ((0x000000FF & (long) mac[mac.length - 1])
                        | (0x0000FF00 & (((long) mac[mac.length - 2]) << 8))) >> 6;
                id = id % (maxDatacenterId + 1);
            }
        } catch (Exception e) {
            System.out.println(" getDatacenterId: " + e.getMessage());
        }
        return id;
    }


}      

繼續閱讀