天天看點

最常用的分布式ID解決方案,你知道幾個

說起ID,特性就是唯一,在人的世界裡,ID就是身份證,是每個人的唯一的身份辨別。在複雜的分布式系統中,往往也需要對大量的資料和消息進行唯一辨別,這個辨別就是分布式ID,那你知道有哪些常用的分布式ID解決方案嗎?

說起ID,特性就是唯一,在人的世界裡,ID就是身份證,是每個人的唯一的身份辨別。在複雜的分布式系統中,往往也需要對大量的資料和消息進行唯一辨別。舉個例子,資料庫的ID字段在單體的情況下可以使用自增來作為ID,但是對資料分庫分表後一定需要一個唯一的ID來辨別一條資料,這個ID就是分布式ID。對于分布式ID而言,也需要具備分布式系統的特點:高并發,高可用,高性能等特點。

下表為一些常用方案對比:

描述

優點

缺點

UUID

UUID是通用唯一辨別碼的縮寫,其目的是上分布式系統中的所有元素都有唯一的辨識資訊,而不需要通過中央控制器來指定唯一辨別。

1. 降低全局節點的壓力,使得主鍵生成速度更快;2. 生成的主鍵全局唯一;3. 跨伺服器合并資料友善

1. UUID占用16個字元,空間占用較多;2. 不是遞增有序的數字,資料寫入IO随機性很大,且索引效率下降

資料庫主鍵自增

MySQL資料庫設定主鍵且主鍵自動增長

1. INT和BIGINT類型占用空間較小;2. 主鍵自動增長,IO寫入連續性好;3. 數字類型查詢速度優于字元串

1. 并發性能不高,受限于資料庫性能;2. 分庫分表,需要改造,複雜;3. 自增:資料量洩露

Redis自增

Redis計數器,原子性自增

使用記憶體,并發性能好

1. 資料丢失;2. 自增:資料量洩露

雪花算法(snowflake)

大名鼎鼎的雪花算法,分布式ID的經典解決方案

1. 不依賴外部元件;2. 性能好

時鐘回撥

目前流行的分布式ID解決方案有兩種:号段模式和雪花算法。

号段模式依賴于資料庫,但是差別于資料庫主鍵自增的模式。假設100為一個号段100,200,300,每取一次可以獲得100個ID,性能顯著提高。

雪花算法是由符号位+時間戳+工作機器id+序列号組成的,如圖所示:

最常用的分布式ID解決方案,你知道幾個

符号位為0,0表示正數,ID為正數。

時間戳位不用多說,用來存放時間戳,機關是ms。

工作機器id位用來存放機器的id,通常分為5個區域位+5個伺服器辨別位。

序号位是自增。

雪花算法能存放多少資料?

時間範圍:2^41 / (3652460601000) = 69年

工作程序範圍:2^10 = 1024

序列号範圍:2^12 = 4096,表示1ms可以生成4096個ID。

根據這個算法的邏輯,隻需要将這個算法用Java語言實作出來,封裝為一個工具方法,那麼各個業務應用可以直接使用該工具方法來擷取分布式ID,隻需保證每個業務應用有自己的工作機器id即可,而不需要單獨去搭建一個擷取分布式ID的應用。下面是推特版的Snowflake算法:

選擇開源元件首先需要看軟體特性是否滿足需求,主要包括相容性和擴充性。

其次需要看目前的技術能力,根據目前自己或者團隊的技術棧和技術能力,能否可以平滑的使用。假設一個元件是某語言開發的,而我對這個語言一無所知,那麼就不适合使用,如果強行要用,必然要投入更多的精力,要再三權衡投入和收益再做選擇。

第三,要看開源元件的社群,主要關注更新是否頻繁、項目是否有人維護、遇到坑的時候可以取得聯系尋求幫助、是否在業内被廣泛使用等。活躍的社群說明有許多使用者在使用,有句話說有人的地方就有江湖,其實在技術領域,有人的地方就有技術的進步,遇到坑就可以相對比較容易得到解決;如果是元件本身的問題,也會相對及時的得到修複。

Leaf是美團基礎研發平台推出的一個分布式ID生成服務,名字取自德國哲學家、數學家萊布尼茨的一句話:“There are no two identical leaves in the world.”Leaf具備高可靠、低延遲、全局唯一等特點。目前已經廣泛應用于美團金融、美團外賣、美團酒旅等多個部門。具體的技術細節,可參考美團技術部落格的一篇文章:《Leaf美團分布式ID生成服務》。目前,Leaf項目已經在Github上開源:https://github.com/Meituan-Dianping/Leaf。Leaf在特性如下:

全局唯一,絕對不會出現重複的ID,且ID整體趨勢遞增。

高可用,服務完全基于分布式架構,即使MySQL當機,也能容忍一段時間的資料庫不可用。

高并發低延時,在CentOS 4C8G的虛拟機上,遠端調用QPS可達5W+,TP99在1ms内。

接入簡單,直接通過公司RPC服務或者HTTP調用即可接入。

UidGenerator百度開源的一款基于Snowflake算法的分布式高性能唯一ID生成器。采用官網的一段描述:UidGenerator以元件形式工作在應用項目中, 支援自定義workerId位數和初始化政策, 進而适用于docker等虛拟化環境下執行個體自動重新開機、漂移等場景。 在實作上, UidGenerator通過借用未來時間來解決sequence天然存在的并發限制; 采用RingBuffer來緩存已生成的UID, 并行化UID的生産和消費, 同時對CacheLine補齊,避免了由RingBuffer帶來的硬體級「僞共享」問題. 最終單機QPS可達600萬。UidGenerator的GitHub位址:https://github.com/baidu/uid-generator

百度UidGenerator是Java語言的;最近一次送出記錄是兩年前,基本無人維護;隻支援雪花算法。

美團Leaf也是Java語言的;最近維護為2020年;支援号段模式和雪花算法。

綜上理論和兩款開源元件的對比,還是美團Leaf稍勝一籌。

你還知道哪些常用的分布式ID解決方案呢?

由于部落客也是在攀登的路上,文中可能存在不當之處,歡迎各位多指教! 如果文章對您有用,那麼請點個”推薦“,以資鼓勵!