ULID ：Universally Unique Lexicographically Sortable Identifier（通用唯一詞典分類辨別符）

UUID ：Universally Unique Identifier（通用唯一辨別符）

為什麼不選擇UUID

UUID 目前有 5 個版本：

版本1：在許多環境中是不切實際的，因為它需要通路唯一的，穩定的MAC位址，容易被攻擊；

版本2：将版本 1 的時間戳前四位換為 POSIX 的 UID 或 GID，問題同上；

版本3：基于 MD5 雜湊演算法生成，生成随機分布的ID需要唯一的種子，這可能導緻許多資料結構碎片化；

版本4：基于随機數或僞随機數生成，除了随機性外沒有提供其他資訊；

版本5：通過 SHA-1 雜湊演算法生成，生成随機分布的ID需要唯一的種子，這可能導緻許多資料結構碎片化；

這裡面常用的就是 UUID4 了，但是，即使是随機的，但是也是存在沖突的風險。

和 UUID 要麼基于随機數，要麼基于時間戳不同，ULID 是既基于時間戳又基于随機數，時間戳精确到毫秒，毫秒内有1.21e + 24個随機數，不存在沖突的風險，而且轉換成字元串比 UUID 更加友好。

ULID特性

ulid() # 01ARZ3NDEKTSV4RRFFQ69G5FAV

與UUID的128位相容性
每毫秒1.21e + 24個唯一ULID
按字典順序(也就是字母順序)排序！
規範地編碼為26個字元串，而不是UUID的36個字元
使用Crockford的base32獲得更好的效率和可讀性（每個字元5位）
不區分大小寫
沒有特殊字元（URL安全）
單調排序順序（正确檢測并處理相同的毫秒）

ULID規範

以下是在python(ulid-py)中實作的ULID的目前規範。二進制格式已實作

01AN4Z07BY      79KA1307SR9X4MV3


|----------|    |----------------|
 Timestamp          Randomness
  10chars            16chars
   48bits             80bits

組成

時間戳

48位整數
UNIX時間（以毫秒為機關）
直到公元10889年，空間都不會耗盡。

随機性

80位随機數
如果可能的話，采用加密技術保證随機性

排序

最左邊的字元必須排在最前面，最右邊的字元必須排在最後（詞彙順序）。必須使用預設的ASCII字元集。在同一毫秒内，不能保證排序順序

編碼方式

如圖所示，使用了Crockford的Base32。該字母表不包括字母I，L，O和U，以避免混淆和濫用。

0123456789ABCDEFGHJKMNPQRSTVWXYZ

二進制布局和位元組順序

元件被編碼為16個八位位組。每個元件都以最高有效位元組在前（網絡位元組順序）進行編碼。

0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      32_bit_uint_time_high                    |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|     16_bit_uint_time_low      |       16_bit_uint_random      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                       32_bit_uint_random                      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                       32_bit_uint_random                      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

應用場景

替換資料庫自增id，無需DB參與主鍵生成
分布式環境下，替換UUID，全局唯一且毫秒精度有序
比如要按日期對資料庫進行分區分表，可以使用ULID中嵌入的時間戳來選擇正确的分區分表
如果毫秒精度是可以接受的（毫秒内無序），可以按照ULID排序，而不是單獨的created_at字段

用法（python）

安裝

pip install ulid-py

建立一個全新的ULID。

時間戳記值（48位）來自 time.time()，精度為毫秒。

随機值（80位）來自 os.urandom()。

>>> import ulid
>>> ulid.new()
<ULID('01BJQE4QTHMFP0S5J153XCFSP9')>

根據現有的128位值（例如UUID）建立新的ULID 。

支援ULID值類型有 int，bytes，str，和UUID。

>>> import ulid, uuid
>>> value = uuid.uuid4()
>>> value
UUID('0983d0a2-ff15-4d83-8f37-7dd945b5aa39')
>>> ulid.from_uuid(value)
<ULID('09GF8A5ZRN9P1RYDVXV52VBAHS')>

從現有時間戳值（例如datetime對象）建立新的ULID 。

支援時間戳值類型有int，float，str，bytes，bytearray，memoryview，datetime，Timestamp，和ULID

>>> import datetime, ulid
>>> ulid.from_timestamp(datetime.datetime(1999, 1, 1))
<ULID('00TM9HX0008S220A3PWSFVNFEH')>

根據現有的随機數建立一個新的ULID。

支援随機值類型有int，float，str，bytes，bytearray，memoryview，Randomness，和ULID。

>>> import os, ulid
>>> randomness = os.urandom(10)
>>> ulid.from_randomness(randomness)
>>> <ULID('01BJQHX2XEDK0VN0GMYWT9JN8S')>

一旦有了ULID對象，就有多種與之互動的方法。

timestamp()方法将為您提供ULID的前48位的時間戳快照，而randomness()方法将為您提供後80位的随機數快照。

>>> import ulid
>>> u = ulid.new()
>>> u
<ULID('01BJQM7SC7D5VVTG3J68ABFQ3N')>
>>> u.timestamp()
<Timestamp('01BJQM7SC7')>
>>> u.randomness()
<Randomness('D5VVTG3J68ABFQ3N')>

github：https://github.com/ahawker/ulid

作者丨pushiqiang

來源丨網址：blog.csdn.net/pushiqiang/article/details/117365290

dbaplus社群歡迎廣大技術人員投稿，投稿郵箱：[email protected]

活動推薦

2024 XCOPS智能運維管理人年會·廣州站将于5月24日舉辦，深究大模型、AI Agent等新興技術如何落地于運維領域，賦能企業智能運維水準提升，建構全面運維自治能力！

會議詳情：2024 XCOPS智能運維管理人年會-廣州站

講真！ULID 比 UUID 好用多了……

活動推薦