天天看點

一文詳解 MD5 資訊摘要算法

對于軟體研發人員來說 MD5 不是一個陌生的詞彙,平時的軟體研發中,經常使用 MD5 校驗消息是否被篡改、驗證檔案完整性,甚至将MD5當作加密算法使用。

MD5雖不陌生,但不是所有研發人員都了解其算法原理,通過這篇文章詳細學習MD5 摘要算法。

  • 認識 MD5
  • 掌握 MD5 算法原理
  • 編碼實作 MD5 摘要算法

使用Java開發語言 編碼實作MD5摘要算法。

一、認識MD5

MD5(Message Digest Algorithm 5)中文名為

消息摘要算法第五版

,是計算機安全領域廣泛使用的一種

散列函數

,用以提供

消息

完整性保護

MD5作為一種常用的摘要算法(或指紋算法),其具有以下幾個重要的特點(個人觀點):

  • 輸入任意長度資訊,輸出長度固定:

MD5 可

輸入任意長度的資訊

,其輸出均為

128位(bit)

固定長度的

二進制資料

  • 運算速度快:

MD5的運算均為

32位 與、或、非、位移等位運算

,是以其運算速率快,幾乎不消耗CPU時間。

  • 不可逆:

根據

MD5的的散列

結果

無法計算

原始資料

(查字典除外)。

  • 碰撞性:

    原始資料

    與其

    MD5散列結果

    非一一對應

    ,存在

    多個原始資料

    MD5結果相同的可能性

    • 不安全:

2011年,

RFC 6151

禁止MD5用作密鑰散列消息認證碼。

1.1 長度

日常軟體研發中

MD5

計算結果一般為

長度為32的字元串

,偶爾也會遇到

長度為16的字元串

。那麼,MD5到底是多長的字元串?

MD5散列結果是

128位(bit)

二進制資料

,也就是

128個0/1

的二進資料。

128位二進制資料

呈現

MD5的散列結果

,對于軟體開發者很

不友好

一般将

二進制

轉成

16進制

,每

4個二進制資料

轉化為一個

16進制資料

128位二進制資料

轉化為

32個十六進制資料

128/4 = 32

),最終以

字元串形式

呈現十六進制資料後則為

長度為32的字元串

8位二進制資料,轉化為2個十六進制資料舉例如下:

// 8位二進制 ——> 2個十六進制資料
// 二進制資料
0100 0101
// 對應的 十六制資料
4 5           

為什麼網上還有16位MD5散列結果呢?

這裡以 Message Digest Algorithm 作為原始資料,分别計算其

32位

16位

的散列結果:

// 32位散列結果
MD5(Message Digest Algorithm,32) = e4b0190b2fadc0adbe54471ffd79a729
// 16位散列結果
MD5(Message Digest Algorithm,16) = 2fadc0adbe54471f           

仔細觀察以上

兩個散列結果

,發現其

中間部分完全相同

均為

2fadc0adbe54471f

是以猜測16位長度的散列結果為:32位散列結果去掉前八位、後八位得到的。

1.2 用途

平時的軟體研發中經常使用MD5校驗消息是否被篡改、驗證檔案完整性。

  • 驗證是否被篡改:

比如,上傳下載下傳檔案。

資料的 發送方 将原始資料生成MD5摘要,然後把 原始資料 與其 MD5摘要一起發送給 接收方;

接收方收到資料後,先将原始資料用MD5算法生成摘要資訊,然後再将此摘要資訊與發送方發過來的摘要資訊進行比較,如果一緻就認為原始資料沒有被修改、或者損壞。

  • 防止抵賴:

例如A寫了一個檔案,某認證機構對此檔案用MD5算法産生摘要資訊并做好記錄。

若以後A說這檔案不是他寫的,權威機構隻需對此檔案重新産生摘要資訊,然後跟記錄在冊的摘要資訊進行比對,若摘要資訊相同,則證明為A寫的檔案。

1.3 不安全

  • MD5不安全主要指的是,

    不可

    用MD5對原始秘鑰進行加密

比如:将使用者的登入秘鑰進行MD5加密後,存儲于資料庫中。

MD5雖然理論上不可逆,但有些黑客網站通過

查字典

方式擷取MD5原文資訊。

提前将一些比較常見的密文做MD5運算,将結果儲存下來,破譯密文時,通過MD5摘要資訊直接查詢原文。

比如:字元串

123

的MD5值是 202cb962ac59075b964b07152d234b70 ,黑客在破解後的資料庫中看到某位使用者的密碼是 202cb962ac59075b964b07152d234b70 ,通過字典一查就知道密碼明文是 123 了。

  • MD5的碰撞性,決定了存在兩個不用的輸入資訊,其MD5相同的可能。

2009年,中國科學院的謝濤和馮登國僅用了 2的20.96次幂 的碰撞算法複雜度,破解了MD5的碰撞抵抗,該攻擊在普通計算機上運作隻需要數秒鐘。

二、算法原理

MD5 摘要算法大概計算過程可以描述如下:

MD5 将 “輸入資訊” 分為

N*512bit

的資料分組;

每一

512bit

分組又分為

16個

子分組,每個子分組為

32bit

的原始資料;

16

個子分組分别命名為

M0~M15

每個子分組都要進行

4

次運算,運算公式分别為FF、GG、HH、II;

總的運算次數為

N*16*4

(運算均為位運算)。

“輸入資訊” 分組計算情況如下圖所示:

一文詳解 MD5 資訊摘要算法

以上為MD5 摘要算法的大概原理總結,下邊按照

rfc1321

中算法的介紹順序,梳理MD5 摘要算法:

  • 填充資料

填充資料,使

輸入資料 % 512 = 448

  • 填充長度資訊

補充 “輸入資訊” 位長 (Bits Length)資訊,占用空間64位

  • 初始化A、B、C、D 四個資料

初始化 A、B、C、D 四個資料,用于後續的分組計算

  • 分組資料運算

512bit

分組資料,需進行

16 * 4 = 64

次運算

  • 結果累加

2.1 填充資料

首先需要對 “輸入資訊” 進行填充,使其位長對

512求餘

結果

448

(填充必須進行,即使其位長對512求餘的結果等于448)。

填充資料的方式:

在 “輸入資訊” 的後面填充一個1和無數個0,直到滿足上面的條件時才停止資訊填充

填充後的 “輸入資訊” 其位長 (Bits Length) 将擴充到:

N*512+448

( N>=0 )

2.2 補充長度資訊

64bit

記錄 “輸入資訊” 的位長 (Bits Length),把64位長度二進制資料補在最後。

經過此步驟後,其位長 (Bits Length) 将擴充到:

N*512+448+64 = (N+1)*512

2.3 初始化A、B、C、D

這裡需要初始化四個資料 A、B、C、D,這四個變量将用于後續的公式計算。

四個資料均為

8

個16進制資料組合,每個16進制資料為

4bit

,每個資料占

32bit

// 每個資料占空間 32bit 
// 四個資料分别為 8個 16進制資料的組合構成
// 單個16進制資料占空間 4bit
A: 01 23 45 67 (16進制)
B: 89 ab cd ef (16進制)
C: fe dc ba 98 (16進制)
D: 76 54 32 10 (16進制)           

将A、B、C、D輸入計算機進行計算時,A、B、C、D将變化為:

A: 0x67452301
B: 0xefcdab89
C: 0x98badcfe
D: 0x10325476           

為什麼會變化為 0x67452301、0xefcdab89、0x98badcfe、0x10325476 ?

// A的16進制表示
A: 01 23 45 67 (16進制)
// A的二進制表示
A: 00000 0001 0010 0011 0100 0101 0110 0111 (二進制)
// 計算機中首先編寫的為低位元組位,當從右向左擷取位元組資料(8位一個位元組)時,最終A将變化為0x67452301
A: 67 45 23 01 (16進制)           

2.4 分組資料運算

上文層提到子分組的運算公式:FF、GG、HH、II ,

32bit子分組

運算公式

如下:

// FF、GG、HH、II
// <<< 為循環左移
FF(a ,b ,c ,d ,Mj ,s ,ti) 操作為 a = b + ( (a + F(b,c,d) + Mj + ti) <<< s)
GG(a ,b ,c ,d ,Mj ,s ,ti) 操作為 a = b + ( (a + G(b,c,d) + Mj + ti) <<< s)
HH(a ,b ,c ,d ,Mj ,s ,ti) 操作為 a = b + ( (a + H(b,c,d) + Mj + ti) <<< s)
II(a ,b ,c ,d ,Mj ,s ,ti) 操作為 a = b + ( (a + I(b,c,d) + Mj + ti) <<< s)

// F、G、H、I
F( X ,Y ,Z ) = ( X & Y ) | ( (~X) & Z )
G( X ,Y ,Z ) = ( X & Z ) | ( Y & (~Z) )
H( X ,Y ,Z ) =X ^ Y ^ Z
I( X ,Y ,Z ) =Y ^ ( X | (~Z) )           
  • 公式中初始輸入資料a、b、c、d 為A、B、C、D
  • Mj 代表32bit子分組資料,每個子分組資料均需要經過 FF、GG、HH、II 四次運算:

512bit原始輸入資料,有16個子分組,每個分組進行4次運算,總共16 * 4 = 64次運算。

  • s 常量資料,代表循環左移的位數。
  • ti 常量;

512bit分組資料,64 次位運算如下(輸入資料為32bit原始資料,輸出為32bit資料):

// 512bit分組資料,16 * 4 次運算
// 輸入資料為32bit原始資料,輸出為32bit資料
// 第一次運算FF
a = FF(a, b, c, d, M0, 7, 0xd76aa478L);
d = FF(d, a, b, c, M1, 12, 0xe8c7b756L);
c = FF(c, d, a, b, M2, 17, 0x242070dbL);
b = FF(b, c, d, a, M3, 22, 0xc1bdceeeL);
a = FF(a, b, c, d, M4, 7, 0xf57c0fafL);
d = FF(d, a, b, c, M5, 12, 0x4787c62aL);
c = FF(c, d, a, b, M6, 17, 0xa8304613L);
b = FF(b, c, d, a, M7, 22, 0xfd469501L);
a = FF(a, b, c, d, M8, 7, 0x698098d8L); 
d = FF(d, a, b, c, M9, 12, 0x8b44f7afL);
c = FF(c, d, a, b, M10, 17, 0xffff5bb1L);
b = FF(b, c, d, a, M11, 22, 0x895cd7beL);
a = FF(a, b, c, d, M12, 7, 0x6b901122L);
d = FF(d, a, b, c, M13, 12, 0xfd987193L);
c = FF(c, d, a, b, M14, 17, 0xa679438eL);
b = FF(b, c, d, a, M15, 22, 0x49b40821L);

// 第二輪運算GG
a = GG(a, b, c, d, M1, 5, 0xf61e2562L);
d = GG(d, a, b, c, M6, 9, 0xc040b340L);
c = GG(c, d, a, b, M11, 14, 0x265e5a51L);
b = GG(b, c, d, a, M0, 20, 0xe9b6c7aaL);
a = GG(a, b, c, d, M5, 5, 0xd62f105dL);
d = GG(d, a, b, c, M10, 9, 0x2441453L);
c = GG(c, d, a, b, M15, 14, 0xd8a1e681L);
b = GG(b, c, d, a, M4, 20, 0xe7d3fbc8L);
a = GG(a, b, c, d, M9, 5, 0x21e1cde6L);
d = GG(d, a, b, c, M14, 9, 0xc33707d6L);
c = GG(c, d, a, b, M3, 14, 0xf4d50d87L);
b = GG(b, c, d, a, M8, 20, 0x455a14edL);
a = GG(a, b, c, d, M13, 5, 0xa9e3e905L);
d = GG(d, a, b, c, M2, 9, 0xfcefa3f8L);
c = GG(c, d, a, b, M7, 14, 0x676f02d9L);
b = GG(b, c, d, a, M12, 20, 0x8d2a4c8aL);

// 第三輪運算HH
a = HH(a, b, c, d, M5, 4, 0xfffa3942L);
d = HH(d, a, b, c, M8, 11, 0x8771f681L);
c = HH(c, d, a, b, M11, 16, 0x6d9d6122L);
b = HH(b, c, d, a, M14, 23, 0xfde5380cL);
a = HH(a, b, c, d, M1, 4, 0xa4beea44L);
d = HH(d, a, b, c, M4, 11, 0x4bdecfa9L);
c = HH(c, d, a, b, M7, 16, 0xf6bb4b60L);
b = HH(b, c, d, a, M10, 23, 0xbebfbc70L);
a = HH(a, b, c, d, M13, 4, 0x289b7ec6L);
d = HH(d, a, b, c, M0, 11, 0xeaa127faL);
c = HH(c, d, a, b, M3, 16, 0xd4ef3085L);
b = HH(b, c, d, a, M6, 23, 0x4881d05L);
a = HH(a, b, c, d, M9, 4, 0xd9d4d039L);
d = HH(d, a, b, c, M12, 11, 0xe6db99e5L);
c = HH(c, d, a, b, M15, 16, 0x1fa27cf8L);
b = HH(b, c, d, a, M2, 23, 0xc4ac5665L);

// 第四輪運算II
a = II(a, b, c, d, M0, 6, 0xf4292244L);
d = II(d, a, b, c, M7, 10, 0x432aff97L);
c = II(c, d, a, b, M14, 15, 0xab9423a7L);
b = II(b, c, d, a, M5, 21, 0xfc93a039L);
a = II(a, b, c, d, M12, 6, 0x655b59c3L);
d = II(d, a, b, c, M3, 10, 0x8f0ccc92L);
c = II(c, d, a, b, M10, 15, 0xffeff47dL);
b = II(b, c, d, a, M1, 21, 0x85845dd1L);
a = II(a, b, c, d, M8, 6, 0x6fa87e4fL);
d = II(d, a, b, c, M15, 10, 0xfe2ce6e0L);
c = II(c, d, a, b, M6, 15, 0xa3014314L);
b = II(b, c, d, a, M13, 21, 0x4e0811a1L);
a = II(a, b, c, d, M4, 6, 0xf7537e82L);
d = II(d, a, b, c, M11, 10, 0xbd3af235L);
c = II(c, d, a, b, M2, 15, 0x2ad7d2bbL);
b = II(b, c, d, a, M9, 21, 0xeb86d391L);           

2.5 結果累加

若A、B、C、D為

變量

,并且A、B、C、D的初始化資訊為 A: 0x67452301;B: 0xefcdab89;C: 0x98badcfe;D: 0x10325476 ,每一512bit分組的運算結果為

a、b、c、d

。則第N個512bit組的計算結果為:

// a、b、c、d 為每一512bit分組的運算結果; 
// A、B、C、D 是下一組計算的輸入參數;
// 若無下一個512bit分組 A、B、C、D 則為最終計算結果;
A = a + A;  
B = b + B; 
C = c + C; 
D = d + D;           

三、編碼實作 MD5 摘要算法

網上找到一個用Java編碼實作MD5摘要算法的案例,我從頭到尾加了詳細的注釋。是以對于代碼實作,朋友們可以結合注釋讀代碼,打日志進行MD5摘要算法分析、學習。

/**
 * Java 實作MD5摘要算法:
 * 基本每一行我都加了注釋,是以不再對代碼進行詳細介紹,
 * 如有疑問,可聯系:[email protected]
 */
public class MD5Hash {

    /**
     * RFC1321中定義的标準4*4矩陣的常量:循環位移常量資料 s
     */
    static final int S11 = 7, S12 = 12, S13 = 17, S14 = 22;
    static final int S21 = 5, S22 = 9, S23 = 14, S24 = 20;
    static final int S31 = 4, S32 = 11, S33 = 16, S34 = 23;
    static final int S41 = 6, S42 = 10, S43 = 15, S44 = 21;

    /**
     * 填充資料 1000 0000 0000 ...
     * 長度:64*8 = 512bit
     * 注:-128為1000 0000
     */
    static final byte[] PADDING =
            {
                    -128, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
                    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
                    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
                    0, 0, 0, 0, 0, 0, 0
            };
    /**
     * a、b、c、d 四個變量
     */
    private long[] abcd = new long[4];

    /**
     * 512位元組分組資料緩沖 64*8=512bit
     */
    private byte[] buffer512Bit = new byte[64];
    // 輸入資料的位長資訊(64bit)
    private long[] inputBitCount = new long[2];


    /**
     * MD5計算結果
     */
    // MD5計算結果:16 * 8bit = 128bit
    public byte[] md5ByteArray = new byte[16];
    // MD5計算結果:字元串表示的MD5計算結果
    public String md5ResultStr;


    /**
     * 調用其可對任意字元串進行加密運算,并以字元串形式傳回加密結果。
     *
     * @param inputStr 輸入字元串
     * @return 輸入md5計算結果
     */
    public String getMD5(String inputStr) {
        // 資料初始化A、B、C、D
        md5Init();
        // 調用MD5的主計算過程
        md5Update(inputStr.getBytes(), inputStr.length());
        // 輸出結果到digest數組中
        md5Final();
        // 轉化為16進制字元串
        for (int i = 0; i < 16; i++) {
            md5ResultStr += byte2HEX(md5ByteArray[i]);
        }
        return md5ResultStr;
    }

    // #######################################################

    /**
     * 構造方法:初始化MD5核心變量
     */
    public MD5Hash() {
        md5Init();
    }

    /**
     * 初始化MD5核心變量
     */
    private void md5Init() {
        // 定義state為RFC1321中定義的标準幻數
        abcd[0] = 0x67452301L;
        abcd[1] = 0xefcdab89L;
        abcd[2] = 0x98badcfeL;
        abcd[3] = 0x10325476L;
        // 初始化 輸入資料的位長資訊
        inputBitCount[0] = inputBitCount[1] = 0L;

        // MD5計算結果:初始化digest數組元素為0
        for (int i = 0; i < 16; i++) {
            md5ByteArray[i] = 0;
        }
        // MD5計算結果:初始化resultStr
        md5ResultStr = "";
    }


    /**
     * MD5的主計算過程:
     *
     * @param inputByte    輸入資料位元組流
     * @param inputByteLen 輸入資料位元組長度
     */
    private void md5Update(byte[] inputByte, int inputByteLen) {
        int i, index, partLen;

        // 配置設定64個位元組分組緩沖區:64*8bit = 512bit
        byte[] blockByteArray = new byte[64];

        // 添加inputByte資訊前輸入資訊 位元組長度(取低6位)
        index = (int) (inputBitCount[0] >>> 3) & 0x3F;
        System.out.println("index: " + index);
        // 添加inputByteLen資訊後,最新的輸入資訊 位長
        // (inputByteLen << 3) = (inputByteLen * 8) 為輸入資料位長(bit length)
        if ((inputBitCount[0] += (inputByteLen << 3)) < (inputByteLen << 3)) {
            inputBitCount[1]++;
        }
        // 0
        inputBitCount[1] += (inputByteLen >>> 29);

        // 差多少滿512bit(64位元組)
        partLen = 64 - index;

        if (inputByteLen >= partLen) {
            // 拷貝 partLen 位元組資料
            // 資料運算
            md5Memcpy(buffer512Bit, inputByte, index, 0, partLen);
            md5Transform(buffer512Bit);
            //
            for (i = partLen; i + 63 < inputByteLen; i += 64) {
                // 拷貝64位元組資料
                // 資料運算
                md5Memcpy(blockByteArray, inputByte, 0, i, 64);
                md5Transform(blockByteArray);
            }
            index = 0;
        } else {
            i = 0;
        }
        // 拷貝64位元組資料
        md5Memcpy(buffer512Bit, inputByte, index, i, inputByteLen - i);
    }

    /**
     * 整理和填寫輸出結果,結果放到數組digest中。
     */
    private void md5Final() {
        /**
         * 64位輸入資料的位長資訊(bit length)
         * 數組中:低位在前,高位在後
         */
        // 8個位元組 緩存空間 8 * 8bit = 64bit
        byte[] bits = new byte[8];
        longArray2ByteArray(bits, inputBitCount, 8);

        // 輸入資訊的位元組數byte length
        int index = (int) (inputBitCount[0] >>> 3) & 0x3f;
        // 輸入資訊的位長<448,補充到448;輸入資訊的位長>=448,補充到(512+448)= 960,960/8=120位元組
        // (56 * 8bit = 448bit)
        int padLen = (index < 56) ? (56 - index) : (120 - index);

        /**
         * 資料填充: N * 512 + 448
         */
        md5Update(PADDING, padLen);
        /**
         * 1、資料填充: N * 512 + 448 + 64
         * 2、計算最後一個分組資料
         */
        md5Update(bits, 8);

        /**
         * 根據a、b、c、d 得到最終的 md5ByteArray 資料結果
         * 數組結果中(低位在前,高位在後)
         */
        longArray2ByteArray(md5ByteArray, abcd, 16);
    }

    /**
     * MD5核心變換計算程式: 由md5Update函數調用,block是分塊的原始位元組數組
     *
     * @param blockByteArray 512bit分組資料,分為16個子分組,每個分組32bit資料
     */
    private void md5Transform(byte blockByteArray[]) {
        // 初始化a、b、c、d
        long a = abcd[0], b = abcd[1], c = abcd[2], d = abcd[3];
        // 512bit分成16個子分組,每個分組32bit
        // 16 * 32bit = 512bit
        long[] M32 = new long[16];
        byteArray2LongArray(M32, blockByteArray, 64);
        // 進行4級級聯運算
        // 第1級
        a = FF(a, b, c, d, M32[0], S11, 0xd76aa478L); /* 1 */
        d = FF(d, a, b, c, M32[1], S12, 0xe8c7b756L); /* 2 */
        c = FF(c, d, a, b, M32[2], S13, 0x242070dbL); /* 3 */
        b = FF(b, c, d, a, M32[3], S14, 0xc1bdceeeL); /* 4 */
        a = FF(a, b, c, d, M32[4], S11, 0xf57c0fafL); /* 5 */
        d = FF(d, a, b, c, M32[5], S12, 0x4787c62aL); /* 6 */
        c = FF(c, d, a, b, M32[6], S13, 0xa8304613L); /* 7 */
        b = FF(b, c, d, a, M32[7], S14, 0xfd469501L); /* 8 */
        a = FF(a, b, c, d, M32[8], S11, 0x698098d8L); /* 9 */
        d = FF(d, a, b, c, M32[9], S12, 0x8b44f7afL); /* 10 */
        c = FF(c, d, a, b, M32[10], S13, 0xffff5bb1L); /* 11 */
        b = FF(b, c, d, a, M32[11], S14, 0x895cd7beL); /* 12 */
        a = FF(a, b, c, d, M32[12], S11, 0x6b901122L); /* 13 */
        d = FF(d, a, b, c, M32[13], S12, 0xfd987193L); /* 14 */
        c = FF(c, d, a, b, M32[14], S13, 0xa679438eL); /* 15 */
        b = FF(b, c, d, a, M32[15], S14, 0x49b40821L); /* 16 */

        // 第2級
        a = GG(a, b, c, d, M32[1], S21, 0xf61e2562L); /* 17 */
        d = GG(d, a, b, c, M32[6], S22, 0xc040b340L); /* 18 */
        c = GG(c, d, a, b, M32[11], S23, 0x265e5a51L); /* 19 */
        b = GG(b, c, d, a, M32[0], S24, 0xe9b6c7aaL); /* 20 */
        a = GG(a, b, c, d, M32[5], S21, 0xd62f105dL); /* 21 */
        d = GG(d, a, b, c, M32[10], S22, 0x2441453L); /* 22 */
        c = GG(c, d, a, b, M32[15], S23, 0xd8a1e681L); /* 23 */
        b = GG(b, c, d, a, M32[4], S24, 0xe7d3fbc8L); /* 24 */
        a = GG(a, b, c, d, M32[9], S21, 0x21e1cde6L); /* 25 */
        d = GG(d, a, b, c, M32[14], S22, 0xc33707d6L); /* 26 */
        c = GG(c, d, a, b, M32[3], S23, 0xf4d50d87L); /* 27 */
        b = GG(b, c, d, a, M32[8], S24, 0x455a14edL); /* 28 */
        a = GG(a, b, c, d, M32[13], S21, 0xa9e3e905L); /* 29 */
        d = GG(d, a, b, c, M32[2], S22, 0xfcefa3f8L); /* 30 */
        c = GG(c, d, a, b, M32[7], S23, 0x676f02d9L); /* 31 */
        b = GG(b, c, d, a, M32[12], S24, 0x8d2a4c8aL); /* 32 */

        // 第3級
        a = HH(a, b, c, d, M32[5], S31, 0xfffa3942L); /* 33 */
        d = HH(d, a, b, c, M32[8], S32, 0x8771f681L); /* 34 */
        c = HH(c, d, a, b, M32[11], S33, 0x6d9d6122L); /* 35 */
        b = HH(b, c, d, a, M32[14], S34, 0xfde5380cL); /* 36 */
        a = HH(a, b, c, d, M32[1], S31, 0xa4beea44L); /* 37 */
        d = HH(d, a, b, c, M32[4], S32, 0x4bdecfa9L); /* 38 */
        c = HH(c, d, a, b, M32[7], S33, 0xf6bb4b60L); /* 39 */
        b = HH(b, c, d, a, M32[10], S34, 0xbebfbc70L); /* 40 */
        a = HH(a, b, c, d, M32[13], S31, 0x289b7ec6L); /* 41 */
        d = HH(d, a, b, c, M32[0], S32, 0xeaa127faL); /* 42 */
        c = HH(c, d, a, b, M32[3], S33, 0xd4ef3085L); /* 43 */
        b = HH(b, c, d, a, M32[6], S34, 0x4881d05L); /* 44 */
        a = HH(a, b, c, d, M32[9], S31, 0xd9d4d039L); /* 45 */
        d = HH(d, a, b, c, M32[12], S32, 0xe6db99e5L); /* 46 */
        c = HH(c, d, a, b, M32[15], S33, 0x1fa27cf8L); /* 47 */
        b = HH(b, c, d, a, M32[2], S34, 0xc4ac5665L); /* 48 */

        // 第4級
        a = II(a, b, c, d, M32[0], S41, 0xf4292244L); /* 49 */
        d = II(d, a, b, c, M32[7], S42, 0x432aff97L); /* 50 */
        c = II(c, d, a, b, M32[14], S43, 0xab9423a7L); /* 51 */
        b = II(b, c, d, a, M32[5], S44, 0xfc93a039L); /* 52 */
        a = II(a, b, c, d, M32[12], S41, 0x655b59c3L); /* 53 */
        d = II(d, a, b, c, M32[3], S42, 0x8f0ccc92L); /* 54 */
        c = II(c, d, a, b, M32[10], S43, 0xffeff47dL); /* 55 */
        b = II(b, c, d, a, M32[1], S44, 0x85845dd1L); /* 56 */
        a = II(a, b, c, d, M32[8], S41, 0x6fa87e4fL); /* 57 */
        d = II(d, a, b, c, M32[15], S42, 0xfe2ce6e0L); /* 58 */
        c = II(c, d, a, b, M32[6], S43, 0xa3014314L); /* 59 */
        b = II(b, c, d, a, M32[13], S44, 0x4e0811a1L); /* 60 */
        a = II(a, b, c, d, M32[4], S41, 0xf7537e82L); /* 61 */
        d = II(d, a, b, c, M32[11], S42, 0xbd3af235L); /* 62 */
        c = II(c, d, a, b, M32[2], S43, 0x2ad7d2bbL); /* 63 */
        b = II(b, c, d, a, M32[9], S44, 0xeb86d391L); /* 64 */

        //分别累加到 a[0], b[1], c[2], d[3]
        abcd[0] += a;
        abcd[1] += b;
        abcd[2] += c;
        abcd[3] += d;
    }


    // #######################################################

    //定義F G H I 為4個基數 ,即為4個基本的MD5函數,進行簡單的位運算
    private long F(long x, long y, long z) {
        return (x & y) | ((~x) & z);
    }

    private long G(long x, long y, long z) {
        return (x & z) | (y & (~z));
    }

    private long H(long x, long y, long z) {
        return x ^ y ^ z;
    }

    private long I(long x, long y, long z) {
        return y ^ (x | (~z));
    }

    // FF,GG,HH和II調用F,G,H,I函數進行進一步變換
    private long FF(long a, long b, long c, long d, long x, long s, long ac) {
        a += F(b, c, d) + x + ac;
        // 循環左移s位
        //這裡long型資料右移時使用無符号右移運算符>>>
        a = ((int) a << s) | ((int) a >>> (32 - s));
        a += b;
        return a;
    }

    private long GG(long a, long b, long c, long d, long x, long s, long ac) {
        a += G(b, c, d) + x + ac;
        // 循環左移s位
        //這裡long型資料右移時使用無符号右移運算符>>>
        a = ((int) a << s) | ((int) a >>> (32 - s));
        a += b;
        return a;
    }

    private long HH(long a, long b, long c, long d, long x, long s, long ac) {
        a += H(b, c, d) + x + ac;
        // 循環左移s位
        //這裡long型資料右移時使用無符号右移運算符>>>
        a = ((int) a << s) | ((int) a >>> (32 - s));
        a += b;
        return a;
    }

    private long II(long a, long b, long c, long d, long x, long s, long ac) {
        a += I(b, c, d) + x + ac;
        // 循環左移s位
        //這裡long型資料右移時使用無符号右移運算符>>>
        a = ((int) a << s) | ((int) a >>> (32 - s));
        a += b;
        return a;
    }

    // #######################################################


    /**
     * byte數組的塊拷貝函數:将input數組中的起始位置為inpos,長度len的資料拷貝到output數組起始位置outpos處
     */
    private void md5Memcpy(byte[] output, byte[] input, int outpos, int inpos,
                           int len) {
        int i;
        for (i = 0; i < len; i++) {
            output[outpos + i] = input[inpos + i];
        }
    }

    // #######################################################


    /**
     * 把byte類型的資料轉換成十六進制ASCII字元表示
     *
     * @param in
     * @return
     */
    private static String byte2HEX(byte in) {
        char[] digitStr =
                {
                        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
                        'A', 'B', 'C', 'D', 'E', 'F'
                };
        char[] out = new char[2];
        out[0] = digitStr[(in >> 4) & 0x0F]; //取高4位
        out[1] = digitStr[in & 0x0F];        //取低4位
        String s = new String(out);
        return s;
    }

    /**
     * 将long型數組按順序拆成byte型數組 (低位在前,高位在後)
     *
     * @param outputByteArray 輸出byte數組
     * @param inputLongArray  輸入long數組
     * @param byteLength      outputByteArray位元組數組的長度
     */
    private void longArray2ByteArray(byte[] outputByteArray, long[] inputLongArray, int byteLength) {
        int i, j;
        for (i = 0, j = 0; j < byteLength; i++, j += 4) {
            // 低8位
            outputByteArray[j] = (byte) (inputLongArray[i] & 0xffL);
            // 中間8位[低]
            outputByteArray[j + 1] = (byte) ((inputLongArray[i] >>> 8) & 0xffL);
            // 中間8位[高]
            outputByteArray[j + 2] = (byte) ((inputLongArray[i] >>> 16) & 0xffL);
            // 高8位
            outputByteArray[j + 3] = (byte) ((inputLongArray[i] >>> 24) & 0xffL);
        }
    }

    /**
     * 将byte型數組按順序合成long型數組,長度為len
     *
     * @param output
     * @param input
     * @param len
     */
    private void byteArray2LongArray(long[] output, byte[] input, int len) {
        int i, j;
        for (i = 0, j = 0; j < len; i++, j += 4) {
            output[i] = byte2Long(input[j])
                    | (byte2Long(input[j + 1]) << 8)
                    | (byte2Long(input[j + 2]) << 16)
                    | (byte2Long(input[j + 3]) << 24);
        }
    }

    /**
     * 把byte型資料轉換為無符号long型資料
     *
     * @param b
     * @return
     */
    private static long byte2Long(byte b) {
        return b > 0 ? b : (b & 0x7F + 128);
    }
}

           

四、MD5 API使用

Java中使用Java API實作MD5的代碼片段,記錄一下,留着以後 coding 時快速使用:

public static String getMd5(String inputStr) {
    String md5Str = "";
    // 判空處理
    if (inputStr == null || inputStr.equals("")) {
        return md5Str;
    }
    try {
        //
        // 1、得到長度為16的byte位元組數組
        MessageDigest md = MessageDigest.getInstance("md5");
        md.update(inputStr.getBytes());
        byte[] bytes = md.digest();
        //
        // 2、長度為16的byte位元組數組,轉化為長度為32的字元串
        StringBuilder sb = new StringBuilder();
        for (byte b : bytes) {
            // 轉化為16進制字元串
            String hexStr = Integer.toHexString(b & 0xFF);
            // 字元串長度為1時補0
            if (hexStr.length() == 1) {
                sb.append("0");
            }
            sb.append(hexStr);
        }
        // 得到長度為32的字元串
        md5Str = sb.toString();
    } catch (Exception e) {
        e.printStackTrace();
    }
    return md5Str;
}           

五、參考:

MD5 Message-Digest: https://datatracker.ietf.org/doc/html/rfc1321 RFC 6151: https://datatracker.ietf.org/doc/html/rfc6151 維基百科MD5: https://zh.wikipedia.org/wiki/MD5 MD5算法原理: https://www.cnblogs.com/nhdlb/p/12007162.html MD5算法: https://blog.csdn.net/sinat_27933301/article/details/79538169

= THE END =

文章首發于公衆号”CODING技術小館“,如果文章對您有幫助,可關注我的公衆号。