小明:老師,最近老闆讓我研究微信支付的接口文檔,可是有個地方我總是弄不明白。
老師:什麼地方不明白,說來聽聽。
小明:微信支付的接口有許多業務參數,還有一個參數Sign。微信方給了我一個Key,讓我把業務參數和Key按一定規則拼接起來,生成Sign參數。着到底是什麼鬼?
老師:你連這個都不知道呀?這是為了網絡傳輸安全所做的【信息摘要】簽名,簽名通常使用【MD5算法】來生成的。
小明:MD5算法?那是什麼玩意?為什麼可以實現網絡安全?
老師:要想弄清楚MD5算法,我們需要先從信息摘要的意義說起。一個應用産品對接微信支付平台,發起支付請求,正常的流程應該是下面這樣:
可是,網絡傳輸并非絕對安全可靠。一旦支付請求被中間人攔截并惡意篡改(利用DNS欺騙,ARP欺騙),就會改變流程:
這種場景下就需要信息摘要技術了。信息摘要把明文内容按某種規則生成一段哈希值,即使明文信息隻改動了一點點,生成的結果也完全不同。MD5(Message-digest algorithm 5)就是信息摘要的一種實現,它可以從任意長度的明文字符串生成128位的哈希值。
摘要哈希生成的正确姿勢是什麼樣呢?分三步:
1.收集相關業務參數,在這裡是金額和目标賬戶。當然,實際應用中的參數肯定比這多得多,這裡隻是做了簡化。
2.按照規則,把參數名和參數值拼接成一個字符串,同時把給定的密鑰也拼接起來。之所以需要密鑰,是因為攻擊者也可能獲知拼接規則。
3.利用MD5算法,從原文生成哈希值。MD5生成的哈希值是128位的二進制數,也就是32位的十六進制數。
使用MD5算法以後,發起支付請求的流程會變成什麼樣呢?我們來看一看:
第三方支付平台如何驗證請求的簽名?同樣分三步:
1.發送方和請求方約定相同的字符串拼接規則,約定相同的密鑰。
2.第三方平台接到支付請求,按規則拼接業務參數和密鑰,利用MD5算法生成Sign。
3.用第三方平台自己生成的Sign和請求發送過來的Sign做對比,如果兩個Sign值一模一樣,則簽名無誤,如果兩個Sign值不同,則信息做了篡改。這個過程叫做驗簽。
小明:還真是保證信息安全的好方法。MD5的哈希值在底層是如何生成呢?
老師:這是個好問題,隻有把底層細節弄明白,才算是真正掌握一門技術。MD5算法就像一個精密複雜的加工廠,在多條流水線交替協作下生成了最終的哈希值。下面的内容會比較燒腦。
MD5算法底層原理:
簡單概括起來,MD5算法的過程分為四步:處理原文,設置初始值,循環加工,拼接結果。
第一步:處理原文
首先,我們計算出原文長度(bit)對512求餘的結果,如果不等于448,就需要填充原文使得原文對512求餘的結果等于448。填充的方法是第一位填充1,其餘位填充0。填充完後,信息的長度就是512*N 448。
之後,用剩餘的位置(512-448=64位)記錄原文的真正長度,把長度的二進制值補在最後。這樣處理後的信息長度就是512*(N 1)。
第二步:設置初始值
MD5的哈希結果長度為128位,按每32位分成一組共4組。這4組結果是由4個初始值A、B、C、D經過不斷演變得到。MD5的官方實現中,A、B、C、D的初始值如下(16進制):
A=0x01234567
B=0x89ABCDEF
C=0xFEDCBA98
D=0x76543210
第三步:循環加工
這一步是最複雜的一步,我們看看下面這張圖,此圖代表了單次A,B,C,D值演變的流程。
圖中,A,B,C,D就是哈希值的四個分組。每一次循環都會讓舊的ABCD産生新的ABCD。一共進行多少次循環呢?由處理後的原文長度決定。
假設處理後的原文長度是M
主循環次數 = M / 512
每個主循環中包含 512 / 32 * 4 = 64 次 子循環。
上面這張圖所表達的就是單次子循環的流程。
下面對圖中其他元素一一解釋:
1.綠色F
圖中的綠色F,代表非線性函數。官方MD5所用到的函數有四種:
F(X, Y, Z) =(X&Y) | ((~X) & Z)
G(X, Y, Z) =(X&Z) | (Y & (~Z))
H(X, Y, Z) =X^Y^Z
I(X, Y, Z)=Y^(X|(~Z))
在主循環下面64次子循環中,F、G、H、I 交替使用,第一個16次使用F,第二個16次使用G,第三個16次使用H,第四個16次使用I。
2.紅色“田”字
很簡單,紅色的田字代表相加的意思。
3.Mi
Mi是第一步處理後的原文。在第一步中,處理後原文的長度是512的整數倍。把原文的每512位再分成16等份,命名為M0~M15,每一等份長度32。在64次子循環中,每16次循環,都會交替用到M1~M16之一。
4.Ki
一個常量,在64次子循環中,每一次用到的常量都是不同的。
5.黃色的<<<S
左移S位,S的值也是常量。
“流水線”的最後,讓計算的結果和B相加,取代原先的B。新ABCD的産生可以歸納為:
新A = 原d
新B = b ((a F(b,c,d) Mj Ki)<<<s)
新C = 原b
新D = 原c
總結一下主循環中的64次子循環,可以歸納為下面的四部分:
第一輪:
FF(a,b,c,d,M0,7,0xd76aa478) s[0]=7, K[0] = 0xd76aa478
FF(a,b,c,d,M1,12,0xe8c7b756) s[1]=12, K[1] = 0xe8c7b756
FF(a,b,c,d,M2,17,0x242070db)
FF(a,b,c,d,M3,22,0xc1bdceee)
FF(a,b,c,d,M4,7,0xf57c0faf)
FF(a,b,c,d,M5,12,0x4787c62a)
FF(a,b,c,d,M6,17,0xa8304613)
FF(a,b,c,d,M7,22,0xfd469501)
FF(a,b,c,d,M8,7,0x698098d8)
FF(a,b,c,d,M9,12,0x8b44f7af)
FF(a,b,c,d,M10,17,0xffff5bb1)
FF(a,b,c,d,M11,22,0x895cd7be)
FF(a,b,c,d,M12,7,0x6b901122)
FF(a,b,c,d,M13,12,0xfd987193)
FF(a,b,c,d,M14,17, 0xa679438e)
FF(a,b,c,d,M15,22,0x49b40821)
第二輪:
GG(a,b,c,d,M1,5,0xf61e2562)
GG(a,b,c,d,M6,9,0xc040b340)
GG(a,b,c,d,M11,14,0x265e5a51)
GG(a,b,c,d,M0,20,0xe9b6c7aa)
GG(a,b,c,d,M5,5,0xd62f105d)
GG(a,b,c,d,M10,9,0x02441453)
GG(a,b,c,d,M15,14,0xd8a1e681)
GG(a,b,c,d,M4,20,0xe7d3fbc8)
GG(a,b,c,d,M9,5,0x21e1cde6)
GG(a,b,c,d,M14,9,0xc33707d6)
GG(a,b,c,d,M3,14,0xf4d50d87)
GG(a,b,c,d,M8,20,0x455a14ed)
GG(a,b,c,d,M13,5,0xa9e3e905)
GG(a,b,c,d,M2,9,0xfcefa3f8)
GG(a,b,c,d,M7,14,0x676f02d9)
GG(a,b,c,d,M12,20,0x8d2a4c8a)
第三輪:
HH(a,b,c,d,M5,4,0xfffa3942)
HH(a,b,c,d,M8,11,0x8771f681)
HH(a,b,c,d,M11,16,0x6d9d6122)
HH(a,b,c,d,M14,23,0xfde5380c)
HH(a,b,c,d,M1,4,0xa4beea44)
HH(a,b,c,d,M4,11,0x4bdecfa9)
HH(a,b,c,d,M7,16,0xf6bb4b60)
HH(a,b,c,d,M10,23,0xbebfbc70)
HH(a,b,c,d,M13,4,0x289b7ec6)
HH(a,b,c,d,M0,11,0xeaa127fa)
HH(a,b,c,d,M3,16,0xd4ef3085)
HH(a,b,c,d,M6,23,0x04881d05)
HH(a,b,c,d,M9,4,0xd9d4d039)
HH(a,b,c,d,M12,11,0xe6db99e5)
HH(a,b,c,d,M15,16,0x1fa27cf8)
HH(a,b,c,d,M2,23,0xc4ac5665)
第四輪:
Ⅱ(a,b,c,d,M0,6,0xf4292244)
Ⅱ(a,b,c,d,M7,10,0x432aff97)
Ⅱ(a,b,c,d,M14,15,0xab9423a7)
Ⅱ(a,b,c,d,M5,21,0xfc93a039)
Ⅱ(a,b,c,d,M12,6,0x655b59c3)
Ⅱ(a,b,c,d,M3,10,0x8f0ccc92)
Ⅱ(a,b,c,d,M10,15,0xffeff47d)
Ⅱ(a,b,c,d,M1,21,0x85845dd1)
Ⅱ(a,b,c,d,M8,6,0x6fa87e4f)
Ⅱ(a,b,c,d,M15,10,0xfe2ce6e0)
Ⅱ(a,b,c,d,M6,15,0xa3014314)
Ⅱ(a,b,c,d,M13,21,0x4e0811a1)
Ⅱ(a,b,c,d,M4,6,0xf7537e82)
Ⅱ(a,b,c,d,M11,10,0xbd3af235)
Ⅱ(a,b,c,d,M2,15,0x2ad7d2bb)
Ⅱ(a,b,c,d,M9,21,0xeb86d391)
第四步:拼接結果
這一步就很簡單了,把循環加工最終産生的A,B,C,D四個值拼接在一起,轉換成字符串即可。
小明:MD5的生成過程也太複雜了吧
老師:确實很複雜,這樣保證了MD5哈希值的均勻分布,以及加密的安全性。
小明:既然MD5算法這麼厲害,應該沒有人能夠破解它吧?
老師:不,雖然有一定困難,但是MD5還是可以被破解的。具體的破解方法,我們下次再來讨論。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!