以數據為中心的專用處理器“DPU”正在成為“新貴”。圖片來源:unsplash
近年來摩爾定律“失速”,使得中央處理器(CPU)的性能增長邊際成本急劇上升。有研究數據表明,現在CPU的性能年化增長率(面積歸一化之後)僅有3%左右。然而,人們對計算的需求依然爆發性增長。
在此背景下,包括人工智能(AI)芯片在内的專用計算芯片陸續登上曆史舞台,綻放光芒。眼下,以數據為中心的專用處理器“DPU”正成為專用計算芯片的“新貴”。美國芯片巨頭英偉達公司甚至将其定位為數據中心繼CPU和圖形處理器(GPU)之後的“第三顆主力芯片”,掀起了行業熱潮。
和CPU、GPU“三足鼎立”,DPU真有如此大的潛力嗎?它的應用場景有哪些?我國能抓住DPU發展機遇嗎?近日,由中國科學院計算技術研究所(以下簡稱中科院計算所)主編,中科馭數(北京)科技有限公司、中國計算機學會集成電路設計專業組、計算機體系結構國家重點實驗室聯合編寫的行業首部《專用數據處理器(DPU)技術白皮書》(以下簡稱《DPU技術白皮書》)發布。結合上述問題,《中國科學報》聯系采訪了主要編寫人員一探究竟。
給CPU“減負”,為數據中心“降‘稅’”
“DPU最直接的作用是作為CPU的卸載(offload)引擎,其效果是給CPU‘減負’。”《DPU技術白皮書》主編、中科院計算所研究員鄢貴海告訴《中國科學報》,作一形象比喻,DPU提供了數據中心一把“殺雞”的工具,節省的是CPU這把“牛刀”,以釋放CPU算力,留給更需要它的業務負載。
接管CPU的網絡協議處理任務,就是一個很好的例子。鄢貴海說,比如在數據中心僅線速處理10G的網絡,大概就需要一個8核高端CPU一半的的算力,而如果是40G、100G甚至更高速的網絡,性能開銷更大。
雲計算巨頭亞馬遜雲服務(AWS)形象地稱之為“數據中心稅”——還未運行業務程序,接入網絡數據就要占去許多計算資源。
“DPU誕生的使命就是承載網絡虛拟化、硬件資源池化等基礎設施層服務,以釋放CPU的算力到上層應用。”《DPU技術白皮書》編委會成員、中科馭數高級副總裁張宇解釋說,将“CPU處理效率低下、GPU處理不了”的負載卸載到專用的DPU,就能實現對“數據中心稅”的抵消,從而有助于提升整個計算系統的效率、降低整體系統的總體擁有成本。
張宇介紹稱,DPU主要處理網絡數據和輸入輸出(IO)數據,并提供帶寬壓縮、安全加密、網絡功能虛拟化等功能。“這些可以說是離我們普通用戶每天感知到的各種應用最遠的功能了。而這些基礎功能是實現日常應用更高效、更安全、更實時的保障。”
DPU的三個中文名
業界對DPU中的“D”有三種說法,因此DPU就有三個中文名。
一種是“Data”,DPU被稱為“數據處理器”;一種是“Datacenter”,DPU譯作“數據中心處理器”;一種是“Data-centric”,相應的,DPU可叫作“以數據為中心的處理器”。
中科院計算所研究員、中國計算機學會集成電路設計專業組副主任李曉維向記者解釋說,這三種說法,乍一看意義差不多,但各有側重:“數據處理器”既區别于信号處理器、基帶處理器等“信号”處理,也區别于專門處理圖形圖像類數據的GPU,而是把各類時序化、結構化的數據放在核心位置;“數據中心處理器”隻是偏重于描述DPU的應用場景,但顯然它無法指代所有“服務于數據中心的處理器”;第三種說法則體現了DPU的設計理念,體現了計算架構從“以控制為中心”向“以數據為中心”的演進。
“以上三種關于DPU的說法,從不同角度反映DPU的特征,都有一定的可取之處,我們認為可以作為不同的三個維度來理解DPU的内涵。”李曉維說。
“随着‘軟件硬件化’成為常态,異構計算的潛能将因各種DPU的普及而徹底發揮出來。”《DPU技術白皮書》編委會成員、中科馭數聯合創始人兼CTO盧文岩認為,新一代的DPU不僅可以作為運算的加速引擎,還具備“控制平面”(即追求數據處理功能的覆蓋面)的功能,能更高效地完成網絡虛拟化、IO虛拟化、存儲虛拟化等任務,徹底将CPU的算力釋放給應用程序。
“可以說,DPU的出現将讓各行各業的業務層數字化應用更全面、更流暢、更綠色。”盧文岩說。
孕育已久
從市場規模角度來看,根據Fungible公司和英偉達公司的預測,用于數據中心的DPU量級将達到和數據中心服務器等量的級别。
“服務器每年新增大約千萬量級,一台服務器可能沒有GPU,但一定會有一顆或者多顆DPU,好比每台服務器都必須配網卡一樣。”鄢貴海說,服務器每年新增大約1500萬台,每顆DPU以1萬元計算,這将是千億量級的市場規模。
在這個千億量級市場中,國際傳統芯片巨頭如英偉達、英特爾、Marwell、博通等廠商,都在積極布局DPU産品研發。
這些芯片巨頭的布局并不意外,他們或有智能網卡研發基礎(如博通)繼續延伸技術觸角,或通過并購專用加速芯片公司(如英偉達、英特爾)補充其在DPU領域的技術能力。相比它們,更值得一提的是,亞馬遜旗下的AWS和阿裡雲兩大雲計算巨頭,早已注意到數據中心開銷問題,并已有了良好實踐。
據《DPU技術白皮書》顯示,2013年,AWS研發了Nitro産品,将為虛拟機提供遠程資源、加密解密、故障跟蹤、安全策略等服務程序的資源開銷,全部放到專用加速器上執行,“輕量化管理程序 定制化硬件”的上場一舉節省30%CPU資源。幾乎在同期,阿裡雲也着手研發“神龍架構”(X-Dragon系統),以硬件化的MOC卡統一支持網絡、IO、存儲和外設的虛拟化,如今“神龍架構”已經更叠到了第4代。
“可見,DPU其實在行業内已經孕育已久,從早期的網絡協議處理卸載,到後續的網絡、存儲、虛拟化卸載,其帶來的作用非常顯著,隻不過在此之前DPU‘有實無名’,現在是時候邁上一個新的台階了。”鄢貴海表示。
可喜的是,國内一些圍繞DPU技術的創業公司也逐漸嶄露頭角。除了參與編寫《DPU技術白皮書》的中科馭數之外,還有雲豹智能、星雲智聯、芯啟源、雲脈芯聯等新近成立的科技創業公司,展現出良好勢頭。
以中科馭數為例,這家創始團隊來自中科院計算所的初創企業,在DPU理論基礎、數據中心架構方面有着深刻理解,工程實現經驗也因一些來自亞馬遜、賽靈思、華為等核心骨幹的加入,得到了很好的積累。2019年,中科馭數完成第一代DPU芯片的流片,預計将于2022年推出第二代DPU芯片“K2”。
與國外廠商“逐鹿中原”
“我們認為DPU的潛力确實是巨大的。”在鄢貴海看來,從技術發展的角度來看,DPU的出現有一定的必然性——上層應用對于算力的需求在過去5年急劇增長,使得DPU的應用場景很多,它将廣泛分布在5G、雲計算、大數據、數據中心和邊緣計算等領域。
而從工業和信息化部今年發布的《新型數據中心發展三年行動計劃(2021—2023年)》中,鄢貴海更是看到了新型算力芯片難得的曆史發展機遇。
該計劃明确提出要加快提升算力算效水平,“推動CPU、GPU等異構算力提升,逐步提高自主研發算力的部署比例”“加強專用服務器等核心技術研發”“樹立基于5G和工業互聯網等重點應用場景的邊緣數據中心應用标杆”等要求和措施。
“雖然國内廠商在芯片産品化的環節相比國外一線廠商還有差距,但是在DPU架構的理解上是有獨到的見解的,而且我國目前在數據中心這個領域,無論是市場規模、增速還是用戶數量,相較于國外都有巨大的優勢。”鄢貴海認為,國内廠商有望充分利用這一“應用勢能”,加快發展步伐,在DPU這個賽道與國外廠商“逐鹿中原”。
不過,挑戰與機遇并存。
“目前要解決DPU标準化應用,還存在一定挑戰。”鄢貴海解釋道,由于數據中心本身的複雜性,各大廠商一方面采用商用現貨組件(即COTS)來構建系統,追求低成本,一方面又設法分層服務化,打造面向不用類型客戶的标準化産品,但除此之外的所有技術實現幾乎都是“八仙過海,各顯神通”——如AWS有Nitro,阿裡雲有MOC。
“有的廠商強化IO能力、有的關注路由轉發、有的重視存儲卸載、有的關注安全加密,不一而足。”鄢貴海說,而上層負載不同,也必然對底層架構有各異的需求,這也許是目前DPU标準化面臨的最大挑戰。
記者 趙廣立
來源: 《中國科學報》
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!