tft每日頭條

 > 圖文

 > 芯片算力評估

芯片算力評估

圖文 更新时间:2024-07-26 10:24:08

集微網報道 中國革命成功最核心的經驗有一條:永遠隻做最難的事情。放眼到半導體設計業,無疑“高端通用芯片”是最難的事情之一,而國内半導體要突破重重包圍,實現高端通用芯片的破局亦是必然之路。

原因無他,高端通用芯片代表着半導體業最高的技術和水準,其在未來的新應用和新場景,将決定着半導體業未來的新方向和新趨勢。随着半導體業驅動力從智能手機轉向HPC、數據中心、AIoT、智能汽車等,高端通用芯片正迎來新的進化論。

芯片算力評估(多元異構下的算力)1

變局

作為高端通用芯片的主力,CPU一直處于變革的C位。而且,因CPU業壟斷性強、技術壁壘高,經驗老道的巨頭和鋒芒畢露的新銳齊聚,CPU變革對于行業的震撼力是毋庸置疑的。

在日前舉辦的2022集微半導體峰會上,此芯科技CEO孫文劍表示,之前CPU以執行串行任務為主,但随着應用對圖形、人工智能等高算力的要求,并行計算越來越重要。這是消費者的聲音,即市場需要更快、更長續航、更加智能的産品。如果将以往的CPU、GPU、NPU等稱為智能芯片1.0時代,那應用場景的複雜化将帶動并行和串行的計算,因而芯片技術的趨勢必然是走向多元異構架構融合,即進入智能芯片2.0時代。

芯片算力評估(多元異構下的算力)2

在孫文劍看來,在智能芯片2.0時代,在系統級芯片SoC層面需多核異構,包含CPU、NPU、DSP、GPU等算力單元。異構計算可實現算力的實時智能分配,充分發揮每一個運算單元的算力優勢,實現能耗比的優化,促進SoC發揮強有力的效能。

“智能計算2.0時代的深層含義還包括在SoC層面實現異構之後,結合系統硬件及操作系統實現系統級的異構計算,達到軟硬件的協同混合計算;而實現系統級異構計算的下一步進階,是向平台級的異構計算邁進,即跨端邊雲進行算力的智能分配以及運算設備之間的無縫切換,這是未來計算發展的大趨勢。” 孫文劍道出了趨勢所向。

在分外擁擠的GPU賽道,算力仍是一大硬指标。在GPGPU領域深耕的天數智芯首席技術官呂堅平博士提到,GPU需匹配各種通用并行計算,尤其是包括AI訓練推理、圖形渲染以及通用計算皆以大量可并行處理的乘加(MAC) 計算為主的新興應用的計算需求,未來如何在圖形、AI、通用計算領域充分發揮優勢仍是業界着力的方向。

芯片算力評估(多元異構下的算力)3

DPU作為近年來的新秀,已經引得“無數英雄競折腰”。集微咨詢(JW Insights)分析師馮翔指出,伴随着數據中心從業務驅動走向數據驅動時代,對算力的合理化部署變得愈發重要,硬件部署也發生了翻天覆地的變化。最近大熱的DPU、IPU等芯片乘勢而起,不僅可進一步卸載CPU算力,同時依靠可編程能力支撐網絡、存儲、虛拟化、安全等重任。

芯片算力評估(多元異構下的算力)4

馮翔分析,從最初原始網卡隻是做些網絡協議處理,進化到智能網卡再到DPU的“無所不包”,DPU已成為CPU GPU DPU三足鼎立的重要支點。國内DPU的比拼重心已從融資到流片,蔓延到了商業化落地端,誰能夠搶先攻略市場或将赢得更多的勝算。

進化

随着CPU、GPU、DPU等老将新兵多路并進,進化的路徑也擺在了從業者的面前,究竟該如何解鎖?

對于智能芯片2.0時代CPU的進化,孫文劍認為,實現端、邊、雲混合智能計算,要看到決定CPU的性能有三大因素:40%來自于制程;40%來自設計以及系統層面的優化,CPU架構發揮重要作用;20%來自于軟硬件協同的優化以及算力的智能分配。

以往摩爾定律充分推動了制程的進步,但随着新制程節點成熟周期變長、成本增加顯著,孫文劍直言,CPU系統性能提升不能僅依賴于制程進步,還要更多在另外的60%層面發力。

對于DPU的進化,馮翔直接從X、Y、Z三大方向進行了剖析。

“最原始的網卡處在原點的位置,X軸是其在狹義的網絡數據處理功能上的疊代,Y軸則是在新的數據中心網絡架構中對數據和控制層面工作的軟件定義和虛拟化工作的進階,Z軸則真正涉及到業務層面上。”馮翔道出了其間的原委。

他進一步詳細解釋道,“目前的DPU還處在X與Y方面的融合,而即未來将實現的Z軸的融合,實現超融合架構,未來理想的DPU将是多矩陣、多元化、軟硬兼顧、可軟硬件編程靈活性的。

圍繞GPU,業界意識到盡管目前GPU可在圖形、AI、通用計算領域充分發揮優勢,但這三者目前是處于分裂的狀态。

如何“分”而治之?呂堅平認為,在這一過程中,對圖形的優化往往會導緻AI的缺失,對AI的優化往往也會影響圖形的優化。但圖形渲染本身可微分之後,也可變成AI的一部分。因而通用GPU的進化之路是如何開發圖形并兼顧通用計算。

基于通用GPU是一款基于DSA思路設計的産品,呂堅平進一步分析,首先,實現DSA通用化将可發揮通過GPU的優勢,即将DSA算力疊代融入通用GPU算力池,既可提升效能,又能維持通用及可編程性。其次,通過圖形計算化來跨接先進圖形,從而讓圖形充分利用算力并大幅減少圖形專用硬件。最後,通過硬件微分化來促進AI圖形的融合,即将圖形硬件可微分,使其融入實現AI算法的計算圖譜,将圖形渲染納入AI問題解決典範,從而大幅促進AI與圖形的融合。

生态

無論如何進化,但萬變不離其宗:脫離了生态将注定是無源之水。正如孫文劍所言,高端芯片繞不開的壁壘就是生态,一個成功的高端芯片必須要融入到大的生态當中才能成功。

相應地,CPU的落地一定要在整個生态圈中結合着不同的操作系統、應用程序才能真正提供價值。

孫文劍強調,端側業界看到安卓、Windows等等都全力支持Arm向上走,如今年2月微軟建立了Windows on Arm工作組,5月推出了端到端的Windows on Arm工具鍊,在操作系統和硬件的合力支撐之下這一生态會快速崛起。國内操作系統如統信、麒麟、鴻蒙等也在全力支持Arm CPU的發展,Arm CPU在端側走到了一個曆史變革的窗口期。

從數據中心角度考量,孫文劍建議CPU廠商要與雲服務廠商進行緊密的結合,不斷完善雲程序在CPU上無縫的鍊接和調度。

基于Arm CPU有不同的生态,孫文劍還提議要走點線面的共赢之路:“一個CPU廠商很難締造一個生态,希望與CPU的生态合作夥伴把手緊緊握在一起,組成一條線,織成一個面,合作共赢,優勢互補,迎接更加波瀾壯闊的智能計算2.0時代的到來。

值得注意的是,傳統的x86架構、興起的RISC-V架構以及國内走自主核架構的CPU陣營各有擁趸,亦各有所成,未來的比拼将圍繞性能、生态和應用全面展開。

談及生态,中興通訊硬件專家賀小龍表達的觀點是雲邊端是一個持續發展、不斷協同的過程,他們是共生共融的,生态在這一過程中也要良性循環協同發展。

“雲端将持續發展,包括網絡、存儲、安全等一系列的卸載釋放算力是未來持續的一大趨勢。邊側也會持續加強邊緣計算。端有不同的應用場景,在整個生态中衆多廠家在不斷增強端站的能力,也有可能逐步雲化,協同發展。”賀小龍最後分享說。(校對/張轶群)

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved