升級鴻蒙後跑分-tft每日頭條

升級鴻蒙後跑分

生活更新时间:2025-08-15 00:22:52

本文分享自華為雲社區《這就是華為速度：2.69分鐘完成BERT訓練！新發CANN 5.0加持，還公開了背後技術-雲社區-華為雲》，作者：昇騰CANN。

快，着實有點快。

現在，經典模型BERT隻需2.69分鐘、ResNet隻需16秒。

啪的一下，就能完成訓練！

升級鴻蒙後跑分（2.69分鐘完成BERT訓練）1

這是華為全聯接2021上，針對異構計算架構CANN 5.0放出的最新性能“預熱”：

4K老電影AI修複，原本需要幾天時間，現在幾小時就能完成；
針對不同模型進行智能優化，300 模型平均可獲得30%性能收益；
支持超大參數模型、超大圖片計算，幾乎無需手動修改原代碼……

不同于訓練推理框架，異構計算架構在設計時，還需要兼顧硬件和軟件的特點。

為的就是盡可能提升AI模型的計算效率，減少在訓練和推理上占用的時間。

它的存在，能讓開發者在使用AI模型時，最大程度地發揮硬件的性能。

異構計算架構究竟為什麼重要，昇騰CANN 5.0又究竟有哪些特性和優勢？

我們對華為昇騰計算業務副總裁金穎進行了采訪，從CANN 5.0的功能解讀中一探究竟。

升級鴻蒙後跑分（2.69分鐘完成BERT訓練）2

為什麼需要AI異構計算架構？

首先來看看，AI異構計算架構到底是什麼。

通常做AI模型分兩步，先選用一種框架來搭建AI模型，像常見的Caffe、Tensorflow、PyTorch、MindSpore等；再選用合适的硬件（CPU、GPU等）來訓練AI模型。

BUT，在AI訓練框架和硬件之間，其實還有一層不可或缺的“中間架構”，用來優化AI模型在處理器上的運行性能，這就是AI異構計算架構。

區别于同構計算（同類硬件分布式計算，像多核CPU），異構計算指将任務高效合理地分配給不同的硬件，例如GPU做浮點運算、NPU做神經網絡運算、FPGA做定制化編程計算……

升級鴻蒙後跑分（2.69分鐘完成BERT訓練）3

面對各種AI任務，AI異構計算架構會充當“引路員”，針對硬件特點進行分工，用“組合拳”加速訓練/推理速度，最大限度地發揮異構計算的優勢。

如果不重視它，各類硬件在處理AI任務時，就可能出現“長跑選手被迫舉重”的情況，硬件算力和效率不僅達不到最優，甚至可能比隻用CPU/GPU更慢。

目前已有越來越多的企業和機構，注意到異構計算架構的重要性，開始着手布局相關技術，不少也會開放給開發者使用。

但開發者在使用這些異構計算架構時，會逐漸發現一個問題：

不少AI異構計算架構，基本隻針對一種或幾種特定場景來設計，如安防、客服等AI應用較成熟的場景；針對其他場景設計的AI模型，異構計算架構的性能會有所下降。

就像安防公司會針對安防類AI模型進行優化一樣，這類異構計算架構往往不具有平台通用性。

這使得開發者在訓練不同的AI模型時，需要在搭載不同異構計算架構的各類處理器之間“反複橫跳”，找到訓練效率最高的方法。

期間不僅要學習各類算子庫、張量編譯器、調優引擎的特性，還隻能選用特定的訓練框架，非常複雜。

相比之下，華為從2018年AI戰略制定之初，就選擇了一條不同的路線。

華為昇騰計算業務副總裁金穎在采訪中表示：

我們認為，AI模型會由單一的、場景化的模式，逐漸走向通用化，而昇騰系列，就是針對全場景設計的解決方案。

其中，昇騰CANN作為平台級的異構計算架構，已經經過了3年多的優化，叠代了4個大版本。

現在，最新“預熱”的CANN 5.0版本，在各種不同場景的模型和任務上，都表現出了不錯的效果。
昇騰CANN 5.0帶來哪些新功能？
相比于昇騰CANN 3.0，“跨代”的5.0版本帶來三大優勢：
性能：AI模型訓練/推理性能大幅提升，用時更短；
功能：推理引擎ATC Suite1.0首次發布，AI模型推理性能更高、功能更全面；
便捷性：代碼開發和調試進一步簡化，包括支持混合編程等，使用門檻更低。

在性能上，無論是訓練規模大小、場景類型，還是推理效率，均有較大提升。

其中，在MLPerf提供的大規模集群訓練場景中測試，結果如下：

數據來源：昇騰

從上圖可見，原本需要6.25分鐘訓練的BERT模型，在CANN 5.0的加持下縮短了一倍多，隻需2.69分鐘就能完成訓練；至于在3.0版本上需要28秒訓練的ResNet，5.0版本則是“再進化”到了16秒。

至于常用的一些小模型訓練場景（分類、檢測、語義分割、NLP等），5.0版本的性能提升同樣明顯：

數據來源：昇騰

訓練以外，5.0版本的推理性能，在不同場景（分類、翻譯、檢測）下提升效果也非常不錯：

數據來源：昇騰

顯然，無論是訓練還是推理，CANN 5.0都實現了更高效的任務調度和更好的性能提升。

在功能上，CANN 5.0首次發布了昇騰推理引擎軟件包ATC Suite1.0（ATC，Ascend Tensor Compiler，昇騰張量編譯器），包括模型壓縮、張量編譯、智能優化和媒體預處理硬加速等能力。

模型壓縮，包括量化、稀疏、張量分解等工具。像其中的AMCT模型壓縮工具，就能對浮點數據進行壓縮處理，來降低模型大小，加速推理速度；

智能優化，能為用戶提供在線調優能力，包括圖解析、子圖/算子自動調優、模型編譯優化等功能，進一步加速ATC的計算速度。

此外，推理引擎還包括Ascend CL（Ascend Computing Language，昇騰統一編程接口）全棧能力調用，即使是多路複雜的音視頻處理等特殊場景也能輕松應對，以及ACE（Ascend Computing Execution，昇騰計算執行引擎）運行管理等功能；至于在線/離線切換的推理模式，也讓部署場景更加靈活。

在便捷性上，5.0版本又進一步降低了開發者的使用門檻。

例如，無需開發者手工修改代碼，5.0版本支持模型自動遷移。

又例如，進一步支持混合編程。相比于3.0的手動加載模型，5.0版本在APP中可以直接調用算子函數，自動完成編譯加載并執行：

3.0版本

5.0版本

再例如，相比3.0，5.0版本現在還能自動生成算子測試代碼，省去不少步驟：

可以說是對開發者新人也很友好了。

然而，相比于表面帶來的更高性能、更全面的功能應用，異構計算架構的性能優化，并不如想象中“随便調調參”一般簡單，而是需要大量的技術支撐。
性能優化有多難？
将原本需要跑上幾天的模型訓練時間，縮減到幾小時甚至幾秒，背後絕不僅僅靠的是硬件的堆疊。

其中CANN 5.0的一個關鍵技術，就是集群訓練（采用大量機器共同訓練模型，以加速訓練時間）。

據金穎介紹，相對于單機訓練，增加訓練模型的機器數量，往往并不一定能收獲線性的效率提升。

在訓練過程中，多台機器雖然整體上擁有更多算力，但這些算力是分散的，彼此在進行數據交互的過程中，實際上又降低了訓練效率，這也一直是集群訓練的一個瓶頸。

圖源：圖蟲

昇騰選擇用圖計算的原理，來分析集群訓練的流水線分布、内存分配，針對不同機器的特點進行了架構上的設計，合理分配各個節點中的内存和通訊時間，來提高機器整體的計算效率。

具體來說，CANN 5.0版本在性能優化上，主要自研了4點技術：

其一，任務自動流水。

我們都在打遊戲的時候感受過數據加載的痛苦，這是因為硬件需要一定的時間來“反應”，包括加載計算指令等，但在數據量大的情況下，這顯然會極大地延緩整體計算時間。

5.0實現了計算指令和數據載入的多流水并行，載入數據滿足分段數據量時，不僅啟動後續計算邏輯、還保持數據繼續載入，進一步“壓榨”硬件處理器的并行計算能力，實現任務銜接。

其二，算子深度融合。

算子是支持AI模型訓練與推理的基本運算單元及組合，異構計算架構基本都要有自己的算子庫。5.0版本重新定制了更靈活的算子融合規則，通過多個算子自動融合提升模型訓練效率。

其三，自适應梯度切分。

這項技術，是華為針對集群訓練提出的智能梯度切分算法，具體針對模型訓練中的叠代計算進行了優化。

CANN 5.0能通過智能梯度切分算法，自動搜索出最優梯度參數切分方式，讓計算和通信進一步并行執行，使得通信拖尾時間降至最低、梯度調優時間降低90%。

其四，AutoTune智能計算調優。

不同的AI模型，如果架構隻用一種方式進行計算分配的話，勢必會造成不适配的情況。

因此，CANN 5.0研究出了智能數據切分技術，提出最優切分策略，确保每個計算單元被充分利用，平均性能提升30%以上。

5.0版本也預置了海量模型優化，能極大地縮短開發者的調優時間。

正是這些技術優勢，讓華為在AI性能提升上，擁有了更多的底氣。
如何評價昇騰CANN 5.0？
一方面，無論是AI模型、還是硬件層面的架構優化，都是AI技術走向更複雜的“通用化”的一個體現。

對于AI模型來說，更加通用的模型，并非僅僅是“參數越堆越多”的結果。

目前的通用AI模型，無論從訓練數據、還是架構設計本身來看，技術上都還有許多亟待完善的地方：由數據帶來的模型偏見、架構設計的冗餘和不可解釋性……

顯然，AI模型面臨的這些問題，不可能單純通過“模型變大”來徹底得到解決。

對于硬件也是如此，當下AI行業對于算力需求的擴大，同樣不可能隻通過硬件的堆砌來填補空缺。

如何在單個硬件算力受限的情況下，充分利用每個硬件的性能，達到算力1 1=2甚至是＞2的效果，是AI行業的每個參與者都必須思考的問題。

異構計算架構，是高效利用不同硬件算力的解決方案之一，對于它來說，通用化也是同樣複雜的一個問題。

相比于單純為某一場景、或某一功能而設計的專用異構計算架構，适用于全平台、全場景的“通用型”異構計算架構，從實現到優化上都要複雜得多。

這裡的難度，不僅僅在于實現功能上的通用性，而是在同樣場景下，将對AI模型的性能優化做得和專用架構一樣好。

從這個角度來看，不可能存在一個“一勞永逸”的技術解決方案。

無論是AI模型還是異構計算架構，都必須不斷推陳出新、打破自己和行業的固有認知，與時俱進，才可能在變幻莫測的時代浪潮中保持身位。

圖源：圖蟲

另一方面，回過頭看曆史潮流，僅憑創新，也不足以讓技術實現“可持續發展”，究其根本，還是要回歸現實、解決實際應用問題。

例如，昇騰CANN 5.0聯手武漢大學，解決了遙感領域的超大圖片計算瓶頸；同時，也在電影行業中，幫助修複了如《紅樓夢》、《開國大典》等高清4K影片。

要守住過去繼承下來的技術地位，又要迎頭直面實實在在的新問題，對華為已是競争中的必修課。

正如華為輪值董事長徐直軍在全聯接大會2021上所言：

數字化将注定是一個長期的過程，不可能一蹴而就。

我們所從事的這些技術領域，有幸處在變化最活躍的環節。

點擊下方，第一時間了解華為雲新鮮技術~

華為雲博客_大數據博客_AI博客_雲計算博客_開發者中心-華為雲
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活茶葉沖泡技巧
1、綠茶：用80℃~85℃水沖泡，現泡現飲。綠茶屬于不發酵茶，比較常見的有西湖龍井、碧螺春等。這類茶... 2023-07-07
生活有單号怎麼查對方微信
1、這個是查不到對方微信的，首先先申明，單憑一個交易單号是查詢不到對方的微信賬号的。2、如果想知道對... 2023-07-07
生活洗髒牆的方法
1、我們用牙膏就可以将污漬去除，隻需要把牙膏擠在手上，用抹布粘取一點。2、然後用抹布去擦牆上的污漬。... 2023-07-07
生活設置手機音量鍵上下翻頁
1、設置手機音量鍵上下翻頁的步驟。打開設置-通用-輔助功能，找到“切換控制”和“輔助功能快捷鍵”。打... 2023-07-07
生活為什麼男的喜歡微胖女人
現在的女生，不是在減肥就是在去減肥的路上。在這些女生心裡瘦就是美，有骨感就是好的。女為悅己者容，愛美之心人皆有之。最近不是很流行一段話當你從對面走過來，别人首先看到的不是你用了紀梵希的口紅，還是背了愛馬仕的包包、還是穿了AJ的鞋子，而是你的腿粗不粗、你的腰細不細，這就是現實。身材固然重要，并不是瘦得... 2023-07-07
生活泥螺怎麼吐幹淨泥沙
1、鹽水浸泡買回來的新鮮黃泥螺可以放在鹽水中浸泡半個小時便可自動吐沙。，用盆子裝滿水，加入适量鹽，将... 2023-07-07
生活帶水的字男孩名字
1、澤澤：指光澤、潤澤、恩澤、恩惠、仁慈的行動。寓指光輝燦爛、溫柔敦厚。取名推薦：孝澤、書澤、辰澤、... 2023-07-07
生活保定限号如何扣分
1、限行期間，将對違反限号規定的車輛進行電子抓拍，公安交管部門依法處以100元罰款、記3分的處罰。2... 2023-07-07
生活做夢生孩子是什麼意思
1、夢見自己生孩子，都代表了生活幸福、财源廣進。2、單身的人夢見我自己生了個男孩，最近愛情方面吉。3... 2023-07-07
生活遊戲本電腦适合辦公用嗎
1、遊戲筆記本适合用來辦公。2、一般來說，遊戲筆記本因為要承擔畫面高清和成像速度快等特點，所需要的配... 2023-07-07
生活如何選粉底
1、乳液狀的粉底是非常蟾宮的粉底，它分為液體型和濕粉狀。如果皮膚比較幹，就選擇液體型，如果皮膚比較油... 2023-07-07
生活什麼是商業用地
1、商業用地是指規劃部門根據城市規劃所規定該宗地塊的用地性質是用于建設商業用房屋，出讓後用地的使用年... 2023-07-07
生活冰糖金桔怎麼做
1、準備好用料：金桔800克，冰糖600克，鹽2勺，澱粉或面粉适量。2、将金桔放入幹淨無油的盆内，放2勺鹽，幾勺面粉或者澱粉，輕輕攪動搓洗一會兒。澱粉可以更深層的清洗表面。3、搓洗一會兒後用清水洗兩三遍。4、将清洗幹淨的金桔晾幹，我是一個個用吸水紙搽幹放入盤内，我是個急性子，等不了。5、然後将金桔切... 2023-07-07
生活頭皮養護洗發水的正确使用方法
1、擠出膏體。擠出适量膏體放入手心中。2、塗抹泡沫。在手中搓出大量泡沫，并塗抹于頭發頭皮上。3、持續... 2023-07-07
生活微信沒綁手機号怎麼找回
1、綁定了QQ的話可點擊“使用其他方式登錄”，輸入QQ帳号密碼可以直接登錄。2、有綁定郵箱的可直接進... 2023-07-07
生活噪音擾民怎麼處理
1、如果是民衆之間的噪音擾民，被騷擾人可以通過調解，協商，或者報警處理。2、如果是企業個體戶噪音擾民... 2023-07-07
生活保溫杯内壁水垢怎麼清洗
1、用小蘇打50克加水一杯，倒入瓶内輕輕搖晃，水垢也可輕松去除。2、将少許茶葉放在熱水瓶裡，再灌進滾開的水，蓋好瓶蓋。半個小時之後，瓶裡的水垢在茶堿的作用下，就會脫落一些下來。連泡幾次，直至完全脫落。3、用紙巾做兩個圓球形小紙團，然後放入熱水瓶中，往裡注入熱水，蓋好木塞，橫過來邊轉動邊左右搖晃，幾分... 2023-07-07
生活支付寶五福如何合成
1、可以通過每天掃福，澆水，答題等活動獲得福卡。2、需要集齊以下5張不同的福卡才能合成，福卡也可以通... 2023-07-07
生活如何選擇櫃式空調
1、根據空調外觀來選擇櫃機空調。由于櫃機空調體積較大，比較引人注目，會影響房屋的裝修風格，所以空調外觀也是大家需要注意的問題，最好選擇能與房屋裝修風格和諧統一的空調。現在海爾很多櫃機空調采用圓弧面闆，外形高貴典雅大方，不僅節省了空間，還滿足了美感實用與裝飾為一體的消費需求。2、需要根據客廳的大小來進... 2023-07-07
生活水龍頭堵了怎麼辦
1、先自己通通看，但是要注意PVC還是鑄鐵。地攤上買一根2米的管道疏通器，在頭部2公分處作一些彎曲，一邊放水，在出水口伸入疏通器，邊搖動邊往裡伸進，再在進水口伸入疏通器邊放水邊疏進，反複幾次能好。2、同時今後應每隔一星期進行疏通一次。如果專業人員來了，可以先用人工的方法，不要倒水，也可以把水池圍住，... 2023-07-07
生活足銀是不是銀
1、足銀是銀。2、在國際标準上，足銀是指含銀量千分數不小于990的銀。一般加工成手镯，吊墜，長命鎖之... 2023-07-07
生活水壺怎麼清洗
1、用段時間水壺後，查看燒水壺裡面是否有水垢，如果有的話就要準備清理，保持水壺幹淨。2、特别是注意水... 2023-07-07
生活客廳财位最簡單的找法
1、客廳财位最簡單的找法就是先确定好大門的位置，大門的位置決定了客廳财位的位置，如果大門的位置是在左... 2023-07-07
生活豆漿機如何做咖啡
1、把咖啡豆放入豆漿機打豆子的地方。2、打開開關，先把咖啡豆打到小米粒大小?不能太大味道淡?不能太細... 2023-07-07
生活臘月二十三祭竈吉祥語
1、小年到，辦年貨，忙忙碌碌也快樂;掃灰塵，送竈神，整潔幹淨吉祥臨;蒸年糕，貼年畫，幸福笑容臉上挂;... 2023-07-07
生活家用圓底鍋還是平底鍋
1、炒菜用圓底鍋，煎炸食物用平底鍋。2、圓底鍋的容量更大，可以烹饪更多食物。圓底鍋可以翻炒食物，中式... 2023-07-07
生活暖水瓶裡有水垢怎麼清除
1、使用醋清理水垢。想要清理電器中的水垢，食醋是我們經常會使用到的。通常水垢中它主要的成分是碳酸鈣，... 2023-07-07
生活摘下茉莉鮮花保存技巧
1、折斷法。生活中很多植物屬于脆性花木，在采摘這些植物的花朵時，盡量不要用剪刀，可以在準備好花瓶以後... 2023-07-07
生活申領失業保險金的時限為
1、領取失業保險金的期限最長不得超過24個月。2、被保險人領取失業保險金的期限，根據其失業前累計繳費... 2023-07-07
生活房子漏水怎麼修
1、外牆漏水問題難度過大，這裡建議找物業進行維修。2、衛生間、廚房、陽台漏水要将地面地磚或者衛生間沉... 2023-07-07

tft每日頭條

> 生活

> 升級鴻蒙後跑分

升級鴻蒙後跑分

相关生活资讯推荐

热门生活资讯推荐

网友关注