tft每日頭條

 > 科技

 > 雲平台是什麼

雲平台是什麼

科技 更新时间:2024-07-29 10:20:09

雲平台是什麼(雲背後的硬核實力)1

算力時代,靠吃「硬件紅利」便能搞定新應用場景的「甜蜜期」已經過去。

人類社會的每一次科技躍遷,其本質都是計算力的突破與演進。

算盤撥出農耕文明的繁榮,機械計算機催生出第一次工業革命的袅袅蒸汽,而雲計算的發展讓萬物互聯成為真正可能。

在數據爆發式增長以及算法日益精進的大背景下,屬于「算力」的時代俨然到來。

以音視頻行業為例,趨近飽和的場景滲透率、用戶對體驗的極緻追求、多元化的場景及技術需求,為底層算力和視頻編碼能力帶來更大的挑戰。

然而,在算力需求暴漲的同時,摩爾定律的演進速度卻在放緩,「硬件紅利」已然見底。

對于整個視頻雲賽道的算力困局,不僅需要上層軟件系統的優化,也需要在底層硬件基礎設施上,尋求破局之法。

風口之下的算力困境

我們已經邁入社會視頻化時代。視頻無處不在,由此産生的流量已呈井噴式增長。

據《2022 年中國網絡視聽發展研究報告》披露,截至 2021年12月,我國網絡視頻(含短視頻)用戶規模達9.75 億,較2020年12月增長4794萬,占網民整體的94.5%。

網絡視聽正成為大衆的娛樂剛需,視頻正在成為各行業連接客戶最廣泛的載體,也成為各巨頭搶占風口的關鍵點。

而在5G時代,視頻流量将進一步增長。

視頻流量激增的另一大原因,是用戶對視頻體驗的「不将就」。在視頻規模持續增長的同時,随着網絡和終端硬件設備的疊代,用戶對視頻清晰度體驗的追求持續提升;視頻超高清化也是繼視頻數字化之後的新一輪重大技術革新。

移動互聯網終端觀看分辨率從最開始的360P,480P,快速提升到720P,1080P 以及近年出現的4K/8K超高清視頻。

當前,國家也連續出台超高清産業支持措施并加速應用,如:5G 8K超高清技術在冬奧會和春晚實現商用;體育直播開始進入到4K HDR直播時代。

除了高分辨率,沉浸式視頻體驗還追求高幀率和寬色域,而每一次分辨率的提升,幀率的提升,色域增加帶來的都是視頻信息量的成倍增加。

因此,需要技術解決方案能更快應對更高清晰度、更低時延的視頻編解碼和轉碼,滿足高清、高幀率、寬色域視頻所帶來的不斷“擴容”的音視頻數據流。

難以調和的「視頻編解碼」矛盾

由于Raw視頻數據(原始圖像編碼數據)是非常大的,如果不進行編碼和壓縮,不論是視頻的存儲還是傳輸,都将帶來很大的麻煩,視頻編碼技術便是由此而來。

視頻編解碼起源于廣播電視,從1951年第一部數字電視和廣播誕生起,廣播電視在很長一段時間裡是視頻編解碼技術變革的核心推動力。

而到互聯網時代,随着互聯網的高速發展,使用互聯網的用戶和視頻流量出現井噴式增長,互聯網成為視頻編碼的主戰場。

為了應對視頻流量的不斷增長,視頻标準組織一直在推動視頻編碼技術的持續疊代。

從MPEG2開始,視頻編碼标準壓縮率大約每10年提升50%,以2021年推出的h.266 為例:相對于h.265壓縮率提升50%,但其編碼計算成本提升15倍。

雲平台是什麼(雲背後的硬核實力)2

然而,用戶對視頻極緻體驗的追求與視頻編碼的演進其實存在着巨大的矛盾。

  • 編碼标準升級速度遠慢于視頻信息量膨脹的速度:「十年磨一劍」的視頻編解碼技術(10年50%壓縮率的提升)已經遠遠慢于視頻化和體驗升級帶來的流量增長(過去3年音視頻流量已高達68.9%的增速),而未來帶寬壓力會越來越大。
  • 新編碼标準壓縮率的提升遠低于視頻分辨率提升的速度:每一代編碼标準的演進,都是在不斷探索極限壓縮率。新一代的編碼标準對比上一代的标準通常有 50% 的壓縮率提升。然而如果視頻分辨率每提升一檔,比如360P到720P,則會使信息量增加 4 倍。
  • 新編碼标準複雜度的增加遠高于CPU處理能力的增加:新一代的編碼标準對比上一代的标準大多增加10倍以上的複雜度,遠高于CPU處理能力的增強,而視頻編碼的高複雜度導緻編碼技術難以普惠,尤其在實時場景。

随着AR,VR時代的到來,4K-8K高分辨率,60-120FPS高幀率,10-12bit寬色域,讓視頻的信息量更是成倍增加;加之低延時意味着對編碼速度有更高的要求;而CPU芯片處理能力也不再遵循摩爾定律快速增長,視頻體驗極緻化,與帶寬、計算成本、編碼速度等高要求之間的矛盾沖突會越來越嚴重。

軟硬協同,錨定性能升級

視頻編碼與視頻處理為計算密集型場景,面對視頻雲賽道的算力困局,如何讓高壓縮率的編碼算法,更加普惠?

解法是:軟硬協同 深度自研編碼内核。

在該方向,我們一直在持續優化、疊代,而倚天ECS的出現帶來更好的答案。

2021年雲栖大會,平頭哥半導體發布首顆為雲而生的CPU芯片倚天710。倚天710單芯片容納高達600億晶體管;在芯片架構上,基于ARMv9架構,内含128核CPU,主頻最高達到3.2GHz,能同時兼顧性能和功耗。在内存和接口方面,集成DDR5、PCIe5.0等技術,能有效提升芯片的傳輸速率,并且可适配雲的不同應用場景。

雲平台是什麼(雲背後的硬核實力)3

經過一年的業務驗證,倚天710已大規模部署并提供雲上服務,算力性價比提升超 30%,單位算力功耗降低60%。阿裡雲提供豐富的生态工具,支持全應用生态适配,0代碼修改即可完成主流業務遷移。倚天710雲實例已應用于阿裡巴巴集團核心業務,并服務多家知名互聯網及科技公司。未來2年,阿裡雲20%的新增算力将使用自研CPU。

雲平台是什麼(雲背後的硬核實力)4

搭載倚天710的ECS實例自設計初就是一款雲原生産品,憑借其靈活、先進、彈性的雲原生芯片特性和優異的CPU算力,超低功耗,與視頻雲的轉碼服務特點強匹配,為視頻雲雲原生轉碼業務帶來更多可能。

雲平台是什麼(雲背後的硬核實力)5

基于倚天ECS,阿裡雲視頻雲與平頭哥團隊聯合,對s264、s265編碼器進行深度優化。

最終實現:相對于c7雲實例,轉碼性能提升30%,在8K直播場景中提升達到33%,助力更普惠,更高清的轉碼服務。

那麼,具體是如何做到的呢?我們一起來看下倚天710加持的這款雲原生産品,如何為視頻雲雲原生轉碼帶來更多想象空間。

128核心均為物理核,獨享計算單元

倚天710單顆CPU即實現了128核的高密度設計,高并發負載下可實現高線性度性能增長;同時處理器無超線程概念,避免了性能争搶的問題:獨享物理核,性能更強勁。

傳統CPU架構是兩個vCPU/HT共享一個物理核,1份ALU。ECS倚天實例采用的是獨享物理核心方式,這可以讓算力密集的計算指令不必排隊、不必争搶,計算速度更快。

雲平台是什麼(雲背後的硬核實力)6

獨享Cache,應用緩存更高效,更大的獨享L1/L2 cache以及SLC cache容量,包括L1 64K 64K,L2 1M per core,SLC 128M

在Cache維度,過去兩個vCPU/HT共享一二級緩存,相互争搶,性能波動較為嚴重。采用倚天710獨享Cache的設計,讓vCPU之間相互不影響,為重負載計算帶來更高性能。

雲平台是什麼(雲背後的硬核實力)7

高能效不降頻,即使高并發負載下每個核心仍然能夠保持穩定的計算吞吐率

影響算力性能的關鍵因素,除了核的資源,還有主頻。

以視頻編碼為例,傳統架構CPU在并發超過4路後,性能下降40%,這背後的原因是高算力負載很容易造成功耗過大,溫度上升,因此采用降頻規避,進而影響了性能。而倚天710功耗相比主流CPU有大幅下降,沒有任何降頻問題。

在視頻編解碼四路以上時,代表倚天的橙色部分基本保持恒定,其他主流CPU則會降低幅度40%。

雲平台是什麼(雲背後的硬核實力)8

高效的擴展指令集和可伸縮向量指令架構,提供強大算力

倚天710還針對特定算法場景進行了指令集加速與優化。比如像SVE等矢量計算技術,其中BF16/INT8 mmla指令可實現高效的矩陣乘法運算,此外還支持Hash、CRC32等加速指令,可以讓單條指令并行處理更多數據,大幅提升視頻編解碼、AI編解碼增強等場景性能。

雲平台是什麼(雲背後的硬核實力)9

四維優化,釋放「軟硬結合」最大效能

基于阿裡自研的倚天710芯片進行優化,通過深度重構視頻編碼數據結構、并行框架,重新調優快速算法策略,從軟件、彙編、硬件層面跨層深度優化,打造ARM友好的視頻編碼器的同時,塑造極緻性能。

主要體現在以下四方面的核心優化:

指令優化

計算密集型的算子函數通過彙編實現單指令多數據操作優化,除常規的SIMD彙編指令優化外,基于倚天710的特點,在視頻編碼中充分利用可伸縮向量指令集,如mmla、dot、zip等, 通過優化流水線排布,利用高吞吐低延時的指令優勢,塑造更高的彙編加速比,總體性能提升40%。

例如:實現同樣的數據加載功能,充分利用倚天多流水線技術和高吞吐低延時的指令組合,實現數據加載效率提升60%:

雲平台是什麼(雲背後的硬核實力)10

訪存優化

在訪存較為頻繁的算法接口中,結合倚天710 SVE寄存器的特性, 設計内存預取算法以及數據訪問流程的優化,可以大大減少内存訪問次數,從而提升代碼的執行效率。

例如:在ME的搜索算法優化中,如一次六邊形搜索,原先需要重複訪問多次内存數據,經過内存預取的算法優化,把重複訪問的數據保存在倚天710的SVE寄存器中,運算時直接使用,可以減少3.8 倍的行訪問次數。

雲平台是什麼(雲背後的硬核實力)11

算法并行化

在計算密集型的算子函數進行了彙編指令優化的基礎上,充分對有性能增益,但是仍然是串行處理數據的算法也進行了并行處理優化,達成了軟硬件的深度結合,算法執行效率大大提升。

例如:SDH的算法軟硬結合,通過SVE寄存器和P寄存器的使用,并行處理16個系數,能夠快速計算得到最佳位置,性能提升了40%以上。

雲平台是什麼(雲背後的硬核實力)12

系統層優化

在算法優化的基礎上,針對視頻轉碼特點,結合倚天710平台和視頻雲特有場景下進行系統配置優化,将二者結合的能力發揮到最大。

例如:系統的安全水位的控制,充分利用了倚天710物理核、不降頻、不共享緩存和ALU的特性,在高負載場景下仍然性能不下降,可以放心地提升安全水位,充分發揮芯片的計算能力,獲得更好的性能表現。

雲平台是什麼(雲背後的硬核實力)13

普惠算力 賦能千行百業視頻化

未來,我們将基于自研處理器,深度結合視頻雲業務,從架構、指令、訪存等方面優化設計,賦能視頻雲業務升級發展。同時,深耕軟硬件結合提升自研芯片競争力,優化算法、加速庫、驅動、固件一體化設計,支持視頻雲不斷探索創新音視頻技術。

目前倚天ECS已經在視頻雲點播上線,性能提升30%,壓縮率提升5%。借助倚天710的超強算力,倚天ECS在Saliencymap推理上成本低于G6ni 50% 以上,在窄帶高清的普惠化方面展現出了巨大空間。

平頭哥與視頻雲一起,希望将更多的技術普惠帶給廣大消費者,賦能千行百業的視頻化需求,催生新興産品形态和業務模式,為客戶提供更快、更省、更低功耗、更高清、更實時的編碼力,賦能創造更極緻的視聽體驗。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved