作者 | 包永剛
編輯 | 王川
以通信技術稱霸全球的摩托羅拉曾經幾乎就是手機的代名詞。卻隻因一塊彩屏、一個滑蓋就滿盤皆輸,被諾基亞奪取了手機市場的霸權。
2007年,蘋果同樣也僅僅用電容觸摸屏上的輕輕一劃,就宣告了諾基亞時代的終結。
在命運為摩托羅拉和諾基亞的故事中,我們讀到了由命運書寫的詩歌中相似的韻腳。
曆史不會重演,但會押韻。
同樣的事情也發生在服務器市場。
20世紀末到21世紀初,計算性能介于大型機和PC之間的小型機幾乎是所有企業算力的載體。
當時,IBM、惠普、SUN等巨頭在小型機市場的戰國争霸已經進入白熱化階段。
正在奮力拼殺的巨頭們沒有想到,最後終結他們的會是“小白”英特爾。
彼時英特爾正靠着x86架構 CPU在PC處理器市場如魚得水。一朝雲計算風起,英特爾乘勢殺入,竟最終在這個彼時巨頭環伺的市場中稱霸多年。
2007年前後,消費互聯網的興起引爆了全球互聯網的流量,數據量呈現指數型暴增,傳統以CPU為中心的計算架構,已經難以滿足超大規模數據中心的需求,就在此時,曆史又落下了熟悉的韻腳。
近幾年,英特爾和AMD在x86 CPU在服務器市場激烈競争。但AWS、阿裡雲等主流雲計算廠商也在過去幾年開啟了自研服務器芯片的研發,并逐步在各自數據中心部署應用。
在剛剛舉行的2022雲栖大會上,阿裡雲智能總裁宣布自研CPU倚天710已大規模應用,這是中國首個雲上大規模應用的自研CPU,阿裡倚天710 實例在數據庫、大數據、視頻編解碼、AI推理等核心場景中的性價比提升30%以上,單位算力功耗降低60%以上。
在雲計算邁向3.0的時代,輪到了阿裡雲和AWS這樣的全球雲計算巨頭定義芯片,這些擁有自上而下自研軟硬件的系統公司,為什麼會是下一場雲計算賽場的主角?
傳統架構攔路,雲計算巨頭不得不自研芯片了
過去的十年間,信息的生成、處理和存儲方式發生了根本性的轉變。面對互聯網高速發展的業務,急劇增長的用戶,脈沖流量讓傳統的IOE(IBM小型機、Oracle數據庫、EMC存儲)技術架構捉襟見肘,解決算力不足的問題幾乎隻能靠擴大采購規模,搭建一套全新的技術架構才是最優解。
十多年前的雲計算公司,最重要的任務是擴大數據中心的規模,自研芯片有些遙不可及。但有遠見和抱負的雲計算公司,那時起就邁上了通過自研解決問題的長路,從自己擅長的操作系統起步。
自研操作系統,能夠解決雲計算巨頭的當務之急。傳統的服務器集群采用集中式架構,這對于要管理遍布全球服務器的大型雲計算公司來說是一個巨大的障礙,分布式架構才是更好選擇。國内開啟自研雲計算操作系統序幕的公司正是當前國内雲計算排名第一的阿裡雲,早在2009年,阿裡雲就啟動了分布式操作系統飛天操作系統的研發。
在分布式操作系統的支持下,雲計算服務提供商就有能力将遍布全球的服務器連接在一起,讓算力成為可在線獲取的資源。經過四年的研發和技術攻關,阿裡雲在2013年5月實現了單一集群5000台服務器規模,創造了曆史。
有了早期的算力底座,阿裡雲克服了十多年來雙11和12306春運購票等極限并發場景挑戰。
基于分布式架構的雲計算讓算力獲取的效率大幅提升的同時,也面臨着虛拟化損耗的問題。
虛拟化技術是雲計算提供商為客戶按需分配資源的關鍵。但虛拟化技術如同黑洞般吸走了一部分服務器的性能,盡管雲服務提供商針對軟件層做了不少優化,減少了算力損耗,但要徹底根除虛拟化帶來的算力浪費一度讓雲計算産業鍊束手無策。
既然通過軟件的方式解決不了,那雲計算公司就隻能踏上他們并不擅長的自研硬件之路了。以AWS和阿裡雲為首的雲計算公司的思路很簡單,打造一個專用硬件負責傳統芯片不擅長的虛拟化調度工作,用軟硬件結合的方式解決虛拟化帶來的損耗問題。
2017年9月,阿裡雲推出第一代神龍架構,實現了性能0損耗,首次徹底釋放了雲計算的潛力。神龍架構在多年叠代之後,如今已演化為CIPU系統。
自2009年以來從軟件到硬件的自研,也讓阿裡雲切實感受到了強大的技術實力能夠帶來的優勢。過去的數年間,阿裡雲連續多年穩坐亞太第一、全球前三雲計算廠商的位置。
如今,雲計算巨頭們的核心目标已經不再是業務擴張的速度,深入底層技術,提高更具性價比和滿足差異化的需求成為新的目标。此時,AWS、阿裡雲等全球領先的雲計算巨頭們又不約而同地将目光投向了能夠提升雲計算性價比的雲原生CPU。
自研CPU與雲計算融合,1 1>2
“雲計算發展到一定規模,想要加速創新為客戶帶來更多收益的時,就會發現自研芯片成了非做不可。”阿裡巴巴集團研究員、阿裡雲彈性計算産品線負責人張獻濤對雷峰網說。
對于雲計算的最終用戶而言,直接感知CIPU的優勢并不容易,能夠運行各種業務的CPU能夠帶來明顯的感知。最容易感知的當然就是性價比,阿裡雲彈性計算産品總監王志坤透露,倚天710雲實例的性價比提升超30%,單位算力功耗降低60%。
能夠帶來如此高性價比的倚天710,是去年雲栖大會平頭哥發布的首款為雲而生的高性能CPU,這款采用Armv9架構,核心數量高達128個的CPU,發布之時就引起了業界的廣泛關注。
一位前海思員工對平頭哥的倚天710給出了很高的評價,他說:“阿裡平頭哥在短時間内就能設計出倚天710這樣的高性能通用CPU,确實是有很強的實力。我認為目前國内實力最強的芯片設計團隊就是平頭哥。”
一般而言,傳統芯片公司研發一款高性能通用CPU的周期大概是5-7年。阿裡雲能以較短時間研發出并大規模部署自研CPU,強大的芯片設計團隊之外,還有雲計算和自研芯片産生的1加1大于2的效果。
“我們自研的CPU是為雲而生,阿裡雲服務幾百萬客戶,更了解客戶的需求,在芯片定義的時候目标更加明确,自然能縮短研發周期。”張獻濤說,“這與傳統CPU的定義有明顯的差别,傳統芯片公司離最終的用戶更遠,并且為了保證産品的通用性,往往就需要更長研發周期。”
離應用和客戶更近,也讓雲計算提供商自研的芯片在測試和部署方面,也有天然的優勢。
比如倚天710成功流片回來之後很快就應用于阿裡巴巴集團内部核心業務,2021年雙11期間,天貓雙11核心交易系統平滑遷移至倚天實例,算力性價比提升30%。
“經曆雙11的考驗之後,我們對倚天710就更有底氣了。于是在今年春節後,我們就開始了基于倚天710雲實例的客戶邀請測試,經過内外部業務場景的驗證,如今已大規模應用。”張獻濤透露。
不過,對于Arm架構高性能CPU,許多人可能仍心存擔憂。但包括倚天710在内的多款Arm服務器CPU都證明了Arm CPU在雲計算領域的潛力。
王志坤解釋,倚天710的可以提供更高物理核的性能,除了我們的CPU是為雲而生的原因外,還有非常關鍵的是阿裡系統和編譯器的團隊做了大量的優化工作,通過編譯器的優化,取得了顯著的性能提升。
基于倚天710的雲實例的性價比已經展現出巨大的競争力,彙量科技廣告推理精排業務使用倚天710實例在CPU性能和内網帶寬上均實現了提升,綜合性價比提升40%以上。
被性價比吸引的用戶,仍然會擔心遷移的挑戰。
得益于軟件到硬件的全棧自研,阿裡雲提供豐富的生态工具,支持全應用生态适配,0代碼修改即可完成主流業務遷移。
“隻要使用的是高級語言開發的應用,幾乎都可以實現0代碼修改完成業務遷移。”王志坤表示。
不過,相比于将傳統業務遷移到基于自研CPU實現更高性價比,雲計算與自研芯片融合更大的魔力在于滿足更多差異化需求,面向未來的雲原生應用。
雲計算正在創造芯新範式
“過去,雲計算業務要從硬件底層進行定制或創新時,必須和芯片供應溝通,周期很長,但科技的發展日新月異,可能會錯過一些機會。”張獻濤說,“有了自研的軟件和芯片,每一行代碼都是我們自研的情況下,不僅可以實現更好的軟硬件協同,也是雲計算實現計算體系變革的最好時代。”
這就意味着,在可以預見的未來,傳統IT基礎設施以CPU為核心的架構,将變革為以CIPU為中心的架構,CPU将成為CIPU的外設,與CIPU連接的CPU、GPU、AI加速器等将提供更加強大的算力,為更多雲原生應用的出現提供基礎。
雲原生應用一個典型的應用就是雲手遊,在這一領域,新架構CPU在雲計算領域相比傳統架構有不可替代的優勢。
“十年前的雲,很多應用隻是從雲下遷入雲上。基于倚天710帶來的高性價比、高能效的雲計算,會湧現越來越多雲原生的應用,促進雲原生生态的繁榮。”王志坤認為。
如今,已經有了一些雲原生的數據庫和軟件系統,比如阿裡的PolarDB、Flink。在此基礎上,也會發展出新的軟硬件開發範式。
正如阿裡雲智能總裁張建鋒所說,“雲計算的發展進入了新的階段,芯片、操作系統和上層應用的原生融合已是大勢所趨,未來十年,軟硬件一體化的自研計算體系是雲服務商的立身之本,隻有在核心技術和産品的研發上持續創新才能搶占定義權。”
未來兩年,阿裡雲20%的新增算力将使用自研CPU。這足以表明,阿裡雲将堅定在芯片領域的投入,做深基礎,提供差異化的能力,繼續保持在雲計算領域的領導力。
縱觀整個科技産業的現狀,也可以看到,以蘋果為代表的系統公司,已經充分發揮了自己離最終用戶更近,能夠通過自研芯片提供差異化以及更好的産品和服務,并且改變着芯片産業的格局。
以阿裡雲和AWS為代表的雲計算巨頭,也正在提供差異化服務和産品的路上,他們也将擁有下一個雲計算時代的定義權,同時還将深遠影響芯片産業的發展。雷峰網
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!