tft每日頭條

 > 科技

 > 數據存儲前沿技術摘要

數據存儲前沿技術摘要

科技 更新时间:2024-07-30 18:14:18

作者|韋世玮

**

大數據時代下,愈發繁重的數據量和數據處理需求正在給各行各業帶來巨大挑戰。據惠普在其發布的研究報告中預測,至2025年需要被分析和認知的數據将增長100倍以上。

尤其是在摩爾定律逐漸逼近物理極限的大背景下,行業難以再通過制程工藝的疊代來提升芯片性能、降低成本。因此,人們開始思考如何從半導體材料、封裝工藝、計算架構等方向,尋找到新的突破口。

數據存儲前沿技術摘要(以數據為核心的近數據計算)1

數據處理能力的需求已經遠遠超過算力的增長

在創新計算架構上,國際存儲網絡工業協會(SNIA)早在2018年11月成立計算存儲技術工作組,集合業界主流的計算和存儲企業,共同探讨數據核心計算的技術與應用,制定相關标準。其中定義了三種計算存儲技術路徑:

  • Computational Storage Drive(CSD,即可計算型SSD,包含持久存儲和計算模塊);
  • Computational Storage Processor(CSP,即不含持久存儲,但将算力部署在數據端的處理器);
  • Computational Storage Array(CSA,即整合計算存儲處理器、控制軟件及其他器件的整套混合方案)。

其中,CSD更适用于低算力低功耗場景,已有包括三星在内的多家SSD廠商進行實踐和部署。但對于數據中心複雜場景、高通量、低延時的海量數據加速需求,作為獨立應用芯片的CSP則成為更行之有效的實現方案。

截至目前,包括三星、西部數據、海力士等主流存儲廠商,以及英偉達、AMD、Intel、戴爾等主流計算企業共51家公司已加入SNIA技術工作委員會。

實際上,除了國際巨頭在計算存儲計算領域有所布局,國内深存科技亦是這一賽道中不可小觑的創企玩家之一。

深存科技成立于2020年11月,是國内首家近數據大算力CSP芯片及解決方案提供商,聚焦以數據為核心的計算目标(Data Centric Computing),研發與存儲系統緊密結合的計算存儲處理器/數據處理芯片(CSP),能夠為下一代數據中心、5G邊緣計算、雲計算等數據繁重的應用場景提供核心組件,滿足低延時、高精準的要求,解決“大數據”和“快數據”并存的難題。

深存科技創始人&CEO袁靜豐告訴36氪,公司的主要出發點是從第一性原理出發,把算力部署到離數據更近的地方,以數據為核心展開計算。“搬運計算資源比搬運數據更容易,效率也更高,在未來數據中心領域将會産生巨大的數據盈利。”他說。

01、團隊産業化經驗超20年,今年底将發首款正式量産大算力産品

“我們的主要目标是做改變數據層面和存儲端算力架構的探索,為未來以數據為核心計算的技術方案做更多革新。”袁靜豐說。

他談道,存儲及數據服務器在過去很長的時間裡一直處于“被動”狀态,僅僅注重容量和讀寫服務,而深存科技希望将它改變成一個具有數據認知、結果産出能力的“自動駕駛”系統,形成以數據為核心的計算,成為智能化的數據湖,面向未來數據繁重的應用需求,包括數據中心、流媒體、自動駕駛等領域。

從公司成立以來,深存科技相繼推出了基于FPGA的算法原型機、工程樣機,到目前已準備量産的産品樣機,而這迅速的研發節奏與公司團隊背景息息相關。

一方面,公司核心團隊來自西部數據、 美光、惠普研究院、英特爾、微軟Azure數據中心、英偉達、騰訊等知名企業,擁有20年以上存儲控制芯片、數據加速芯片、GPU算力芯片和國際領先的數據中心、超算架構的研發經驗,成功疊代并量産多個數據中心核心芯片項目。

其中,深存科技創始人&CEO袁靜豐曾任職英特爾、美光、閃迪、西部數據等公司,作為企業存儲和數據中心業務的資深專家、Fellow候選人,負責數據中心業務芯片及系統的研發,并參與企業存儲、數據加速、計算存儲、存算結合等方向的研究和相關标準制定,擁有十餘項芯片領域的國際專利。

在20多年的從業經驗裡,袁靜豐曾帶領團隊連續研發且交付過多個業界領先的芯片及系統級産品,并規模部署至AWS、Facebook、微軟Azure等大型數據中心,以及DELL/EMC、HPE、IBM等國際廠商的主流服務器。

基于豐富的産業化落地經驗,深存科技通過與客戶進行深入接觸和溝通,能夠快速将客戶的創新需求轉換成産品來落地,沿着近數據計算的重要趨勢不斷深耕布局和應用。

具體到産品規劃上,面對動辄幾十TB到PB級的數據中心數據湖存儲節點,深存科技預計将在2022年第四季度推出第一款正式計劃量産的大算力CSP産品,将強大算力和數據存儲系統進行深度整合,定位面向數據中心的高性能産品線,涉及雲計算,視頻流媒體服務、工業互聯網等應用場景。同時,公司在智能制造領域已拓展了重要合作夥伴,接下來将進入具體的合作與落地階段。

随着産品的量産及落地推進,公司也将快速搭建市場銷售團隊,同時繼續大規模擴展研發人員,以更好地在産品開發上投入大量的時間和精力。

02、計算以數據為核心,率先與AMD形成合作夥伴體系

實際上,随着近年來行業應用對芯片算力、能效等性能要求越來越高,傳統的馮·諾依曼架構作為典型的以CPU為中心的結構,其計算和存儲分離的設計導緻“存儲牆”問題愈發明顯。為了解決這一問題,最初不少玩家選擇采用存算一體的方式解決,包括存内計算、近存計算等技術路徑。

袁靜豐認為,存内計算更多是從微觀層面進行架構的優化,例如在存儲器中部署神經網絡來解決AI層面的參數及向量搬運的需求,相比基于ASIC或GPU的設計,存内計算在效率方面有更好的提升。

同時,存内計算面臨的更多是存儲器設計和制造的挑戰,“這不是一家小公司或初創公司能夠主導和控制的,往往需要大廠乃至整個産業鍊的參與來提供完整的支持。”他說。

相比之下,通過CSP芯片實現的近數據計算更多是從宏觀架構和芯片設計層面進行創新和優化。例如在數據中心,應用往往要面臨大量原始數據的搬運,需要從存儲節點通過網絡往計算節點進行搬運,就像一台計算機,但是更為複雜和龐大。

數據存儲前沿技術摘要(以數據為核心的近數據計算)2

高帶寬和低延時的應用與龐大數據需求,形成巨大的引力将計算資源拉近數據

在袁靜豐看來,未來數據中心将面臨大量的數據增長,相比以往大家關注的龐大數據容量和通量,它将更強調響應時間,對數據的實時性要求越來越高,也就是快數據需求。這就使得數據周圍形成巨大的引力,促使計算資源向數據靠近,以數據為核心的計算(Data Centric Computing)成為繼基于GPU的計算加速,DPU/IPU的網絡加速之後的重要趨勢,圍繞數據湖展開數據加速和算力部署的計算存儲将是未來業界的主要工作。

數據存儲前沿技術摘要(以數據為核心的近數據計算)3

2022年5月,服務器廠商戴爾表示以數據為核心的計算存儲是未來重要趨勢

因此,行業除了增加算力和網絡帶寬投入,更要思考如何提升數據中心的存儲和數據處理效率的問題。“用行業公認的觀點來說,提高計算效率的關鍵就是提高搬運效率,搬運計算能力會比搬運數據更有效。”袁靜豐說。

這也是深存科技選擇用近數據計算架構來解決存儲和計算沖突的關鍵所在。通過将CSP和存儲節點相結合,達到以數據為核心的近數據計算目标,能夠在減少原始數據的低效搬運基礎上,實現低延時、高精準、快速反應的效果,同時讓AI算力在數據最近的地方發揮效率。

總的來看,深存科技的CSP可提供強大的數據加速能力、高效的I/O處理能力,以及強大AI算力,讓應用縮短數據搬運路徑,提高計算效率,實現低延遲、高精準、高通量。與其他CSD計算存儲公司相比,深存科技采用了CSP 存儲節點的部署方式,CSP可獨立工作,可部署近數據的大算力應用和通用化的多元場景。

“我們最大的差異化在于将算力做到了極緻,将加速能力和AI算力整合在CSP中,放到存儲節點附近來完成以數據為核心計算和加速的目标。”袁靜豐談道,不管是在成本效率、通用性,還是綜合算力方面,深存科技的芯片産品均已超過頭部玩家的同類産品。

目前,深存科技已得到一些業内知名公司的認可,與AMD形成合作夥伴關系,這一合作是國内數據中心存儲與算力融合領域的首例。與此同時,公司即将成為全球網絡存儲工業協會的技術工作組标準委員會成員,未來将和其他主流公司共同參與行業技術标準的制定。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved