在第三屆中國超級算力大會(ChinaSC 2021)上,英特爾軟件和先進技術事業部副總裁兼中國區總經理謝曉清發表主題演講,深入探讨萬物智能時代的機遇和挑戰,介紹了英特爾在高性能計算領域的“硬核”實力。同時,英特爾宣布與中國科學院計算技術研究所結成戰略合作夥伴關系,共同建立在中國的首個oneAPI卓越中心,促進oneAPI在中國生态的發展。以下為演講全文:
英特爾軟件和先進技術事業部副總裁兼中國區總經理謝曉清發表演講
我非常榮幸參加本屆中國超級算力大會。在此,我們圍繞超算領域共同交流合作、探索研究,讓英特爾與中國的高性能計算共同發展壯大。去年以來,在持續地疫情防控中,高性能計算發揮着不可或缺的作用。高性能計算作為基礎的計算力,幫助我們邁向一個更健康、更安全、更包容、更有活力、更可持續的未來。
英特爾是一家芯片公司,更是一家平台公司。我們與客戶合作,在各個領域提供優化的解決方案。在高性能計算領域,從工程制造、天氣預報,到新藥研發、地質勘探,都離不開英特爾的最新計算技術。
“萬物智能化”時代,數據正呈指數級爆發增長。随着高性能計算和人工智能的融合,以及通過雲計算實現的高性能計算普及化,為高性能計算系統帶來了更多用戶和用例。更多數據、更多用戶和不同用例的組合意味着對計算性能的要求比以往任何時候都更加多樣化。
全面産品組合,為高性能計算創新提供卓越性能
首先,英特爾的高性能計算方案采用全系統方法來滿足客戶需求。 英特爾提供從通用計算到專用加速,具備獨特持久内存和分布式存儲、高速互連及創新安全等功能的全面産品組合,通過使這些功能無縫協同工作,英特爾可為高性能計算提高整體系統性能。
一直以來,英特爾在至強®處理器系列中添加高性能計算的特有功能。但英特爾想要成為高性能計算的領先者,需要轉向專注于高性能計算的架構,也就是XPU架構。XPU架構将會是英特爾異構計算的基礎,包含CPU、GPGPU、FPGA以及其他加速器。
同時,軟件也承擔着重要的角色。對于高性能計算軟件而言,異構的開發能力非常關鍵。異構計算通常需要開發者維護獨立的代碼庫,使用不同的編程語言、函數庫和工具鍊。這是一項極其複雜的工作,會大大降低開發效率、抑制創新。
而英特爾推出的oneAPI可以在異構計算時代,針對應用,一次開發,處處運行。oneAPI本質上是高性能計算産品線和應用之間的中間層,簡化軟件複雜性,并支持跨平台代碼複用。
在深入介紹oneAPI軟件之前, 我們先來了解一下Sapphire Rapids,它将是英特爾下一代高性能計算系統的核心。
Sapphire Rapids是英特爾的下一代處理器架構,将為數據中心的各種工作負載提供出色的性能。Sapphire Rapids的全新微架構,其IPC顯著改進;同時内置AI加速功能,以提高數據的并行處理能力。Sapphire Rapids采用全新模塊化SoC架構,多個小芯片設計,提供高度的可擴展性和均衡的處理器能力,将為數據中心建立一個新的标準。
Sapphire Rapids的獨特設計,包括基于DDR5和HBM的高容量高帶寬内存;基于PCIe 5.0和CXL1.1的 I/O功能。随着高性能計算和人工智能的融合,Sapphire Rapids提供的高級矩陣擴展(AMX)能力,将顯著提高深度學習、推理和訓練的性能。同時,Sapphire Rapids不僅提供單個節點的強勁算力,而且具備為微服務和AI而設計的加速引擎和高度的可擴展性,為數據中心層面提供卓越性能。
英特爾最新宣布的基于Xe HPC微架構的GPU(Ponte Vecchio),是用于E級計算和人工智能的GPU。Ponte Vecchio采用靈活的向量矩陣引擎來處理高度并行的工作負載,旨在提供業界領先的雙精度浮點運算吞吐量、超高緩存和内存帶寬,适應大内存需求的應用程序。
Ponte Vecchio是高度模塊化的設計,使用47種不同的小芯片:基于Intel 7制程的基礎芯片、第三方5nm制程的計算芯片模塊、以及Xe Link互聯擴展等。Ponte Vecchio采用先進的封裝技術集成多個IP,包括HBM,它将以OAM産品子系統的形态提供“4卡配置”,具有高性能計算系統所需的縱向和橫向擴展能力。
oneAPI打造統一開發者體驗,制勝異構時代
如今,高性能計算是異構計算的舞台。而異構計算的編程模型通常需要不同的硬件有獨立的函數庫和工具鍊,造成硬件壁壘,軟件的維護成本極高。除此之外,企業内部也非常缺乏對各種硬件都熟悉的底層技術人才。他們的需求是:要一個抽象層,使得應用程序隻關注邏輯,而把硬件相關的實現細節屏蔽在中間層以下。因此,在高性能計算領域,專家的共識是需要有一個為異構計算而設計的軟件編程模型。而且,需要有開放的規範、高度的可擴展性,以及廣泛的業界接受度。
為了滿足此需求,Raja Koduri加入英特爾時的首要舉措是構建一個開放的跨平台标準接口,旨在讓開發人員能夠對CPU、GPU、FPGA和其他加速器進行編程,以消除每個架構所需的單獨代碼庫和工具,英特爾稱之為oneAPI。
oneAPI提供一個統一的編程框架和編程模型,以簡化異構平台的編程複雜度。oneAPI主要由兩部分組成:一部分是oneAPI行業計劃,另外一部分是英特爾oneAPI的産品實現,其中絕大多數oneAPI的産品都已實現開源。oneAPI是開放的标準,它非常鼓勵和期待社區和産業的加入,共同制定規範,最終實現在不同架構和不同産商之間的代碼複用,最大限度地保護軟件廠商的軟件投資。
總之,我們的戰略是将英特爾在CPU領域打造的軟件生态複用到異構計算所需要的軟件生态中來,為英特爾的XPU戰略打下堅實的軟件基礎。
oneAPI的行業計劃提供了一個開放的、基于業界标準的統一軟件接口。去年九月,英特爾發布了第一個版本的業界規範,其中包括一個統一的硬件抽象層,DPC 編程語言,以及豐富的底層庫函數,包括數學運算、數據分析以及視頻處理等。oneAPI使得開發者從私有的編程語言和編程模型的鎖定中得以解放,同時支持最領先的硬件架構、豐富的庫函數,使得針對框架層、應用層和服務層的開發變得更加高效。oneAPI的編程語言和庫函數跟生态系統中的其它常用語言,如Python、C 和Fortran可實現無縫協同。
自去年英特爾發布了首個版本的oneAPI産品以來,最新的oneAPI産品針對英特爾的CPU、GPU、FPGA進行了深入優化,并包含衆多針對不同場景的套件,以達到高效、高性能以及跨平台的編程。值得強調的是,針對高性能計算的HPC套件,oneAPI提供可擴展的快速Fortran、OpenMP和MPI組件。在近期舉辦的英特爾On技術創新峰會上,英特爾宣布oneAPI 2022工具包将于今年12月份正式發布,該工具包擁有900項新功能。
攜手更多合作夥伴,推進oneAPI生态發展
oneAPI在全球已經獲得廣泛的業界支持。在中國,阿裡巴巴,騰訊以及聯想都表示支持和接納oneAPI。同時,英特爾也已經跟中國多家高校展開了合作計劃,其中包括清華大學,北京大學,中國科學技術大學,以及西安電子科技大學等。我相信随着oneAPI在中國跟本土生态的不斷融合,一定會有更多的廠商和研究機構加入oneAPI社區。
最後,我榮幸地宣布一個最新的合作:英特爾與中國科學院計算技術研究所針對oneAPI的異構計算架構展開深入合作,共同建立中國首個oneAPI卓越中心,旨在促進oneAPI在中國的生态發展。
©英特爾公司,英特爾、英特爾logo及其它英特爾标識,是英特爾公司或其分支機構的商标。文中涉及的其它名稱及品牌屬于各自所有者資産。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!