tft每日頭條

 > 科技

 > cuda測試gpu性能

cuda測試gpu性能

科技 更新时间:2025-02-23 19:57:40

轉載:機智客

我們知道,面對現在的AI深度學習框架,沒個好點的GPU顯卡簡直都不好意思出手。要說有錢人瞧不上我們窮人倒也罷了,就連現在的人工智能程序都可能瞧不上——如果你的顯卡不夠檔次的話。深度學習要用強悍的GPU,而GPU又離不開CUDA運算平台。生于斯時,深度學習的技術高度就好比CUDA這類編程的難度,不是考驗你的智商就是考驗你的财商。不免會把許多愛好者學習者拒之門外,讓人望洋興歎。

而現在,高産如那啥啥的OpenAI再次出手,這次他們推出一種新的語言和編譯器——Triton。據聲稱,這種新的編程語言Triton隻要25行代碼,就能在FP16矩陣乘法shang上達到與cuBLAS相當的性能。正如Triton項目的負責人Philippe Tillet說的,我們的目标是使Triton成為深度學習CUDA的可行替代方案。

cuda測試gpu性能(面向GPU人工智能的編程語言Triton誕生)1

這個起源于2019年一次學術會議上的一篇論文中。Tillet解決的問題是如何開發一種cuDNN更具表現力的語言,既能夠處理神經網絡中涉及的矩陣的各種操作,同時兼具可移植性且以及和cuDNN相媲美的性能。

這個就不得不涉及到GPU的一點知識。現代的GPU大緻可以分為DRAM、SRAM、ALU三個組件,而要想對這些資源進行調度管理則是非常複雜,即便是熟悉CUDA的程序員,也要費時費力大傷腦細胞。而Triton的功能特點就是将這些優化過程完全自動化,讓開發者可以更好地專注于并行代碼的高級邏輯。

要說這個Triton能有如此良好的性能,還是要來自于以Triton-IR為中心的模塊化系統架構,這是一種基于LLVM的中間表示。目前呢,它已經在github上開源了一個項目,有興趣的朋友可以去看看。作為一款剛誕生的小家夥,這個新出的編程語言隻支持英偉達GPU,甚至還沒有CPU版本,不過官方已經表态AMD的GPU以及CPU的版本正在開發中。拭目以待吧。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved