tft每日頭條

 > 生活

 > gpu性能分析

gpu性能分析

生活 更新时间:2024-09-30 15:49:20

最近國産GPU、英特爾獨顯GPU以及英偉達RTX 40系列和AMD RX 7000等下一代GPU的信息在媒體上不斷曝光。但這些GPU還沒有正式發布,肯定不能用3DMark及各種遊戲的實際運行、跑分來展示能力,相關報道中“與xxxx相當”、“比xxxx強xxxx”的說法到底是如何又是從何而來呢?

gpu性能分析(沒發布就能對比)1

目前的GPU都是由很多小處理核心,或者叫流處理器組成,這個核心每時鐘周期隻負責處理一個浮點數據,所以總的浮點運算次數就是核心數量×時鐘周期了(當前常見的GPU浮點運算單位一般是TFLOPS,即每秒浮點操作多少萬億次。)。又因為現在的核心可以一次性處理一個雙精度浮點數據,相當于兩個單精度浮點數據,所以再×2就得到了GPU的浮點運算次數。

gpu性能分析(沒發布就能對比)2

目前國産GPU、英偉達RTX 40系列和AMD RX 7000系列與當前GPU、顯卡的性能對比其實就是根據其透露出的頻率、流處理器數量配置而計算出來的理論浮點計算性能。因為現在的圖像是分成像素點來處理的,每個點的色彩都要進行浮點運算,然後組合成一幅圖片,所以這個浮點計算能力确實可以代表顯卡或GPU的圖像處理能力。

gpu性能分析(沒發布就能對比)3

因為每秒處理的像素點越多,在同畫質、同分辨率下,每秒能處理的畫面數量當然就越多,遊戲的幀速(每秒畫面數)越高。對使用同一代特别是同一核心的顯卡,算出它的浮點運算能力,基本就了解遊戲畫面的生成速度了。當然這是CPU、内存、輸出接口、顯示器等配件不拖後腿的情況下。

gpu性能分析(沒發布就能對比)4

但對于不同代甚至不同架構的GPU,這種對比就不合适了,比如RTX 3080擁有兩倍于RTX 2080 Ti的浮點運算次數,幀速能達到RTX 2080 Ti的兩倍嗎?這就牽扯出了另一個問題,也就是核心的效率,因為誰也不能保證所有的核心或者流處理器能一直滿載、有效運行,它的實際發揮還要考慮到前端的分配、後端的合成、顯存數據等單元的配合。

gpu性能分析(沒發布就能對比)5

RTX 30系列的“問題”更大,它們讓每個核心中的整數運算單元也參加浮點運算,得到成倍的“理論”運算能力。但幹非“專業”工作,整數單元的浮點運算效率肯定是不如專業的浮點運算單元的,所以效率大幅下降。最終翻倍的理論浮點性能帶來的隻是不到40%的實際幀速提升。所以RTX 40和RX 7000到底如何,除了浮點計算性能外,還要看架構、效率有沒有大的變化。

gpu性能分析(沒發布就能對比)6

其實國産GPU以及前面對比中沒提到的Intel GPU理論性能還有一個不同的地方,那就是它們已經開始密集測試了,因此除了浮點計算外,還多了一個OpenGL計算能力。相關測試在一定程度上能反映GPU架構的效率,但也同樣不能和遊戲性能完全扥通,因為遊戲需要Direct 3D等消費級3D技術,與OpenGL的運行方式不一定相同,隻能說參考意義比浮點計算更大一些吧。

gpu性能分析(沒發布就能對比)7

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved