前言顯卡外觀賞析
前言
GeForce RTX 4090顯卡已經上市有一段時間了,想必大家對它的性能表現已經了然于心,而包括公版和非公版在内的RTX 4090的設計都相當“規矩”,現在有張顯卡擺脫了限制,在規格、配置以及外觀方面都做到了頂尖水平!用料也是極緻豪華,就為了給極客玩家帶來極緻體驗。
沒錯,它就是影馳GeForce RTX 4090 HOF OC LAB Plus顯卡,隸屬于名人堂系列,該系列被廣大玩家稱之為“旗艦中的旗艦”,專為追求極緻性能的玩家量身打造,自從HOF系列顯卡推出以來,就不斷有超頻發燒友及愛好者利用這些顯卡刷新世界超頻紀錄,至今影馳GeForce RTX 4090 HOF OC LAB Plus顯卡已經擁有20項超頻紀錄的美譽。
今天我們也有幸上手這張真正的卡皇,下面就給大家送上它的詳細評測。
下文“影馳GeForce RTX 4090 HOF OC LAB Plus”簡稱為“影馳RTX 4090 HOF OC”
外觀賞析
第一次收到影馳RTX 4090 HOF OC顯卡的時候還是有些震驚的,畢竟超規格的外包裝盒從裡到位都顯露出這是一種“奢侈品”的感覺,不愧是旗艦之名的顯卡定位。
拆開後,影馳RTX 4090 HOF OC顯卡仍然采用我們熟悉的家族式的白色塗裝,正面一改之前的鑽石切割工藝,而是換成了更具特色的機甲風,還戴上了尊貴的象征——皇冠。這樣的設計不僅擁有豐富的視覺層次感,同時還彰顯出頂級顯卡才具備的高貴氣質。
這張影馳RTX 4090 HOF OC顯卡不止視覺上看起來巨大,體積方面更是重量級,足足有2.7kg重,完全就是一個巨無霸般的存在。
一衆顯卡廠商也是深知這次RTX 4090的重量,因此在包裝盒内也配備了全金屬通用顯卡支撐杆套件,能夠徹底杜絕顯卡變形,給予顯卡有效保護。
正面搶眼的除了皇冠燈件外,就屬三把巨大的散熱風扇了,它們都大到快要撐破顯卡外殼了,左右兩邊的是112mm的靜霜風霜,中間的則是92mm,三大特大的散熱風扇組成了顯卡不可或缺的主動散熱部分。
将鏡頭拉近,每個散熱風扇都配有11片專屬的靜霜葉片,并且扇葉表面明顯經過特殊優化處理,表面有磨砂質感,這樣做的目的是保證顯卡進風量,高效散熱保證性能釋放。
顯卡的背面更加驚豔,同樣是全白設計,不過在設計上加入了些小巧思,整個背闆被大面積的“HOF” Logo覆蓋,并且還配有名人堂特有的皇冠,無不彰顯其高貴地位。
高強度的壓鑄金屬背闆比一般的金屬背闆更有助鞏固顯卡不易變型,而且還可以提升散熱效能,加上背闆末端設有開孔設計,有效加強風扇氣流,影馳RTX 4090 HOF OC顯卡在高頻運作下仍能穩定耐用。
并且背闆上的HOF皇冠Logo标志還是一個RGB燈件,在顯卡接通電源後能夠亮起,與其他硬件同步燈效後,RGB效果更是炸裂。
既然說到RGB,前面提到的可拆式皇冠燈件其實也支持ARGB燈效,其背後藏有一個5V ARGB接口,神光同步功能信手捏來。
當它與正面融為一體時,一個璀璨奪目的皇冠躍然紙上,時刻提醒你手上正在使用的影馳RTX 4090 HOF OC顯卡是尊貴的象征,是性能的象征。
玩家也可通過影馳官方的魔盤Xtreme Tuner工具自定義燈光效果,多種燈效配合這個顯眼的皇冠設計别有一番韻味,打造專屬于你的高顔值顯卡。
皇冠燈件除了可以展示炫酷的RGB燈效,還自帶檢測功能,黃燈表示顯卡外接供電異常,而紅燈則表示主闆異常,玩家排障更直觀。
皇冠燈件其實是可拆式設計,即使你的顯卡不是豎裝放置,它也可以拆卸後獨立放置在顯卡頂部,一樣能夠讓你360°欣賞它的美。
卸下皇冠燈件後,隐藏在其之下的“Hall Of Fame”慢慢顯現,影馳幾乎在你看得到的地方都安排了RGB燈效,采用海景房裝機,你将大飽眼福,時刻感受驚豔衆人的ARGB。
你以為這就是玩燈的極限了嗎,影馳RTX 4090 HOF OC顯卡還有HOF PANEL III多功能外置全彩顯示系統,其本質是一個LED顯示屏,使用新版的HOF Ai軟件,你可以在這塊顯示屏上監控顯卡狀态,展示圖片,播放視頻,應有盡有。
通體白色的設計與魅力四射的RGB燈效相結合,放在白色的側透機箱内恰到好處,既給玩家帶來了視覺盛宴,又沒有過分高調,更像是一位優雅的武林高手,在小小的機箱内滿血輸出。
顯卡的頂部和底部都配有大面積的鳍片出風口,鳍片的厚度也是相當“離譜”,不過這樣豪華的堆料有利于内部空氣的快速流動,降低顯卡核心溫度。
顯卡供電用的是全新的12VHPWR供電接口,使用一根12VHPWR的電源線就可達到供電需求。不過影馳RTX 4090 HOF OC配備了兩個12VHPWR供電接口,最大能夠給這張顯卡提供1200W的供電能力,帶666W的最大TDP完全足夠了。
供電接口的附近可以看到一個小按鈕,這其實是影馳RTX 4090 HOF OC的BIOS切換按鈕,用戶通過Dual BIOS撥動開關就能選擇不同的工作模式。左側還有ARGB的接口,新的Aurora Sync Pro功能能夠讓名人堂RTX 40系列顯卡與支持5V ARGB外接擴展功能的主闆實現燈效同步。
顯卡底部還可以看到顯卡的PCIe金手指,标準的PCIe 4.0 x 16速率,它可以為顯卡提供更快的傳輸速度。
視頻輸出接口方面配備了3個DP1.4a和1個HDMI2.1,支持4屏顯示或最高8K@60Hz的超清輸出。視頻輸出接口還專門采用鍍金處理,不僅抗氧化性能更強,還能讓視頻訊号傳輸更清晰。
IO擋闆上還有一個小按鈕,其實這是名人堂RTX 40系列顯卡才具有的Hyper Boost一鍵加速功能,用戶隻需要通過功能按鍵就能實現Hyper Boost功能一鍵開啟,提高顯卡散熱器效能以及提升GPU超頻能力,同時按鍵上配備了狀态指示燈,開啟一鍵加速功能,按鍵亮綠燈,關閉功能時則無燈光。
另外從這個角度也可以看出影馳RTX 4090 HOF OC顯卡驚人的厚度,足足有77mm,已經超越4槽厚度了,妥妥的性能巨獸。
顯卡拆解
顯卡拆解
影馳RTX 4090 HOF OC可謂是相當“厚實”,那它的内部一定也是堆料十足,我們拆開來一探究竟,卸下影馳RTX 4090 HOF OC金屬背闆上的螺絲後就可以分離散熱系統和PCB。
首先映入眼簾的是一張純白的PCB闆,名人堂專屬定制,14層OC工藝加持。整體設計合理,安排規整,單從PCB上的接口、供電、核心、顯存等細節就可以看出這一定是大廠出品的品質。
PCB的背面相比正面就要簡潔很多了,不過還是排布了密密麻麻的的電容,影馳為這張RTX 4090可以說是煞費苦心,瘋狂堆料。
核心背部電容位置使用了四個POSCAP(導電聚合物钽電容)代替四組MLCC(一組10個MLCC),整體電氣性能更強。
PCB的正中央就是本次的主角——AD-102-300-A1核心,影馳RTX 4090 HOC OC顯卡的心髒,别看它小小的一顆,但其實它集成了763億個晶體管,相比RTX 3090 Ti足足多了2.7倍,稱它是地表最強卡皇都不足為過。
核心的周邊則是12顆GDDR6X顯存,來自美光科技,型号為2RU47 D8BZC,單顆顯存容量2GB,12顆組成24GB超大顯存。并且這幾顆顯存的速率可是滿血的,顯存速率為21Gbps。
影馳RTX 4090 HOF OC在供電MOSFET上也是堆料到了極緻,供電總相數達到了32相之多,其中28相為核心供電,4相為顯存供電,這個規格基本上在一衆RTX 4090中也是Top 1的存在。
無論是核心供電還是顯存供電,影馳RTX 4090 HOF OC全部采用英飛淩的DrMOS芯片,型号為TDA21472,持續輸出電流可達70A。
不同于其他顯卡的設計,影馳RTX 4090 HOF OC采用全新的方案,PWM芯片也來自英飛淩,型号是XDPE1A2G7B,不過目前還查詢不到相關信息。
附近還有一顆uS5650Q,它主要負責管理顯存供電部分。與上面的PWM芯片通力合作,為顯卡提供充足動力。
在核心周圍還能看到兩顆BIOS控制芯片,型号為IS25WP016,分别控制這款顯卡的P-Mode與S-Mode。
想要有666W的TDP,單一12VHPWR供電接口是不夠的,影馳RTX 4090 HOF OC有兩個12VHPWR接口,每個接口都能提供600W的供電能力,雙口完全能夠支撐其這張卡皇。
在兩個供電接口的後方,還有4顆R22電容坐鎮,為顯卡電源輸入提供穩定安全的保障。
當然供電不止12VHPWR接口一處,PCIe也是供電之一,影馳RTX 4090 HOF OC的PCIe接口為标準的PCIe 4.0 x16,值得注意的是使用前一定要在主闆打開Resizable BAR功能,這張顯卡的性能才能完全釋放。
奢華至極的不止供電,連視頻輸出接口也是鍍金設計,抗氧化能力極強,經久耐用,還可以有效提升信号傳輸品質。
繼續拆解散熱系統,首先見到的便是大面積的液冷均熱闆,面積達到了95mm*88mm,如此規格的配置能夠迅速吸收GPU産生的熱量,并将熱量迅速均勻傳遞到熱管,讓AD102核心時刻保持冷靜。
影馳在均熱闆上為顯存、電感、MOS管接觸的地方用上了高系數的導熱墊輔助散熱。就連核心處也是厚厚的一層矽脂,可見這個散熱系統真的是下足了功夫,堆足了料。
不僅僅正面的均熱闆有散熱,金屬背闆上同樣安排了導熱墊,配合金屬導熱性強的特性,影馳 RTX 4090 HOF OC的散熱效能可以說是拉滿了。
整個散熱器除了正面的液冷均熱闆外,其他地方被大面積的導流型鳍片覆蓋,并且還在部分地方安排了不少加強件,用于保護鳍片不變形。
散熱鳍片下隐藏着4根Φ8mm 5根Φ6mm的鍍鎳複合熱管,9熱管的配置用于壓制AD102核心綽綽有餘。
所有熱管在散熱鳍片下蜿蜒曲折,最終貫穿整個散熱器,并且統統采用回流焊接工藝,有利于保證散熱系統的高效導熱。
三把專屬的靜霜散熱風扇是整個散熱系統的主動散熱來源,肩負着加速空氣流動,快速帶離熱量的作用,20mm的厚度設計讓散熱效能顯著提升,這也是為什麼這張顯卡在烤機時能夠做到低溫的原因所在
拆解後細看,每把散熱風扇上有11片靜霜扇葉,升級優化後不僅進風量更大,還支持智能啟停功能,讓顯卡随時随地能夠全力輸出。
總的來說,影馳 RTX 4090 HOF OC完全稱得上堆料豪華,極緻散熱。旗艦級的AD102核心配上如此規格的硬件,明顯是為超頻預留了更多餘量,這也是名人堂HOF系列顯卡的“頭号招牌”。
測試平台理論/遊戲性能
測試平台介紹
見識過影馳RTX 4090 HOF的堆料設計後,就該進入實測環節了,老樣子,我們先介紹一下此次的測試平台。我們請出了目前最強的遊戲硬件,CPU用的是最新的Intel Core i9-13900KS,華碩的Z790 Hero主闆搭配4根16GB的金士頓DDR5-6000高頻内存。
散熱方面也是下足了功夫,用的是鑫谷冰封360冰山版水冷散熱器,隻有這個規格的散熱器才有可能馴服13900KS這顆可以超頻到6.0GHz的性能怪獸。
既然影馳RTX 4090 HOF是一塊純白色的顯卡,那裝機自然離不開時下最流行的白色主題海景房,機箱上我們選用了昆侖禦風機箱白色版。其擁有出色的功能支持與驚豔衆人的顔值,非常适合DIY玩家。
昆侖禦風機箱的風道設計不錯,因此我們在其前後還加裝了多把鑫谷冰霜12散熱風扇,不僅能夠給散熱添磚加瓦,在顔值方面也是給白色主題裝機添彩。
有了強悍的硬件,顯示設備也不能拖後腿,顯示器我們采用了愛攻保時捷聯名PD32M電競顯示器,其搭載了目前頂級的4K 144Hz面闆,可以完美體驗到RTX 4090帶來的絲滑4K 144Hz遊戲體驗。
理論性能測試
正式測試前,我們先在GPU-Z中對影馳RTX 4090 HOF OC進行一個簡單的了解。從圖中可以看到這款顯卡的基準頻率為2235MHz,Boost頻率為2625MHz,遠遠高于公版FE的2520MHz,這也是其能夠位列“名人堂”的底氣。
另外從GPU-Z中我們還可以了解到這款顯卡的功耗和溫度設定,眼尖的玩家可能已經發現了,影馳RTX 4090 HOF OC的默認TGP設定為550W,這已經比普通的RTX 4090的最大TGP還要高了,并且這款顯卡支持解鎖功耗至666W,溫度牆也能放寬至88℃,這顯然是為沖擊超頻做足了準備。
接下來我們一起玩一下全世界最好玩的遊戲《3DMark》,從3DMark的理論性能來看,影馳RTX 4090 HOF OC對比上代RTX 3090 Ti完全是碾壓般的存在,首先是代表DX11的Fire Strike測試,性能提升在70%左右。而在代表DX12的Time Spy測試中,RTX 4090與RTX 3090Ti也是拉出了遠遠的差距,Time Spy Extreme直接突破兩萬分大關,這讓筆者很好奇它的遊戲表現。
3DMark中的理論性能提升已經足夠“離譜”,AIDA64的GPGPU理論性能測試中,影馳RTX 4090 HOF OC的表現更令人驚喜,整體性能相比RTX 3090 Ti提升了92%以上,近乎翻倍的性能可謂驚人。不少項目甚至有2倍甚至3倍的飛躍,這才是一張卡皇應有的表現。
遊戲性能測試
想必買的起這張卡的玩家都是标配4K分辨率的顯示器吧,不過照例我們還是看看1080P與2K分辨率下這張顯卡的表現,不得不說卡皇之所以為卡皇就是因為超強的性能釋放,影馳RTX 4090 HOF OC顯卡在兩個分辨率下,大部分遊戲都在200 FPS以上,這已經不是入門電競的水平了,而是專業電競的表現,現在3A也能用電競的水準遊玩,完全不敢想象。
4K分辨率才是這款顯卡的主戰場,從實測結果中可以看出,有着“顯卡殺手”之稱的《賽博朋克2077》中,影馳RTX 4090 HOF OC顯卡在DLSS 2下已經能夠做到77 FPS,更不用說性能更強的DLSS 3,而RTX 3090 Ti僅有48 FPS,屬實有點不夠看。而在《光明記憶:無限》中,即使是高畫質加複雜光追的苛刻條件下,這代顯卡的表現依舊強勢,87 FPS的成績領先前代近70%。
既然都是地表最強遊戲顯卡了,不試試8K分辨率怎麼行,在8K遊戲測試方面,影馳RTX 4090 HOF OC顯卡能夠将大部分遊戲跑到60 FPS以上,像一些優化好的遊戲,例如《極限競速:地平線5》甚至能有85 FPS左右,想想8K超高畫質馳騁在墨西哥是一種怎樣的視覺享受。
總的來說,用RTX 4090已經能夠滿足部分遊戲運行在8K畫質下的需求,相較于RTX 3090 Ti幾乎是翻倍的提升,如果遊戲廠商優化到位,8K電競指日可待。
DLSS 3性能測試
DLSS 3性能測試
提到RTX 40系顯卡就不得不提DLSS 3這個黑科技了,它無疑是這代顯卡升級的重點,相比DLSS 2,DLSS 3不僅可以實現畫質于幀數的雙向提升,還新增幀生成功能,實現遊戲幀數翻倍,老黃在發布會上更是直言“DLSS 3讓遊戲性能翻倍”!
3DMark DLSS 3理論性能測試
3DMark中新增了DLSS 3性能測試,實測下來有DLSS 3的加持下,影馳RTX 4090 HOF OC顯卡相比RTX 3090 Ti真的實現了性能的翻倍,在4K分辨率下,不開DLSS 3僅能勉強維持在60 FPS附近,一旦開啟DLSS 3後,性能直接提升三倍,已經可以滿足4K@144Hz的電競需求。
8K分辨率下更是離譜,不開DLSS 3隻可以13 FPS,測試過程卡成PPT,而開啟DLSS 3後,幀數暴漲80 FPS,逼近百幀,相較上代提升3倍有多,似乎已經可以開始期待8K@120Hz甚至8K@144Hz了。
遊戲實測
光說不練假把式,現在《賽博朋克2077》也更新了DLSS 3,所以我們也在第一時間測試了DLSS 3與DLSS 2下的區别,實測下來可以看到4K分辨率下,有了DLSS 3的加持後,遊戲幀數能夠進一步提升,并且提升幅度還不小。
2K或1080P的情況下提升幅度更加明顯,幾乎是近百幀的性能差距。不得不說DLSS 3是一個劃時代的技術,體驗下來真的非常棒,它能讓低端卡玩遊戲變快,高端卡變得更快。
在另一款支持DLSS 3的《F1 22》中也是如此,在4K畫質下開啟全高特效,有了DLSS 3的加成,影馳RTX 4090 HOF能夠跑到175幀,若隻使用DLSS 2,則幀數隻有133幀左右,相當于DLSS 3這個黑科技給遊戲帶來了32%的遊戲性能提升,相當不錯。
總的來說,影馳RTX 4090 HOF OC顯卡不開啟DLSS功能的遊戲性能已經足夠了,開啟DLSS 3後,無論是質量檔還是性能檔,其遊戲流暢度都高于120 FPS,對于一款賽車遊戲來說,這流暢度是真再爽不過了。
當然不少玩家可能擔心DLSS 3會有降畫質的問題,這裡我們也截取了DLSS 3各個檔位下的遊戲實際畫面,可以看到無論是哪個檔次,遊戲畫質均沒有明顯影響,甚至因為DLSS 3是通過AI進行超分渲染,因此在文字等細節紋理上會比原生畫質更加清晰。
DLSS 3-F1 22-DLSS-Balance
DLSS 3-F1 22-DLSS-Perfoemance
DLSS 3-F1 22-DLSS-Quality
DLSS 3-F1 22-DLSS-SuperPerfoemance
DLSS 3-F1 22-TAA
Unreal Engine 5 Lyra DLSS3測試
最後我們還測試了利用Unreal Engine 5引擎打造的Lyra DEMO,此DEMO除了能夠支持最新的DLSS3技術外,還帶上了NVIDIA Reflex。筆者這裡上傳了兩個圖片給大家看看Lyra DEMO裡的DLSS3開啟與關閉的畫質對比,遊戲流暢度自然是DLSS3開啟後提升較為明顯的,達到192 FPS,而PCL延遲也進一步降低到了50ms的水平。
Unreal-Engine-5-Lyra-DLSS3-OFF
Unreal-Engine-5-Lyra-DLSS3-ON
生産力性能測試
視頻内容創作性能測試
測完了遊戲,必不可少的還有創作生産力測試,這裡我們選擇PugetBench、PCMark 10、等多款常見的測試軟件,來測試影馳RTX 4090 HOF OC顯卡在日常辦公、視頻内容生産等方面的性能表現。
首先我們來看看PCMark10 Extended項目上各顯卡的性能表現如何,可以看到影馳RTX 4090 HOF OC顯卡在各個項目均完成了對前代卡皇RTX 3090 Ti的超越,這與我們上面的實測相符。
影馳RTX 4090 HOF OC顯卡在更快的顯存、更強的性能加持下,跑Pugetbench的Pr項目确實比前代卡皇快了很多,有大約30%的性能提升,換用新顯卡對剪視頻、預覽、導出等操作均有幫助;Ae項目沒有Pr進步那麼大,但總歸于是新顯卡,還是有一定性能提升的。
要說提升最大的要屬達芬奇了,作為首批支持AV1編解碼的剪輯軟件,占盡優勢,同一項目下,架構革新後的影馳RTX 4090 HOF OC有着更快的渲染時間,原本RTX 3090 Ti需要幾十秒才能完成的操作,現在僅用17秒!如果你習慣用達芬奇進行創作,那換用影馳RTX 4090 HOF OC顯卡将大幅提升你的工作效率。
專業内容創作性能測試
另一個提升可感的行業就是3D渲染了,Blender與OctanceBench測試中影馳RTX 4090 HOF OC顯卡的性能表現同樣給力,相比前代RTX 3090 Ti有95%以上的性能提升。翻譯成人話就是你用影馳RTX 4090 HOF OC顯卡渲染一個相同的項目,它的耗時隻需要前代顯卡的一半!
即使是在SPEX的專業領域測試中,影馳RTX 4090 HOF OC顯卡也沒讓人失望,有了更快的顯存和全新的架構加持後,可以說完全打通了AD102核心的任督二脈,比起上代旗艦來說,65%的性能提升相當驚人,這個成績也比其他RTX 4090 顯卡高了近10%。
總的來說,40系顯卡這一代光追單元的增強,對于支持光追加速的3D渲染軟件是很有利的,多款渲染軟件相比上代卡皇的提升都接近2倍,因此對于從事這些相關工作的用戶,影馳RTX 4090 HOF OC這款顯卡還是值得考慮的。
雙編碼器專項測試
RTX 40系顯卡還有一個重磅升級點就是支持最新的AV1編解碼,這次影馳RTX 4090 HOF OC LAB Plus換上了最新的雙NVENC編碼器,作為第八代NVENC編碼器,其編解碼性能相比前代有了質的飛躍。
最新的RTX 4090顯卡支持AV1編碼,而RTX 3090 Ti僅支持AV1解碼,二者差距相當明顯,新的AV1編碼技術能夠在占用相同空間情況下,提供更加快速的視頻編碼和更高質量的流媒體傳輸性能,并且目前許多主流媒體也逐步支持AV1編碼,像達芬奇、萬興喵影、剪映等軟件均已支持AV1編碼。
我們使用NVIDIA提供的8K片源與工程文件進行測試,同樣的素材下AV1編碼相比H.265編碼所需時間更短,而即使同為H.265格式導出,影馳RTX 4090 HOFOC LAB Plus的導出時長也比前作快了70%以上。
另外我們來看看H.265格式與AV1格式下的畫質區别,從肉眼來看,其實畫質幾乎完全一樣,這樣也意味着AV1可以用更小的空間占用量實現與H.265同等規格的畫質表現,總的來說,無論是導出速度、空間占用還是畫質表現,它都完勝H.265。
功耗超頻總結
超頻體驗
在拆解部分我們看到影馳給這張RTX 4090 HOF OC顯卡安排了超規格的供電模組與散熱裝置,并且TDP給到了最高的666W,可見超頻就是它的最強殺招,那筆者自然是不可能錯過這個絕佳的機會,下面一同看看這款顯卡的超頻潛力究竟有多大吧。
我們使用影馳官方提供的XTREME TUNER魔盤工具對顯卡進行超頻,這款工具不僅可以解鎖GPU核心的電壓限制、功耗限制等,還可以自由調節風扇轉速,實測這款顯卡的散熱配置明顯是超規格的,因此風扇轉速還可以進一步下探,超低的風扇噪音還你舒适的使用體驗。
在解鎖了功耗與溫度牆後,我們先小試牛刀,将GPU核心頻率先提升至3090MHz,此時顯卡在運行Time Spy時已經超過了4W分大關,并且功耗也突破了550W,要知道這是其他RTX 4090都達不到的地步。并且在測試過程中溫度始終沒有突破60℃,明顯這是高規格的散熱系統起到了作用。
有了前面的嘗試後,我們穩步提升,筆者最後成功将影馳 RTX 4090 HOF OC的GPU核心頻率提升了235MHz,顯存頻率提升了1000MHz,最終影馳 RTX 4090 HOF OC在3DMark中能夠穩定運行在3150MHz下,這還隻是在風冷狀态下,如果是水冷,那它還能再高一些,此時Time Spy測試得分40459,相比默頻狀态的38155分提高2000多分,超頻潛力可見一斑。
功耗與散熱
前文中我們提到,影馳RTX 4090 HOF OC顯卡采用了非常優秀的散熱設計,那麼這款顯卡在散熱性能測試中的實際表現如何呢?
在使用Furmark烤機15分鐘後,這款顯卡的GPU溫度穩定在65.5℃,這樣的成績比起上代的RTX 3090 Ti可以說是質的飛躍,如果跟其他RTX 4090比起來,那也是妥妥的第一梯隊,可見其散熱效率的确非常高。
再聊聊内部的發熱大戶——GDDR6X顯存,筆者原以為顯存溫度也會較高,但沒想到有高系數導熱墊直觸均熱闆後,顯存溫度隻比核心高了0.5℃,果然旗艦級的顯卡散熱都不是蓋的,用這套散熱系統壓制AD102核心已經綽綽有餘了。
我們也橫向對比了一下影馳RTX 4090 HOF OC顯卡與上代卡皇的功耗,從功耗來看,解鎖了功耗牆的影馳RTX 4090 HOF OC的确驚人,不過相比其前代卡皇,它的功耗可以說是相當保守了,不少項目測試下來,功耗都沒有上代那麼高,但性能提升卻是實打實的強。
不得不說老黃的Ada Lovelace架構和TSMC的4N工藝确實有點東西,妥妥的吊打前代顯卡,讓RTX 40系列顯卡的每瓦性能實打實的提升到了一個新高度。
評測總結
這次能夠上手這張影馳 GeForce RTX 4090 HOF OC LAB Plus顯卡還是相當幸運的。全新Ada Lovelace架構、TSMC 4N定制工藝、DLSS 3等數不勝數的黑科技聚集于一身,讓這張顯卡無論是遊戲性能還是專業生産力都遙遙領先RTX 3090 Ti,不愧為地表最強遊戲顯卡。
而影馳 GeForce RTX 4090 HOF OC LAB Plus顯卡本身更是極緻奢華的代表,無論是性能、顔值、還是配置都是當今最強的RTX 4090之一。因此對于遊戲玩家來說,遊戲幀數、散熱表現都是旗艦中的旗艦;除此之外它的雙12VHPWR供電以及32相的豪華供電規模則為硬核的超頻玩家提供了絕佳的舞台,風冷下輕松超3.1GHz,完美诠釋了頂級非公應有的表現。
一身白衣加身的影馳 GeForce RTX 4090 HOF OC LAB Plus也是賺足了眼球,光是皇冠燈件就彰顯了這張顯卡的高端定位。純白色的設計配上極具個性的棱角線條,奢華而優雅的外觀無疑是顔值黨的最佳選擇。
總的來說,如果你想見識一下頂尖的RTX 4090顯卡,那影馳 GeForce RTX 4090 HOF OC LAB Plus就是你的不二之選。最高666W的功耗能夠完全榨幹AD102核心,兩倍于前代卡皇的性能表現,毫無疑問,它就是目前地表的性能王者,幾乎沒有對手能與之抗衡。現在影馳 GeForce RTX 4090 HOF OC LAB Plus已經上市,售價19999元,各大電商平台均已開售,感興趣的話可以去了解一下。
Ada Lovelace架構講解
Ada Lovelace架構講解
Turing、Ampere上兩代架構核心均以人物來命名,前者是計算機科學之父——艾倫·麥席森·圖靈;後者則是“電學中的牛頓”——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那Ada Lovelace定非凡人,度娘一下果然,這是 人稱“數字女王”的阿達·洛芙萊斯,編寫了曆史上首款電腦程序,是被世界公認的第一位計算機程序員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫喔。
從Turing架構開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RT Core單元,以及面向AI推理的Tensor Core單元,這革命性的創新使實時光線追蹤成為可能。而Ampere架構則是全面的架構改進,在加入新一代的二代RT Core和三代Tensor Core基礎上,還有着更先進的SM單元設計,這樣顯卡工作效率那是翻倍的提升。而來到Ada Lovelace架構,同時是以效率提升為大前提,自然是引入了最新的第三代 RT Cores與第四代 Tensor Cores單元,同時加入衆多新穎的黑科技,從執行效率來說Ada Lovelace架構是上代Ampere架構的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。
在講述核心架構前,我們先了解幾個關鍵詞:GeForce RTX 4090、Ada Lovelace、TSMC 4N、608mm²、760億個晶體管、2倍性能功耗比。
大家帶着幾個關鍵字來看上面的【顯卡規格參數對比】表格,就可以更容易讀懂上述表格了。最新一代的桌面顯卡GeForce RTX 40系列均采用全新的Ada Lovelace架構核心, GeForce RTX 4090的核心是 AD102,目前Ada Lovelace架構核心中最為強大的,具有760億個晶體管、16384個CUDA核心和24 GB高速美光GDDR6X顯存。
得益于NVIDIA與台積電深度合作的TSMC 4N制程工藝,GeForce RTX 4090核心面積僅是608mm²(上代RTX 3090 Ti 628mm²),在更小的核心面積下卻能塞下多達760億個晶體管,比上一代的Ampere架構多出了約70%晶體管數量。
值得注意的是,制程工藝的提升不單能擁有更多的晶體管,其核心頻率更是能跑得很高,GeForce RTX 4090 Boost頻率就已經達到了2520MHz,這樣在核心頻率與高規格的雙向保證下實現了比上代顯卡高達2倍的性能功耗比。
從GTC2022秋季大會中,其實我們就已經發現了,目前GeForce RTX 4090顯卡中配備的AD102-300核心其實并非完整的AD102核心。完整的AD102核心應該包括了12 個GPC (圖形處理集群)、72 個TPC (紋理處理集群)、144 個SM (流式多處理器) 和⼀個帶有 12 個 32Bit顯存控制器的 384 Bit顯存位寬。
再來看上面的GeForce RTX 4090架構圖,和完整版本的AD102核心對比起來就很容易看出差别。首先,GeForce RTX 4090核心代号為AD102-300,其擁有9個完整規格的GPC (圖形處理集群,每個内建6個TPC),與2個非完整的GPC (圖形處理集群,每個内建5個TPC),共組成了64個TPC ,那麼SM單元自然就是128個了。至于顯存位寬方向那是相當的完整——384Bit。
如果你還是不太懂,這裡筆者就逐一為了Ada Lovelace架構顯卡的構成。
剛才我們已經說到,一個完整的Ada Lovelace架構AD102核心内部擁有12個GPC,而每個完整的GPC中包含了一個專用的Raster Engine(光栅化引擎),兩組ROPs共16個ROP(光栅化處理單元),以及6個TPC與12個SM單元。
全新的SM流式多處理器
Ada Lovelace架構中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RT Cores,4個第四代 Tensor Cores(張量核心)、4個Texture Units(紋理單元)、256 KB Register File(寄存器堆),以及128 KB L1 數據緩存/共享内存子系統,于是這一個全新的SM單元有着超過上一代2倍之的性能表現。
過去的Turing架構INT32 計算單元與FP32數量是一緻的,而兩者相加才組成了64個CUDA核心。但是Ampere架構開始,左側的計算單元實現了FP32 INT32的計算單元并發執行,也就是說CUDA核心數量翻倍到了128個。
再來看看Ada Lovelace架構的SM,FP32/INT32的計算單元組合,同樣實現了每個SM内含128個CUDA的設計,看似提升不大,但是當你了解到GeForce RTX 4090擁有128個SM,16384個CUDA核心,那你也就應該明白達82.6 TFLOPS的着色器能力是如何實現的了,比上一代的RTX 3090 Ti顯卡的40 TFLOPS,還真是提升了兩倍有多。
另外緩存方面Ada Lovelace架構也進行了大規格的提升,首先每個SM單元中單獨配上了128 KB的緩存,這樣RTX 4090顯卡中就實現了163MB L1/共享内存。其次核心的二級緩存進行進行了重新的設計,并且完整AD102核心是96MB二級緩存,而RTX 4090顯卡擁有72MB二級緩存,也可能是因此Ada Lovelace架構核心對顯存位寬的依賴性并不高。
第三代RT Cores與第四代Tensor Cores
技術講解:第三代RT Cores與第四代Tensor Cores
以為剛才的CUDA數量與超大L2緩存就已經很猛了,實現上Ada Lovelace架構最大的提升還是在第三代 RT Cores與第四代 Tensor Cores身上。
第三代 RT Cores
RT Cores用于光線追蹤加速,第三代 RT Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代産品 2.8 倍。
在Ampere架構中,第二代RT Cores支持邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing),用于加速BVH遍曆和執行射線三角交叉測試計算,雖然光線追蹤處理能力已經比初代的Turing架構核心更高效,但是随着環境和物體的幾何複雜性持續增加,傳統的處理方式很難再以更高效率、正确反應出的現實世界中的光線,尤其是光的運動準确性。
所以在第三代 RT Cores增加了兩個重要硬件單元:Opacity Micromap Engine與Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用于alpha通道的加速,可以将 alpha 測試幾何體的光線追蹤速度提高2倍。
在傳統光栅渲染中,開發人員使用一些 Alpha 通道的素材來實現更高效的畫面渲染,例如 Alpha 通道的葉子或火焰等複雜形狀的物體。但在光線追蹤時代,這傳統的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調用一次着色器來确定如何處理相交,這時就會做成嚴重的執行成本與時間等待成本。
而Opacity Micromap Engine用于直接解析具有非不透明度光線交集的不透明度狀态
三角形。根據Alpha 通道的不透明,透明與未知等三個不同的塊狀态進行處理:透明則直接忽略繼續找下一個,不透明塊則記錄并告之命中,而未知的則交給着色器來确定如何處理,這樣GPU很大部分都不需要進行着色器的調試處理,能夠實現更為高效的性能。
Displaced Micro-Meshes Engine
如果說Opacity Micromap Engine加速的是面處理,那麼Displaced Micro-Meshes Engine就是幾何曲面細節的加速器。如上圖所示,在Ada Lovelace架構中,通過1個基底三角形 位移地圖,就可以創建出一個高度詳細的幾何網格,所需要資源占用比二代RT Cores更低,效率也更高。
通過NVIDIA給出的創建14:1珊瑚蟹例子來說事,這裡我們需要需要1.7萬個微網格、160萬個微三角形,在Ada Lovelace架構中BVH創建速度可加快7.6倍,存儲空間縮小8.1倍。Displaced Micro-Meshes Engine起到了關鍵性的作用,其将一個幾何物體根據不同細節分成密度不一的微網絡處理,紅色密度超高,細節處理越為複雜 。相應的低密度微網絡區域則可以釋放更多的資源與存儲空間,這樣Displaced Micro-Meshes Engine就可以幫助BVH加速過程,減少構建時間和存儲成本。
同時Ada Lovelace架構SM中新增了着色器執行重排序(Shader Execution Reordering,SER),這是由于光線追蹤不再隻有強光或者陰影渲染處理,未來将會更多的是在光線的運動性,這樣光線就會變得越來越複雜,想要第三代 RT Cores與第四代 Tensor Cores有着更高的執行效率,那就得為他們來安排一位管家。而着色器執行重排序(SER)就是為了能夠即時重新安排着色器負載來提高執行效率,為光線追蹤提供2倍的加速,也能更好地利用 GPU 資源。不過目前仍未有實例,想實現這個功能,還得遊戲與開發工具的支持才行。
第四代 Tensor Cores
Tensor Cores是專門為執行張量/矩陣運算而設計的專用執行單元,這些運算是深度學習中使用的核心計算功能。第四代 Tensor Cores 新增 FP8 引擎,具有高達 1.32 petaflops 的張量處理性能,超過上一代 的 5 倍。
DLSS 3技術講解
技術講解:DLSS 3
或者說第四代 Tensor Cores太硬核你不會知道是啥?提升意義在哪?但是Tensor Cores最經典的應用DLSS你肯定會知道,這一次Ada Lovelace架構支持NVIDIA最新的DLSS3技術。
之前我們也聊過DLSS技術,其設計之初是為了彌補光線追蹤技術後的性能損失,具體的表現為開啟光線追蹤技術後遊戲幀數大幅度的下降,甚至很難保證遊戲流暢的運行。于是DLSS使用低分辨率内容作為輸入并運用AI技術輸出高分辨率幀,從而提升光線追蹤的性能。
在DLSS3中包含了三項技術:DLSS 幀生成、DLSS 超分辨率(也稱為 DLSS 2)和 NVIDIA Reflex。你可以理解為DLSS3是在DLSS2的基礎上,新增了DLSS 幀生成技術;而後兩技術中,DLSS 超分辨率隻需要GeForce RTX顯卡都能使用上,NVIDIA Reflex則是GeForce 900 系列以後的顯卡都用使用上。
想實現DLSS 幀生成可不簡單,這需要配合上Ada Lovelace架構的GeForce RTX 40系列顯卡才行。DLSS 幀生成技術原理是:利用 AI 技術生成更多幀,以此提升性能。DLSS 會借助 GeForce RTX 40 系列 GPU 所搭載的全新光流加速器分析連續幀和運動數據,進而創建其他高質量幀,同時不會影響圖像質量和響應速度。
從Ampere架構開始,NVIDIA顯卡就已經支持了光流加速器,而Ada Lovelace架構的光流加速器升級到了第二代,其提供了高達300 TeraOPS (TOPS) ,比安培架構的初代光流加速器(Optical Flow Acceleration,OFA)快 2 倍以上。為了實現DLSS幀生成,OFA扮演了重要的角色,其配合上新的運行⽮量分析算法在DLSS3技術框架内實現精确和高性能的幀生成能力。
另外,由于DLSS 幀生成是在GPU上作為後處理執行的,那麼即使在遊戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的遊戲性能提升。尤其是那種物理計算密集型的遊戲或大型場景遊戲,DLSS2均可以讓GeForce RTX 40系列顯卡以高達兩倍于CPU可計算的性能來渲染遊戲。
最後由于DLSS 3是建立在DLSS 2基礎之上的,遊戲開發者可以在已支持DLSS 2或NVIDIA Streamline的現有遊戲中快速集成該功能,所以DLSS 3已在遊戲生态得到廣泛應用,目前已有超過35款遊戲和應用即将支持該技術。
閱讀小亮點:NVIDIA Reflex
NVIDIA Reflex也是DLSS3其中的一環,它可以使GPU和CPU同步,确保最佳響應速度和低系統延遲。
想要實現端對端的最低延遲,你需要确保遊戲、顯示器以及鼠标三者都同時支持并開啟了Reflex 技術。
當GeForce RTX 40 系列顯卡和 NVIDIA Reflex搭配上後,直接達到1440p分辨率360 FPS的體驗,這着實是性能有點強勁了。
在GTC2022大會時已經透露将會還有4 款 1440p 分辨率的新型 G-SYNC 電競顯示器将要發布,包括采用mini-LED技術的AOC AG274QGM – AGON PRO Mini LED、MSI MEG 271Q Mini LED 和 ViewSonic XG272G-2K Mini LED三款顯示器刷新率均為300Hz,而最猛的是ASUS ROG Swift 360 Hz PG27AQN ,刷新率直接來到了360Hz。
但唯一一個問題就在于,部分顯示器廠商認為此類産品受衆人群較少,會降低此類顯示器的産能,甚至産品就已經被内部PASS掉,所以1440p360Hz是很美好,但現實也是相當的骨感。
雙NVIDIA編碼器講解
技術講解:雙NVIDIA編碼器(NVENC)
GeForce RTX 40 系列顯卡還有一個全新的升級,那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式 AV1。
而由于AV1是一種免版稅的視頻編碼格式,上遊軟件廠商與下遊戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬件與軟件支持AV1格式,包括剪映專業版、DaVinci Resolve、以及 Adobe Premiere Pro 較為流行的 Voukoder 插件均支持,且均可通過編碼預設使用雙編碼器,這樣我們等待視頻導出的時間縮短将近一半。
不單是視頻制作軟件,AV1格式也将會是主播、遊戲直播UP主們的新寵兒,在保證畫面最高質量的情況下,AV1 編碼器可将效率提高 40%,同時顯卡的占用也更低。包括OBS Studio一一代軟件中也會增加AV1格式的支持。另外我們還能通過 GeForce Experience 和 OBS Studio 錄制高達 8K60 的内容,這樣我們做遊戲錄制也會變得更為輕松。
包括我們之後測試時使用的遊戲内錄視頻都是支持AV1格式,同時雙編碼器NVENC在資源占用和适配上做得越來越好。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!