一、前言:顛覆你對Blackwell GPU高功耗的既有印象
僅憑增加30%的規格就提升了30%的效能,RTX 5090D可以說是十年來最高效GPU。要知道上代的RTX 4090在2.7倍的電晶體數量、1.4倍頻率執行頻率雙加持下,相比RTX 3090 Ti才提升了50%的效能!
雖然效能無可挑剔,但它的功耗卻比我們預期的要高了不少,而今天解禁的RTX 5080將會顛覆你對Blackwell GPU高功耗的既有印象!
RTX 5080採用NVIDIA定製的臺積電4NP製程工藝,全新的Blackwell GPU架構,核心編號BG203。
與上代RTX 4080遮蔽了2組TPC單元不同,RTX 5080採用了完全的、沒有任何精簡的BG203-400核心。
從上面的架構示意圖可以看出,GB203與AD103的區別貌似就是補全了最後一個GPC,從4組TPC增加到完整到了6組TPC。
GB203由7個GPC組成,每個PGC包含6組TPC,再細分為12組SM單元,而每一組SM 還是有128個CUDA核心。
總計就是42組TPC、84組SM單元、10752個CUDA核心(流處理器),另外還有336個第5代Tensor Core張量核心、84個第4代RT Core光追核心、336個紋理單元、112個ROP單元、10.5MB一級快取和64MB二級快取。
令人驚訝的是,GB203與AD103核心面積均為378平方毫米,電晶體數量卻從459億減到了456億,然而CUDA核心數量反而還增加了512個。
難道是NVIDIA能夠更高效地利用每一個電晶體了?還是有其他原因?暫時不得而知。
RTX 5080詳細規格引數如下:
比較有意思的是,除了快取之外,RTX 5080的主要規格引數與RTX 3090 Ti幾乎完全相同,而電晶體數量和晶片面積又與RTX 4080差不多。
而大的改進就是它採用了GDDR7視訊記憶體,並且頻率來到了前所未有的30GHz,再配合256Bit位寬,總頻寬達到了960GB/s,相比RTX 4080提升了34%,非常接近RTX 3090 Ti的1008GB/s。
二、NVIDIA RTX5080FoundersEdition圖賞:迷你的方形PCB
不同於以往的包裝盒,更環保。
開箱。
延續了RTX 5090 Founders Edition的外形設計, 相比RTX 40系列FE,邊角要更加圓潤平滑。
NVIDIA的攻城獅改進了散熱設計,2個風扇都可以直接吹透顯示卡,可以大幅度提升散熱效率。
背面。
3個支援UHBR20的DP 2.1b介面和一個HDMI 2.1b介面。
所有的影片介面都支援DSC壓縮,而3個DP 2.1b介面可以輸出4K 480Hz的12Bit HDR畫面,或者8K 165Hz的12Bit HDR畫面。
頂部的16Pin供電介面,傾斜設計,更有利於保護電源線。
散熱器為對稱設計,中間是純銅底座,搭配5條8mm熱管將熱量傳導至散熱器兩側。
非常迷你的正方形PCB板,剛好位於散熱器中間部位,不會擋住兩側的氣流。
16+3相供電電路設計,滿足360W的功率輸出沒什麼問題。
由於正面空間不夠,供電電容被放在了PCB板背面,並且全部使用的是高成本的鉭電容。
與iPhone 15 Pro對比大小。
RTX 5080採用的是滿血的GB203-400-A1核心,晶片面積378mm2,擁有456億電晶體。
GPU旁邊是8顆三星GDDR7視訊記憶體,單顆2GB,總容量16GB,等效頻率30GHz,頻寬960GB/s。
附贈的3x8pin轉16Pin線。
三、測試平臺:銳龍7 9800X3D + 鑫谷崑崙九重KE-1300P白金牌數字電源
測試平臺如下:
此前我們的測試平臺一直使用i9-14900KS,可惜Ultra 9 285K開了倒車,換上地表最強遊戲處理器--銳龍9 9800X3D。
不出意外,未來很長一段時間,我們的首發評測都會使用銳龍9 9800X3D處理器。
技嘉X670E AORUS XTREME,支援XMP/EXPO高頻寬,可以一鍵降低10%延遲,提升10%頻寬。
長江儲存TiPlus7100 SSD,基於晶棧3.0架構快閃記憶體,I/O速度高達2400MT/s,只需四通道就能達成7000MB/s的效能。
七彩虹CVN DDR5 6000 16GB x2套條,時序34-44-44-108,電壓1.4V。
我們在測試時會調整為6200MHz CL30-38-38-96。
微星MAG CORELIQUID I360水冷散熱器,冷頭採用了獨特的雙面無限鏡設計,風風扇的線材是積木連結設計的,支援一線連模式,不會像常規水冷需要繁雜的接線。
鑫谷崑崙九重KE-1300P白金牌數字電源,能做到電壓/功率智慧跟隨,在極高負載下也不會出現普通電源那種掉壓的情況。
本次測試還使用了鑫谷最新提供的12V-2x6 16針電源線,電流更加穩定。
技嘉M28U 4K顯示器。
四、3DMark測試:穩定頻率只有2700MHz 比RTX 5090D低140MHz
1、3DMark Fire Strike
2K解析度3DMark Fire Strike Extreme測試中,RTX 5080圖形分數達到了38979分,核心溫度最高59.4℃,核心執行最高頻率為2775MHz,最高風扇轉速1348PM,整卡最高功耗306W。
在4K解析度3DMark Fire Strike Ultra測試中,RTX 5080圖形分數為20655分,核心溫度最高57.6℃,核心執行最高頻率為2775MHz,最高風扇轉速1302RPM,最高功耗331W。
2、3DMark Time Spy
在2K解析度3DMark Time Spy測試中,RTX 5080圖形分數達到了31563分,核心溫度最高59.6℃,核心執行最高頻率為2760MHz,最高功耗304W,最高風扇轉速1320RPM。
在4K解析度3DMark Time Spy Extreme測試中, RTX 5080圖形分數為15855,核心溫度最高62℃,核心執行最高頻率為2767MHz,最高功耗333W。
在測試過程中,RTX 5080的執行頻率可以長時間穩定在2700MHz,這個頻率甚至比RTX 5090D還要低140MHz。
五、1080P解析度測試:和RTX 4090D差距不大
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、黑神話:悟空
7、霍格沃茨之遺
8、極限競速:地平線5
9、龍騰世紀:影障守護者
10、賽博朋克2077
11、巫師3
12、無主之地3
13、心靈殺手2
14、星空
15、星球大戰:亡命之徒
16、戰爭機器5
測試資料彙總如下:
1080p解析度下,RTX 5080 FE對比上代RTX 4080平均提升了7%,而面對競品旗艦RX 7900 XTX,仍然有10%的明顯優勢。
六、2K解析度測試:比RX 7900 XTX強10%
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、黑神話:悟空
7、霍格沃茨之遺
8、極限競速:地平線5
9、龍騰世紀:影障守護者
10、賽博朋克2077
11、巫師3
12、無主之地3
13、心靈殺手2
14、星空
15、星球大戰:亡命之徒
16、戰爭機器5
測試資料彙總如下:
到了2K解析度,RTX 5080的優勢得以擴大,對比RTX 4080平均提升了幾乎10%,而在RX 7900 XTX的面前,依然有超過10%的優勢。
七、4K解析度測試:最適合的戰場 提升幾乎15%
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、黑神話:悟空
7、霍格沃茨之遺
8、極限競速:地平線5
9、龍騰世紀:影障守護者
10、賽博朋克2077
11、巫師3
12、無主之地3
13、心靈殺手2
14、星空
15、星球大戰:亡命之徒
16、戰爭機器5
測試資料彙總如下:
很顯然,4K解析度才是RTX 5080的最佳戰場,對比上代提升了幾乎15%,同時領先競品旗艦超過14%。
八、DLSS 4遊戲測試:效率高於RTX 5090D
此次我們一共測試了5款支援DLSS 4的遊戲:《星球大戰:亡命之徒》、《心靈殺手2》、《賽博朋克2077》、《龍騰世紀:影障守護者》、《霍格沃茨之遺》。
所有DLSS 4以及光追測試都是在4K解析度下進行。
1、星球大戰:亡命之徒
4K解析度最高畫質下,RTX 5080幀率為54FPS。
開啟光追之後掉到了21FPS。
開啟DLSS 4多幀生成之後,幀率暴漲到了164FPS,提升了681%。
2、心靈殺手2
4K解析度最高畫質下,RTX 5080幀率為54FPS。
開啟光追之後掉到了19FPS。
開啟DLSS 4多幀生成之後,幀率暴漲到了122FPS,提升了540%。
3、賽博朋克2077
《賽博朋克2077》在4K解析度下幀率為86FPS,開啟光追之後掉到了31FPS,開啟DLSS 4之後,幀率為245FPS,提升幅度690%。
4、龍騰世紀:影障守護者
《龍騰世紀:影障守護者》需要在NVIDIA app裡面開啟DLSS 4多幀生成。
4K解析度最高畫質,RTX 5080的幀率是75FPS,開啟光追之後幀率為53FPS,開啟DLSS 4,幀率257FPS,提升幅度為385%。
5、霍格沃茨之遺
4K解析度最高畫質,RTX 5080的幀率是91FPS,開啟光追之後幀率為60FPS,開啟DLSS 4,幀率306FPS,提升幅度為410%。
測試資料彙總如下:
可以看到RTX 5080的光追效率與RTX 4080幾乎一樣,開啟幀率都下降了51%,略強於RTX 3090 Ti的-53%。
由於不像RTX 5090D那樣閹割了部分1/3的AI算力,RTX 5080的DLSS 2效率比前者要強了30%左右。
在幀率方面,RTX 4080開啟DLSS 3幀生成之後,效能提升幅度為271%;而RTX 5080開啟DLSS 4多幀生成之後,提升幅度為542%,剛好是RTX 4080的二倍。
另外在DLSS 4的加持下,RTX 5080的幀率要遠高於RTX 4090D,領先幅度約為50%。
測試中都使用了遊戲預設設定,DLSS 3開啟幀生成,DLSS 4開啟多幀生成,未使用路徑光追。
九、AI測試:比RTX 4080強20%左右
1、AI Image Generation Benchmark--Stable Diffusion 1.5(FP16)
當RTX 5080使用FP16精度進行AI Image Generation Benchmark測試時,總分為4669。
2、AI Text Generation Benchmark--PHI 3.5
這裡我們只對比PHI 3.5的效能,RTX 5080比RTX 4080強了20%左右,比AMD RX 7900 XTX強了80%。
測試資料彙總如下:
不考慮FP4精度,RTX 5080D的AI效能比RTX 4080強了21%,比RTX 3090 Ti強了30%左右,對比RX 7900 XTX則強了103%。
十、生產力測試:略強於前代
1、PugetBench for Photoshop
2、PugetBench for Premiere Pro
3、PugetBench for DaVinci Resolve
4、Procyon影片編輯測試
5、Blender Benchmark v4.3
Blender v4.3是一款備受3D藝術家喜愛的開源3D建模和渲染軟體,可以處理從建模、繫結、動畫、模擬、渲染、合成和運動跟蹤,甚至影片編輯和遊戲建立的所有內容。
6、Indig Benchmark v4.4.15
Indigo Renderer是一款功能強大的影象渲染軟體,被廣泛應用於工業設計和建築設計軟體之上。
IndigoBench 基於 Indigo 4 的高階渲染引擎,測試程式支援GPU和CPU兩種渲染模式。
7、Vray-Benchmark
V-Ray是一個廣泛應用於建築、工業設計和電影視覺效果領域的渲染軟體,而V-RayBenchmark則是基於V-Ray渲染引擎的一款效能測試工具,主要用於評估系統在進行V-Ray+渲染時的效能,能準確反映系統在處理複雜3D場景渲染時的效能表現。
測試資料彙總如下:
十一、實際遊戲功耗測試:竟比RTX 4080還低
RTX 5090D的功耗表現多少有點讓我們失望,希望RTX 5080能帶來驚喜!
1)、烤機測試
使用Furmark來對RTX 5080進行烤機測試,測試是室溫為28度。
將Furmark的引數設定為1920*1200解析度、0AA。
執行10分鐘之後,RTX 5080的溫度穩定在68度附近,顯示卡的功耗360W,烤機時GPU頻率為2340MHz,CPU風扇轉速只有1526RPM。
2)、遊戲功耗
我們測試了8款遊戲的實際功耗表現,受限於時間與篇幅,我們只展示2款遊戲的詳細功耗對比。
1、黑神話:悟空
1080P解析度下,
RTX 5080功耗239W,幀率79FPS,每瓦特幀率0.33。
RTX 4080功耗270W,幀率74PS,每瓦特幀率0.27。
RTX 3090 Ti功耗388W,幀率56FPS,每瓦特幀率0.14。
RTX 5080的能效比是RTX 3090 Ti的2.4倍。
2K解析度下,
RTX 5080功耗255W,幀率65FPS,每瓦特幀率0.25。
RTX 4080功耗287W,幀率58FPS,每瓦特幀率0.20。
RTX 3090 Ti功耗417W,幀率46FPS,每瓦特幀率0.11。
RTX 5080的能效比是RTX 3090 Ti的2.3倍。
4K解析度下,
RTX 5080功耗277W,幀率41FPS,每瓦特幀率0.15。
RTX 4080功耗300W,幀率37FPS,每瓦特幀率0.12。
RTX 3090 Ti功耗441W,幀率31FPS,每瓦特幀率0.70。
RTX 5080的能效比是RTX 3090 Ti的2.1倍。
2、賽博朋克2077
1080P解析度下,
RTX 5080功耗206W,幀率232FPS,每瓦特幀率1.13。
RTX 4080功耗273W,幀率214FPS,每瓦特幀率0.78。
RTX 3090 Ti功耗378W,幀率180FPS,每瓦特幀率0.47。
RTX 5080的能效比是RTX 3090 Ti的2.4倍。
2K解析度下,
RTX 5080功耗240W,幀率172FPS,每瓦特幀率0.72。
RTX 4080功耗290W,幀率140FPS,每瓦特幀率0.48。
RTX 3090 Ti功耗426W,幀率131FPS,每瓦特幀率0.31。
RTX 5080的能效比是RTX 3090 Ti的2.3倍。
4K解析度下,
RTX 5080功耗287W,幀率95FPS,每瓦特幀率0.33。
RTX 4080功耗309W,幀率69FPS,每瓦特幀率0.22。
RTX 3090 Ti功耗450W,幀率68FPS,每瓦特幀率0.15。
RTX 5080的能效比是RTX 3090 Ti的2.2倍。
點選大圖,可以看到RTX 5080的頻率為2677MHz、RTX 4080則是2745MHz,改進了直衝工藝,反而還降低了執行頻率,這就是為什麼RTX 5080的功耗比RTX 4080更低的原因所在。
測試資料彙總如下:
RTX 5080在1080P、2K與4K解析度下的遊戲功耗分別為219W、249W、286W,這三個數字全部都是所測試顯示卡中的最小數值。
在主流3A大作中,RTX 5080的能效比約為RTX 4080的1.2倍,RTX 3090 Ti的2.2~2.4倍。
十二、小結:功耗比RTX 4080更低 效能接近RTX 4090D
長話短說,以下是本次測試小結!
1、功耗
老實說,我們對RTX 5090D的能效比不甚滿意,這塊RTX 5080在這方面的優異表現實在讓我們驚歎不已!
從上面這種圖就可以看出RTX 5080的實力。
功耗比RTX 4080低50W、比RTX 3090 Ti低了近200W,但遊戲幀率卻高了不少。
我們一共測試了8款遊戲的功耗,不論是1080P、2K還是4K解析度,RTX 5080的功耗都是最低的。
頂著360W的TGP(功耗牆),4K解析度下,遊戲平均功耗僅為286W,實際遊戲功耗也基本上不會超過300W,這與RTX 5090D動輒500W比起來,簡直是雲泥之別。
P.s.如果有同學不理解為什麼RTX 5080會有這麼優秀的能效比,可以點選大圖,你就會注意到它的執行頻率與電壓比要比RTX 4080低不少,不要忘了還有增強版的臺積電4NP製程工藝的加持。
2、效能
RTX 5080的已經全面超越了AMD上代旗艦RX 7900 XTX,在1080P、2K和4K解析度下分別強了10%、10.3%和14%,比起RTX 4080,在4K解析度下則有15%的效能優勢!
和RTX 4090D的差距也不是很大,3個解析度下的效能差距都沒有超過10%。
3、DLSS 4和光追
和RTX 5090D相比,RTX 5080擁有更好的DLSS效率!
我們測試了5款支援DLSS 4的遊戲,當只開啟DLSS 2時,遊戲幀率提升幅度為134%,RTX 5090則是107%。
開啟DLSS 4,遊戲幀率提升幅度達到了542%,《賽博朋克2077》和《星球大戰:亡命之徒》這2款遊戲的提升幅度更是接近700%。
相比之下,只支援DLSS 2的RTX 3090 Ti在開啟DLSS之後效能提升幅度為124%,支援DLSS 3插幀的RTX 4080提升幅度則是299%。
4、價格
在30Gbps的GDDR7視訊記憶體的加入自後,RTX 5080的製造成本應該是高於RTX 4080的,但卻依然維持了與後者相同的8299元起售價。
更低的功耗,15%的效能提升,效率更高的散熱系統,RTX 5080會火嗎?