終於,最後一張 RTX 40 SUPER 系顯示卡它來了,主打 4K 高刷遊戲體驗,並且首發價相比 RTX 4080 直降 1499 元,也就是 8099 元。如果你最近正好有升級或裝機需求,預算充裕且希望各方面表現均衡,一步到位。那麼今天這期 NVIDIA GeForce RTX 4080 SUPER 顯示卡的評測內容一定能幫到你。
評測之前,按照慣例先來介紹一下本次的測試平臺,具體配置如下:
外觀設計
這次公版卡所有型號都改成了黑色塗裝,可以說是外觀上最大的變化。也正因為這個細節的區別,使得新版 NVIDIA GeForce RTX 4080 SUPER 的外觀更加帥氣。
開箱公版卡本身也是一件令人興奮的事,包裝做的非常精緻,把它如上圖這樣放在桌面時,說是一個金屬科技感滿滿的“擺件”也不為過。
NVIDIA GeForce RTX 4080 SUPER 的正面依舊採用 X 型設計,還有佔據幾乎一半面積的超大風扇,左側的 RTX 4080 SUPER 型號文字分別採用陰刻和陽刻處理,實際觀感頗為精緻。不過尺寸上變成了一張 3.5 槽卡,因此體積比較大,重量也增加了不少,即使裝機時還是建議大家上顯示卡支架。
右側的散熱鰭片和風扇均採用全黑化處理,拿在手裡很有分量,也有利於更高效地散熱。
同樣的,背部左側也有一個一模一樣的風扇,彼此能夠形成垂直風道,更好帶走顯示卡內部的熱量。
NVIDIA GeForce RTX 4080 SUPER 顯示卡的側面也同樣做了黑化處理,視覺上非常統一,中間還微微做了一點凹陷弧度處理,增強質感。供電介面採用 12+4pin 設計,供電更加穩定。
I / O 介面擋板採用深灰配色,介面方面配備了 3*DP1.4a 介面和 1*HDMI2.1 介面,最高支援 8K60Hz 輸出。
配件方面,NVIDIA GeForce RTX 4080 SUPER 配備了一條 16pin 轉 3*8pin 的轉接線,對電源的相容性更好。
核心解析
GeForce RTX 4080 SUPER 雖然也基於 AD103 核心所打造,但是核心規格方面相當恐怖。比如配備了 10240 個 CUDA 核心,相比 RTX 4080 的 9728 個 CUDA 核心,核心數提升了 5.2%。它還擁有 52 個 Shader Core TFLOPS 單元和 121 個 RT Core TFLOPS,圖形 / 遊戲效能再次升級。此外,它的 320 個 Tensor Cores 核心和 836 個 AI TOPS 將提供強大的 AI 算力和 DLSS 效能。
視訊記憶體規格上 GeForce RTX 4080 SUPER 還是 16GB GDDR6X,與 RTX 4080 保持一致。不過,64MB 的 L2 快取,能夠讓 GeForce RTX 4080 SUPER 充分發揮 4K 解析度下的遊戲效能。GPU 頻率方面,基礎頻率為 2295MHz,加速頻率為 2550MHz,分別比 RTX 4080 提升了 40MHz 和 80MHz。從顯示卡規格和官方的定位上看,GeForce RTX 4080 SUPER 是一張定位 4K 遊戲和擁有強大 AI 算力的高階顯示卡。
當然,GeForce RTX 4080 SUPER 依舊採用了最新的 NVIDIA Ada 架構,基於 TSMC 4N NVIDIA 定製工藝打造,因此實現了高達 2 倍的效能功耗比飛躍。流式多處理器的吞吐量超過上一代產品 2 倍。第三代 RT Cores 的 DLSS 3 可讓光追效能提升 2 倍,第四代 Tensor Cores 新增 FP8 引擎,具有高達 1.32 petaflops 的 Tensor 處理效能,DLSS 至多提升 4 倍效能。
理論效能
測試效能之前,我們不妨透過甜甜圈烤機測試,來看看它的功耗表現如何。烤機 20 分鐘,GPU 功耗保持在 320W 左右,核心溫度 69℃左右,視訊記憶體溫度 70℃,這個溫度表現還是比較均衡的,而此時的 GPU 頻率可以來到 2325MHz-2450MHz 之間,效能釋放還是有保障的。
烤機之後,我們又對 GeForce RTX 4080 SUPER 進行了 3D Mark 的 Time Spy 壓力測試,來看看在連續高負載下的顯示卡效能釋放是否平穩和持久,最終 GeForce RTX 4080 SUPER 得到了 99.6% 的成績,持續的效能輸出表現非常出色。
接下來是 GPU 理論效能測試環節,在 3DMark TimeSpy Extreme DX12 測試中,GeForce RTX 4080 SUPER 的顯示卡分數為 14401 分,相比 RTX 3080 的 8602 分提升了 67.4% 左右,也超越了上一代 RTX 3090。
在 3DMark Fire Strike Extreme DX11 測試中,GeForce RTX 4080 SUPER 的顯示卡分數為 34894 分,對比 RTX 3080 的 20382 分提升了約 71.2%,而相比上代 RTX 3090 Ti 的 27074 分,也有 28.8% 的提升。
在 3DMark Fire Strike Ultra DX11 測試中,GeForce RTX 4080 SUPER 的顯示卡分數達到了 17395 分,對比 RTX 3080 的 10365 分提升了約 67.8%,也領先於上代 RTX 3090 Ti 的 13855 分。
在 3DMark Portal Royal 光追測試中,GeForce RTX 4080 SUPER 獲得了 18439 分,相比 RTX 3080 的 11231 分提升了 64.1%,光追遊戲效能提升明顯。
遊戲實測
既然說到遊戲,就不得不提一下目前 NVIDIA 平臺已經擁有超 500 款支援 RTX 技術的遊戲和應用,而且隨著 DLSS 3 技術的日趨成熟和普及,支援 DLSS 3 的遊戲數量也在源源不斷的上升。
比如今年 14 款支援 DLSS 3 技術的全新遊戲加入,包括《龍之信條 2》《地平線: 西之絕境》《人中之龍 8》《半條命 2 RTX》等知名遊戲。另外,已經發布的《心靈殺手 2》《賽博朋克 2077:往日之影》《使命召喚:現代戰爭 3》等,也在第一時間就支援了 DLSS 3 或 DLSS 3.5 的技術。與此同時,目前主流的熱門線上競技類遊戲,都支援了 NVIDIA Reflex 技術,不管是對於低配玩家還是電競玩家,這兩項技術都能極大提升遊戲體驗。
接下來的遊戲測試環節,我們將給大家測試 6 款遊戲,包括 2 款線上競技類遊戲,2 款傳統光柵遊戲以及 2 款支援 DLSS 3/3.5 的光追遊戲,所有遊戲均採用 4K 解析度測試,以此驗證它的 4K / 4K 光追遊戲表現。
首先是兩款線上競技類遊戲,在《CS2》中我們採用預設高畫質選項,在 4K 解析度下進行一局對戰,並透過 Frame View 記錄平均幀數,GeForce RTX 4080 SUPER 在 4K 解析度的平均幀數能夠達到 305 幀。
另外,透過開啟遊戲設定中的 NVIDIA Reflex 選項至開啟 + 增強,即使來到 4K 解析度下,遊戲的平均延遲也只有 9ms,對玩家的影響可以說非常小。
第二款線上競技類遊戲我們選擇了人氣頗高的《彩虹六號:圍攻》,GeForce RTX 4080 SUPER 在 4K 解析度,最高畫質下的平均幀數達到了 350 幀,也是完全能夠滿足高分高刷電競需求的。
至於延遲方面,《彩虹六號:圍攻》同樣支援 NVIDIA Reflex 技術,在遊戲執行時選擇帶有 Vukan 的選項,就能在遊戲中找到 Reflex on + 增強的選項,開啟之後透過 Frame 進行抓取,4K 解析度下的平均延遲也才 10.2ms,延遲表現相當可以。
接著是 2 款傳統光柵遊戲,在經典敘事冒險遊戲《荒野大鏢客:救贖 2》中,選擇最高畫質,4K 解析度下的平均幀數可以達到平均 99 幀,RTX 4080 為 95 幀,提升了 4.2%。
我們也測了育碧家的最新作《刺客信條:幻景》,在 4K 解析度最高畫質下,運行遊戲自帶的效能基準測試,GeForce RTX 4080 SUPER 的平均幀數來到 100 幀,RTX 4080 的平均幀數為 92 幀,提升了約 8.6%。從測試結果不難看出,在傳統光柵遊戲中,RTX 4080 SUPER 相比 RTX 4080 的提升比較有限。
那麼在光追遊戲中,GeForce RTX 4080 SUPER 的表現又如何呢?IT之家選擇了兩款支援 DLSS 3/3.5 的光追遊戲,其中一款是最佳化非常出色的《極限競速:地平線 5》,在遊戲中選擇極端畫質預設,並開啟 DLSS 3 + DLSS 2 質量檔,NVIDIA Reflex 選項也會預設開啟,我們照例選擇 Reflex ON+BOOST,運行遊戲自帶的效能基準測試。
進入遊戲選擇 4K 解析度極端畫質,平均幀數可以達到 149 幀,遊戲的平均延遲僅為 16.4ms。RTX 4080 的平均幀數是 132 幀,提升約 12.8%。
那如果我們只開光追,不開 DLSS 選項,且關閉 Reflex 低延遲選項時,GeForce RTX 4080 SUPER 的表現又如何呢?可以看到在優化出色的地平線 5 中,即使不開 DLSS,4K 光追下平均幀數依舊來到了 125 幀,不過沒有 Reflex 低延遲技術的加持,遊戲平均延遲飆升到了 24.1ms。
最後是對顯示卡效能要求非常高的《賽博朋克:2077》,這次我們測試 3 次,第一次選擇超級光追畫質,開啟 DLSS 2 質量檔 + DLSS 3 幀生成,在 4K 解析度下執行自帶基準效能測試,此時平均幀率能到 83 幀,還不錯的表現。
第二次我們選擇超速光追畫質,開啟 DLSS 2 質量檔 + DLSS 3 幀生成 + DLSS 3.5 光線重構,此時 4K 解析度下,GeForce RTX 4080 SUPER 的平均幀數正好 60 幀,算是守住了 4K / 60 幀的底線。
當然,如果完全關閉 DLSS,只開光追,4K 下的遊戲平均幀數就只有 29 幀了,畢竟不是所有遊戲都能有地平線 5 的最佳化水平,畫質對效能的負載也不同。透過對比不難發現,DLSS 技術對於遊戲玩家來說絕對是最實用的技術。
關閉光線重建
開啟光線重建
那麼開不開 DLSS 3.5 對於遊戲畫質到底有何影響呢?大家看這兩張圖,遊戲中同一個場景下雨後溼滑路面的倒影給了我們答案,在開啟光線重建後倒影的清晰度提升明顯,以往畫面中常有的偽影也少了很多,顯而易見 DLSS 3.5 可以說是高等級光追的潤滑劑,在保留最高畫面效果的同時,也能發揮最好的幀數表現。
創意生產
前面我們曾提到,GeForce RTX 4080 SUPER 的 L2 快取也達到了 64MB,視訊記憶體頻寬高達 23Gbps,還有多達 836 個 AI TOPS 核心,這為 GeForce RTX 4080 SUPER 的創意生產和 AI 效能提供了有力保障。使用者還可透過安裝 NVIDIA Studio 驅動,以加速 110 多款最受歡迎的創意應用,如 Optix、DLSS 和 Maxine,還有 NVIDIA Studio 全套創意應用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
在建模和渲染類軟體中,GeForce RTX 4080 SUPER 的 10240 個 CUDA 核心可以提供硬體加速,使得工作效率得以提高。幾乎所有的建模軟體都會對 NVIDIA 的 GPU 進行最佳化,因此在效率、穩定性和相容性方面都能夠兼顧。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光線追蹤功能,實現高效能的最終幀渲染。此外,搭載了 AI 降噪功能的 GPU 還可以進一步加速互動式渲染,提供更加流暢的工作體驗。
實際看一下 GeForce RTX 4080 SUPER 的專業生產力表現。首先是 V-Ray Benchmark 這款建模軟體的基準測試部分,GPU CUDA 測試專案得分為 3103 分。
在 GPU RTX 的測試專案中,GeForce RTX 4080 SUPER 顯示卡的最終成績為 4292 分。
在另一款建模軟體 blender 的 Benchmark 測試中,GeForce RTX 4080 SUPER 顯示卡的三場景得分如圖所示,三場景得分則是 4574,2162,2264,同樣有明顯提升。
接著咱們看看它在影片渲染和編解碼方面的效能表現,GeForce RTX 4080 SUPER 配備了 2 個 NVENC 編碼器,且支援新一代 AV1 影片編碼技術,相同影片大小下能夠提供更加快速的影片編碼和更高質量的流媒體傳輸效能。國內的剪映專業版已經實現了對 NVIDIA AV1 影片編碼器的加速支援,我們也對此進行了測試,在剪映專業版中匯入一段時長為 2 分 30 秒的 4K 影片素材,然後分別採用 H.264 編碼和 AV1 編碼進行匯出。
可以看到同樣匯出 4K / 60 幀規格的情況下,AV1 編碼匯出的影片大小為 609MB,H.264 編碼匯出的影片大小為 800MB,檔案體積上採用 AV1 編碼的影片相比 H.264 編碼的影片小了近三分之一。
而且在畫質方面,透過擷取兩個影片的畫面細節進行觀察,兩種編碼方式也基本看不出任何區別,又小又高畫質,AV1 勢必會成為編碼格式中的新寵。
還有就是 RTX 影片超解析度技術,它可以透過 GPU 的 AI 計算,至多將線上 1080P 影片提升到 4K 解析度,實現以演算法提高畫質晰度的效果。我們只需在 NVIDIA 控制面板中找到影片 —— 調整影片影象設定,便可以自定義調節,超分等級有 4 檔。
↑ 從左至右依次為 480P、VSR1、VSR2、VSR3、VSR4
我們透過播放在IT之家B站賬號釋出的一條影片,並將解析度調整為 480P,然後依次提升超分等級進行截圖測試,能看出 1-4 檔下人物變得更加清晰了。
最後我們還透過 Stable Diffusion 簡單測試了一下這張卡在 AIGC 方面的表現,模型我們採用了基於 SDXL 開源模型的 sd_xl_base_1.0_0.9vae.safetensors,以文生圖的方式繪製 21 張雪山上的女孩影象,影象解析度為 1024*1024,取樣方法為 Euler a,迭代步數 50,總批次數為 10,最終花費 1 分 55 秒完成。
第二次我們在其它設定不變的情況下,開啟 TensorRT Engines 最佳化引擎後再跑一遍,這次時間僅僅花費了 1 分 01 秒,節省了近一半。
另外,在 Stable Diffusion 跑圖時檢視視訊記憶體的佔用情況,即使是目前評測中較為簡單的繪圖引數設定情況下,8GB 視訊記憶體佔用也是常態,瞬時視訊記憶體佔用還會飆到 10GB12GB 以上,更別提解析度更高,引數設定更復雜的繪圖條件了。如果這張卡的視訊記憶體只有 8GB,那麼對於專業 AI 創作者來說,爆視訊記憶體很可能經常發生,一旦視訊記憶體不夠出圖時間便會大大延長,非常耽誤事情。所以 GeForce RTX 4080 SUPER 的 16GB 大視訊記憶體在 AI 方面起到了非常重要的作用,它和 AI 內容生成的效率直接掛鉤,相同架構和近似效能下,視訊記憶體越大越有優勢。
總結
和之前我們評測的 GeForce RTX 4070 SUPER 相比,這張 GeForce RTX 4080 SUPER 顯然是瞄準了追求 4K 極致遊戲體驗的使用者,也就是主流遊戲全畫質特效也能達到 4K 100FPS 的遊戲效能,玩家無需在遊戲畫質和特效中取捨糾結,盡情享受遊戲就好。還在用 RTX 40 系以前老卡的使用者,想要一步到位的遊戲體驗可以閉眼買。不過,如果你手上已經有任何一張 RTX 40 顯示卡,那麼升級顯示卡的週期都可以往後延。除此之外,有 AIGC 創作或者其它 AI 需求的使用者,也可以考慮這張卡,目前來說,它也是最適合做 AI 相關工作的。
另一方面,公版 GeForce RTX 4080 SUPER 出色的做工和質感,獨特的外形設計,也是很多玩家追捧的原因之一。更別說這次首發價格比原版 RTX 4080 整整便宜了 1400 元。有趣的是,如果我們對比上一代 RTX 3080Ti,那麼你會發現兩者的 CUDA 核心,Tensors Cores,RT Cores 的數量都是一樣的,但是因為採用了 Ada Lovelace 架構,各方面表現都強很多,功耗甚至也要低上 30W。