RTX 40 SUPER系的最後一位成員GeForce RTX 4080 SUPER在2024年1月的最後一天如期而至。相比RTX 4070 SUPER的驚豔亮相,RTX 4070 Ti SUPER的加量不加價,RTX 4080 SUPER又會以怎樣的姿態面世?從NVIDIA的給出的資料和說法來看,這塊顯示卡加量還降價了!嘿,還有這種好事兒?當然必須得來親自測試一番看看!
微升級,RTX 4080的高性價比平替
首先來看RTX 4080 SUPER這顆GPU的規格。RTX 4080 SUPER的核心代號為AD103-400,隸屬於AD103的RTX 4080家族。從硬體規格配置上來看,RTX 4080 SUPER共配置了7個GPC,40個TPC模組組成80組SM單元和10240個CUDA核心,這樣的配置與前一代的RTX 3080 Ti處於同一水準,但Ada Lovelace更高效和先進的結構無疑會使RTX 4080 SUPER的效能表現遠勝RTX 3080 Ti,這一點毋庸置疑。
80個SM單元和10240個CUDA核心的配置使得RTX 4080 SUPER相比RTX 4080來說只能算是微小的升級,再加上幾乎相同的16GB GDDR6X視訊記憶體配置,使得二者的硬體規格差距僅有5%左右,具體到應用環境下,估計這個效能上的差距還會有縮小。而與當前Ada Lovelace的新旗艦RTX 4090 D相比,RTX 4080 SUPER與其在硬體規格上的差距就比較大了,達到了40%以上,因此RTX 4080 SUPER的效能相比RTX 4090 D來說應該是差距比較明顯的。
NVIDIA目前對RTX 4080 SUPER給出的指導首發價格是8099元,相比當初RTX 4080首發時的9499元大幅降低了1400元。結合RTX 4080 SUPER的硬體規格配置,它應該是針對RTX 4080的微小升級產品,所以在效能上RTX 4080 SUPER相對RTX 4080的提升不會太高。更低的價格和效能上的微小提升帶來了更高的性價,以此在高階顯示卡市場上推出極具價效比的熱點產品,這或許就是RTX 4080 SUPER面世的最大意義。
外觀上,RTX 4080 SUPER仍然延續了RTX 40 SUPER系前兩款產品一樣的深邃黑風格,說實話,這比此前RTX 40系的淡淡香檳金的外框配色更顯沉穩,而且對我個人來說也更討好我的眼球。在整體風格上,仍然是非常簡潔清爽,沒有一絲多餘的設計。拿到手裡的時候,我們就第一時間發現RTX 4080 SUPER FE顯示卡在整體造型和散熱模組的配置上,都沿用了此前RTX 4090的旗艦級配置,因此在散熱效能的表現上,它大機率會比RTX 4080的表現更好一些。
▲電源介面仍然是ATX 3.0電源規範的PCIe 5.0標準16Pin 12VHPWR供電介面,單口可實現600W供電支援。
▲影片輸出介面為經典3DP 1.4a+1 HDMI 2.1
▲顯示卡整體只在頂部的GeForce RTX Logo處設定了白色燈效
產品資料
核心架構:Ada Lovelace
核心代號:AD103-400
製程工藝:TSMC 4N定製
SM單元:80
CUDA核心數:10240
光追核心數(RT Cores):80(第三代)
AI核心數(Tensor Cores):320(第四代)
核心頻率:2295MHz~2550MHz
視訊記憶體容量:16GB GDDR6X
視訊記憶體速率:23Gbps
視訊記憶體位寬:256bit
視訊記憶體頻寬:736GB/s
L2快取:64MB
支援DLSS版本:DLSS 3.5
TGP:320W
建議電源:750W
首發參考價:8099元
不廢話,讓我們進入到大家最關心的效能評測關。在接下來的這部分內容中,按照傳統慣例,我們將從遊戲效能、AI計算效能和內容設計創作效能三個方面去全方位考察RTX 4080 SUPER的效能表現。與此同時,為了更便於大家對RTX 4080 SUPER的效能有直觀的感受和判斷,我們也在測試中加入了RTX 4080、RTX 3090 Ti和AMD目前的頂級旗艦Radeon RX 7900 XTX作為參考測試物件。
測試平臺
GPU:NVIDIA GeForce RTX 4080 SUPER FE、RTX 4080 FE、RTX 3090 Ti FE、AMD Radeon RX 7900 XTX(AIB產品,非公超頻版)
CPU 英特爾酷睿i9-14900K
主機板:英特爾Z790
記憶體:DDR5 6000 24GB×2
硬碟:長江儲存致態 1TB PCIe SSD三體版
顯示器:戴爾UP3218K(7680×4320@60Hz)
驅動程式:NVIDIA Game Ready Driver 551.22
AMD Radeon Software Adrenalin Edition 24.1.1
作業系統:Windows 11 Pro 22H2
AI效能同樣強悍,設計創作手到擒來
首先看RTX 4080 SUPER在AI效能上的表現。
和前兩款RTX 40 SUPER系GPU的測試一樣,我們仍然用Stable Diffusion Automatic1111+TensorRT擴充套件來測試TensorRT擴充套件支援下RTX 4080 SUPER的AIGC效能表現。作為對比的Radeon RX 7900 XTX,則是使用最常用的Stable Diffusion Automatic1111+DirectML在自帶的SD_1.5模型下進行對比測試。
從整體測試結果來看,在預設的SD_1.5模型測試下,RTX 4080 SUPER相比RX 7900 XTX的AIGC效能領先超過了200%,3個關鍵詞下的平均領先幅度達到了227%。同時,在開啟TensorRT之後,RTX 4080 SUPER的效能增幅也達到了120%~150%。對比RTX 4080來看,三種模型+TensorRT的測試下RTX 4080 SUPER皆有2%~7%的小幅領先。同比RTX 3090 Ti,RTX 4080 SUPER的整體效能領先也在25%以上。
從測試結果仍然能到Tensor RT這類SDK擴充套件給RTX 4080 SUPER帶來了強大的AI效能提升。同時在類似基於SD_XL這種大模型的AIGC運算上,GPU的視訊記憶體容量和規格也直接決定了運算效率的高低,越高配置的視訊記憶體,在這種大模型的AIGC運算上優勢也越明顯。而對比RX 7900 XTX也能看到,Ada Lovelace架構的第四代Tensor和CUDA核心的效率及效能也是碾壓競爭對手的存在。
正如我們在之前說過的一樣,從RTX 20系開始,NVIDIA就已經開始在PC的AI效能上著重佈局,包括後續幾代產品的迭代進化也無一不體現出了NVIDIA對RTX GPU PC的AI效能上重視,並逐漸引導著整個產業朝向AIPC領域不斷前進和發展。在基於高效能RTX 4080 SUPER GPU的AIGC應用上,專業的靜態CG圖片工作者創作自己心中理想的圖片相比此前的產品能節省一半甚至更多的時間;遊戲、動漫的角色設計師可以在TensorRT擴充套件支援下更自由、更輕鬆地創作自己理想中的人物形象;藝術創作者更可以更快地審視和修改自己的作品;甚至是淘寶、京東等電商平臺的店主,也能快速為自己的商品建模甚至是生成AI的服裝試穿等照片,潛在的應用場景可謂全面開花。
ON1 Resize AI 2023圖片AI處理測試中,RTX 4080 SUPER整體效能表現與RTX 4080非常接近,僅有1%~2%的微小領先幅度,相比Radeon RX 7900 XTX,RTX 4080 SUPER的效能領先則高達40%以上。對比RTX 3090 Ti,效能領先也接近20%。
▲NVIDIA RTX影片超解析度(RTX VSR)也是一項基於AI和雲端協作對影片播放進行畫質增強的技術。我們透過FireFox瀏覽器(不支援VSR)和EDGE瀏覽器(支援VSR)來播放同一段網路上的遊戲宣傳影片可以看到,在開啟VSR之後(圖右),相比不支援VSR的瀏覽器(圖左)播放效果,影片畫質得到了明顯的增強,擁有更好的清晰度和細節表現。
接下來看RTX 4080 SUPER在設計創作效能上的表現。和之前測試SUPER系產品一樣,我們仍然將透過影片轉碼處理和3D渲染效能兩方面來衡量RTX 4080 SUPER在內容創作上的效能優勢,以及它相對於競爭對手的優劣分析。
在Davinci Resolve 18的影片轉碼效能測試方面,在H.264和H.265的影片轉碼效能上,RTX 4080 SUPER相比RX 7900 XTX有10%~17%的領先,而在AV1編碼輸出效能上,RTX 4080 SUPER的效能領先則高達40%以上。這也說明第八代NVENC在AV1影片的硬體編碼效能上是要明顯強於RDNA 3核心AV1影片硬體編碼效能的。此外在涉及AI處理效能的魔法遮罩效果測試上,RTX 4080 SUPER更是領先RX 7900 XTX高達400%以上,AI 效能方面也是表現出了足夠大的優勢。
與RTX 4080相比,同為雙第八代NVENC編碼器配置,因此二者的整體效能表現幾乎沒有差別。對於RTX 3090 Ti來說,RTX 4080 SUPER的影片轉碼效能領先前者20%以上。
▲NVIDIA GPU設定為通用的CUDA加速模式,RX 7900 XTX設定為HIP加速模式。
3D渲染效能主要透過V-Ray Benchmark 6.0、Blender Opendata Benchmark和Blender 4.0實際模型渲染進行實際考核測試。從全部三項測試成績來看,RTX 4080 SUPER的效能基本與RTX 4080持平,效能差距僅在1%左右。與RX 7900 XTX相比,RTX 4080 SUPER在Blender Opendata Benchmark測試中效能領先前者高達50%以上,在Blender 4.0的實際模型渲染中,我們用RTX 4080 SUPER的CUDA加速模式對比RX 7900 XTX的HIP GPU加速模式渲染同樣的三個模型,最後發現RTX 4080 SUPER效能領先RX 7900 XTX在3%~25%,平均領先程度約為15%左右。如果換成OptiX硬體加速渲染模式,RTX 4080 SUPER在模型渲染效能上領先RX 7900 XTX更是高達50%~180%,平均效能領先已經達到了100%以上。
同比RTX 3090 Ti,在3D渲染效能上RTX 4080 SUPER已經表現出遙遙領先的勢頭,平均領先程度達到了35%左右。
▲對RTX GPU來說,OptiX渲染加速模式相比CUDA渲染加速模式有更高的效率,RTX GPU的使用者我們建議在用Blender進行模型渲染時開啟OptiX模式。
支援DLSS 3.5的D5渲染器測試成績也基本與前面的測試結果相符,RTX 4080 SUPER與RTX 4080在效能表現上仍然是相差無幾,而相比RTX 3090 Ti在不開啟DLSS 3.5時效能領先近30%,開啟DLSS 3.5之後,效能領先RTX 3090 Ti接近150%。
除了D5渲染器之外,DLSS 3.5也在不少其他設計創作軟體中得到了應用。DLSS 3.5中的幀生成能夠大幅度提升設計軟體的實時渲染幀率,而光線重建技術則可以對實時渲染畫面顯著地降噪和增強畫質。
▲在UE5引擎的CG渲染中,可以看到開啟光線重建之後(右圖),相比關閉光線重建中,實時渲染畫面的效果更優秀,更清晰,同時原本的渲染噪點也得到了幾乎完全的消除。
▲在Omniverse應用中,開關光線重建的渲染效果同樣異常明顯,可以看到在開啟光線重建之後(右圖),相比關閉的情況(左圖),3D渲染的靜態CG陰影表現更加清晰和真實,畫面更通透,幾乎看不到任何的噪點存在。
▲在3D渲染器CHAOS VANTAGE中,透過實時渲染一段CG可以看到,開啟光線重建之後(右圖),渲染細節更加豐富,物體呈現也更加真實,尤其是玻璃、大理石等紋理也得到了真實的展現。
遊戲效能,4K爽玩無憂,DLSS 3仍是王者
下面看看RTX 4080 SUPER在其“本職工作”——遊戲效能方面的表現。
在3DMark理論效能測試部分,RTX 4080 SUPER的整體效能與RTX 4080相差不太大,僅領先後者約3%。與RX 7900 XTX相比,RTX 4080 SUPER在光柵遊戲效能上略略遜色3%左右,但在光追效能上卻領先對手18%左右,整體效能表現還是強於RX 7900 XT。與RTX 3090 Ti比較,RTX 4080 SUPER則在整體效能上領先達28%。
▲Radeon RX 7900 XTX在遊戲中開啟FSR平衡模式(同時支援DLSS和FSR的遊戲中)
由於硬體規格的差距極小,因此我們看到在常規遊戲的測試中,RTX 4080 SUPER與RTX 4080的效能差距並不太明顯,整體在0.2%~6%之間,綜合全部遊戲測試結果來看,RTX 4080 SUPER僅有3%左右的效能優勢。當然,在相差極小的硬體規格限制下,這個效能差距也是符合我們測試之前的預估的,畢竟這款產品的定位就是微小升級、價格更低。
相比RTX 3090 Ti,RTX 4080 SUPER的整體遊戲效能明顯甩開了前者,在不開啟DLSS 3的情況下,整體效能也領先了近30%。就競爭對手RX 7900 XTX而言,在部分遊戲中,RX 7900 XTX相對RTX 4080 SUPER有小幅度領先,如《不朽者傳奇》《孤島驚魂6》《星空》等,但在絕大多數遊戲中,RTX 4080 SUPER都有明顯的領先優勢,綜合光追和光柵遊戲整體效能來看,領先競爭對手近20%。
從4K解析度的遊戲效能來看,在不開啟DLSS的情況下,RTX 4080 SUPER已經能在絕大部分光追遊戲下保持60fps+的流暢執行效果,在開啟DLSS之後,除要求特別高的極致光追效果遊戲《傳送門:序曲》RTX版之外的絕大部分遊戲中都達到了90fps+非常流暢的執行效果。
當然我們不能忘記RTX 40系GPU的黑科技DLSS 3,在開啟DLSS 3之後,RTX 4080 SUPER又有怎樣的華麗轉身呢?
從9款DLSS 3遊戲的測試結果來看,在1440p解析度下開啟DLSS 3之後,遊戲幀率相對原生幀率提升了85%~340%,在4K解析度下游戲幀率的提升更是達到了100%~410%,平均效能提升達到了180%左右。DLSS 3的巨大增幅作用再次得以驗證。
同時,從測試結果圖表中也可以明顯看出,得益於和NVIDIA Reflex技術的融合,開啟DLSS 3之後遊戲的整體系統延遲也得到了極大的降低,1%L fps也有極大升高,這些都明顯地增強了遊戲體驗的順滑無卡頓的愉悅程度。尤其對於《傳送門:序曲》RTX版這種光追效能要求極高的遊戲而言,開啟DLSS 3之後遊戲系統延遲能夠從200+毫秒瞬間降低到58毫秒,無疑能夠極大提升遊戲體驗舒適度和絲滑享受的程度。
▲加入光線重建技術之後,DLSS 3也進行了半代升級來到了DLSS 3.5。對光追遊戲,尤其是具備路徑追蹤效果的光追遊戲來說,開啟DLSS 3.5的光線重建功能能極大提升遊戲畫質表現,細節表現更豐富、更清晰。圖為《賽博朋克2077:往日之影》,幀生成開時,光線重建關閉(左)與光線重建開啟(右)畫質對比。
在《賽博朋克2077:往日之影》遊戲中,我們開啟了最高光追特效+路徑追蹤,在遊戲中透過開啟/關閉光線重建功能可以明顯地看到,在開啟光線重建之後,遊戲畫面程式更加清晰通透,尤其是在反射效果上更加清晰,原有的噪點也得到了極好的抑制,畫質表現可以說是確實提升了一個檔次。
來看下DLSS 3的降維打擊效果。前面的遊戲測試成績中,RTX 4080 SUPER相對RTX 3090 Ti效能領先約為30%左右,而開啟DLSS 3之後,RTX 4080 SUPER在遊戲效能上相對只能開啟DLSS 2的RTX 3090 Ti平均領先程度已經達到了80%以上。
散熱與功耗
作為一款立足4K解析度,通吃1440p遊戲的遊戲顯示卡而言,我們主要測試了它在4K和1440p兩種解析度下的遊戲功耗表現。透過《賽博朋克2077》《暗黑破壞神Ⅳ》《星空》《生死輪迴》和《光明記憶:無限》這5款遊戲,分別在4K和1440p解析度測試RTX 4080 SUPER FE顯示卡的功耗表現,最後取其平均值作為RTX 4080 SUPER FE的平均遊戲功耗。
在測試中,RTX 4080 SUPER FE在1440p解析度下的平均遊戲功耗約為260W左右,而在4K解析度下的遊戲功耗約為290W左右,平均遊戲功耗275W,遠低於320W的TGP設計。
在烤機狀態下,滿負荷執行的RTX 4080 SUPER的功耗約為311W,略低於TGP設計。此時核心溫度僅在58℃左右,甚至遠低於RTX 4080的63℃。正如我們在最開始所說的那樣,RTX 4090散熱模組的套用讓RTX 4080 SUPER FE有著非常優秀的散熱效能表現,整體能耗比相比RTX 4080更為優秀。
雖是微升級,卻是高階顯示卡市場的“無敵”之選
從實際效能上來看,RTX 4080 SUPER在4K解析度下即使不開啟DLSS也能流暢執行大部分全特效光追遊戲,開啟DLSS 3之後在絕大部分光追遊戲中都能保持近100FPS的遊戲執行效果,4K遊戲是暢玩無憂的。同時,無論是遊戲效能還是AI效能或是設計創作效能,都已經遠勝前代旗艦RTX 3090 Ti,基本達到了30%以上,在DLSS 3的加持下游戲效能甚至超過RTX 3090 Ti達80%以上,效能表現無疑是非常合格的。與AMD目前的旗艦級遊戲顯示卡RX 7900 XTX相比,僅在少部分遊戲中(主要是光柵遊戲)RTX 4080 SUPER略有小幅度落後,大部分遊戲中還是平均領先20%左右,在AIGC和設計創作效能更是遠勝RX 7900 XTX。
作為RTX 4080的升級版產品,也許很多玩家會對RTX 4080 SUPER相對RTX 4080的效能提升幅度有爭議,平均僅3%左右的遊戲效能提升或許和不少玩家的心理預期值不符。但我們必須看明白的是,首先RTX 4080 SUPER從硬體規格上的限制就決定了它並不是一款如同RTX 4070 SUPER那樣效能大升級的產品,而是微升級的高性價比產品。NVIDIA對RTX 4080 SUPER給出的首發參考價為8099元,甚至比RTX 4080的首發價格還低了1400元,結合效能和價格兩方面來看,這簡直就是往高階頂級顯示卡市場扔下了“王炸”,對手紛紛表示“要不起”。
所以NVIDIA的意圖應該是非常明顯了,那就是用稍強一些的效能和更低的價格,讓新的RTX 4080 SUPER成為目前高階遊戲顯示卡市場上非常有競爭力的產品,從而撐起RTX 40系GPU在高階顯示卡市場的半壁江山。甚至我們還在想,或許RTX 4080 SUPER才是RTX 40 SUPER系首發這三款產品的最大殺手鐧——效能更好一點,價格卻低很多,價效比直接碾壓當前市場上所有頂級顯示卡。所以一旦RTX 4080 SUPER上市,在目前的顯示卡市場上絕對會成為最具價效比的頂級顯示卡選擇。能4K遊戲、能AI創作、能內容創作,而且價格環比一眾同等級產品還特別有優勢,對那些追求頂級效能的發燒友或設計創作者來說,如果要找尋一款合適的具備高階效能的顯示卡,我們實在想不到有什麼理由不推薦它,直接認準RTX 4080 SUPER準沒錯!買買買,就完事兒!
友情提示
MCer請注意,由於微信公眾號調整了推薦機制,如果你發現最近很難刷到Microcomputer(微型計算機)公眾賬號推送的文章,但是又不想錯過微機的精彩評測內容,可以動動小手指把Microcomputer設定成星標公眾賬號哦!