RTX40 SUPER系列新品共有三款,分別為RTX 4070 SUPER、RTX 4070 Ti SUPER以及RTX 4080 SUPER,RTX 4080 SUPER是唯一一款加量減價的型號。規格相比RTX 4080更強,但起售價更低。如果從這個角度出發的話,那麼RTX 4080 SUPER可以說是三款中最良心的型號。今天給大家帶來的是,來自華碩的TUF GeForce RTX 4080 SUPER O16G GAMING(後簡稱TUF RTX 4080 SUPER OC)顯示卡的評測。
TUF RTX 4080 SUPER OC的包裝盒與自家RTX 4080保持一致,四個角均“切”了一刀,八邊形的設計在一眾新卡中還是很有特點的。
來到顯示卡本體,TUF RTX 4080 SUPER OC採用的是啞黑配色,表面有磨砂處理。整體並不是特別高調,很有質感。導流罩與上一代保持一致,線條凌厲,稜角分明。
TUF RTX 4080 SUPER OC為三風扇設計,均為軸流風扇。左右扇葉朝向和轉向與中間不同。左右風扇為逆時針旋轉,中間風扇則為順時針旋轉。如此設計的原因是,可以減少亂流,提升散熱器風量。左右風扇中央為TUF的Logo,中央風扇為華碩的Logo。三把風扇均為7扇葉,支援智慧停轉。
TUF RTX 4080 SUPER OC的背面採用一塊鋁製背板,最外側對應風扇位置為鏤空設計,提升散熱能力。對應核心、靠近頂部位置還有效能模式和安靜模式切換撥杆。這張顯示卡需佔用3.65槽,從頂部可以看到非常厚的散熱鰭片,內部則有8根熱管貫穿其中,散熱規格妥妥高階水平。中央位置有12VHPWR供電介面,一側有可發光TUF的Logo,旁邊還有一條可發光的燈帶,兩者均支援ARGB。
總體來看,TUF RTX 4080 SUPER OC的外觀設計頗有一種西裝暴徒的感覺,屬於人狠話不多的角色。
二、NVIDIA GeForce RTX 4080 SUPER架構淺析
此次新發布的三款GeForce RTX 40 SUPER顯示卡依舊採用NVIDIA Ada Lovelace架構,TSMC4N英偉達定製工藝。與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的效能提升,最高可達到90-TFLOPS的著色器資料吞吐量。
RTX 4080 SUPER的核心代號為AD103-400-A1,共有10240個CUDA核心,提供了52-TFLOPS算力;80個第三代Ada RT Core擁有121RT-TFLOPS;320個第四代Tensor Core可提供836Tensor-TFLOPS(AITOPS)。
RTX 4080 SUPER的L2 Cache容量為64MB,頻寬為736GB/s。NVIDIA官方也強調了L2 Cache的重要性,我們以兩張圖來簡單說明L2快取的作用。
GPU獲取資料的路徑,依次是L1快取、L2快取、視訊記憶體和系統記憶體。L1快取緊鄰處理核心,延遲非常低。GPU尋找資料的首選就是L1快取。如果目標資料不在L1快取,GPU會在L2快取中尋找。相比較L1快取,L2快取的延遲雖然無法做到L1快取那麼低,但容量可以做大。如果資料也不在L2快取中,那麼GPU會從視訊記憶體中尋找。再找不到就會從系統記憶體中獲取。
其實可以看到,GPU越早獲取到資料,效能和效率就會越高。由於核心和L1快取兩者位置太近,所以L1快取的容量不可能很大。所以,更大的L2快取,將有效提高資料命中率,從而提高整體執行效率。RTX 4080 SUPER擁有更大的L2快取容量,所以命中資料的機率更高。
更多詳細的引數,我們為大家總結出了一張表格,可以看到,RTX 4080 SUPER的規格相比RTX 4080,CUDA增加了512個,RT Core、Tensor Core和紋理單元也有所增加,提升幅度約5.2%,另外頻率和視訊記憶體頻寬稍有提升。不過建議零售價卻直接便宜了1400元,非常良心,可謂加量大減價。
下面我們看一下具體的測試成績。
三、測試平臺簡介
首先看一下測試平臺。
為了保證TUF RTX 4080 SUPER OC的效能表現,處理器選擇的是英特爾14代酷睿i7-14700K,並在主機板BIOS中關閉能效核。主機板是來自華碩的ROG MAXIMUS Z790 DAKR HERO;記憶體為兩條16GB DDR5 7200記憶體,組成32GB容量;電源為華碩ROG雷神2代1600W鈦金。執行系統為Windows 11 23H2。
透過GPU-Z(2.57.0)可以看到TUF RTX 4080 SUPER OC的規格。其擁有10240個CUDA核心,基礎頻率為2295MHz,Boost頻率為2610MHz。光柵和紋理單元分別為112個和320個。採用16GB GDDR6X視訊記憶體,視訊記憶體位寬256bit,頻寬736.3GB/s。驅動版本為551.22。
本次測試TUF RTX 4080 SUPER OC,主要對比RTX 4080和RTX 3080 Ti兩款顯示卡。由於部分測試項較新,可能會缺失對比顯示卡資料。
下面先進行的是用來衡量顯示卡DX11理論效能的3DMARK FS套裝:FS、FSE和FSU三者分別對應顯示卡在1080P、2K和4K的理論效能,取顯示卡分數實際測試結果如下:
在FS測試中,TUF RTX 4080 SUPER OC相比RTX 4080,其中FS提升3%;FSE提升3.7%;FUS提升3.2%,綜合提升3.3%,提升幅度略小於核心規模差距。對比RTX 3080 Ti,綜合成績提升48%左右。
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,TUF RTX 4080 SUPER OC相較RTX 4080的提升分別為:TS提升1.7%;TSE提升2%,綜合約為1.85%,提升幅度同樣略低於核心規模差距。對比RTX 3080 Ti,綜合成績提升49%左右。
Port Royal是3DMARK中專門針對光追效能的測試項,TUF RTX 4080 SUPER OC相較RTX 4080的提升約為2.7%。對比RTX 3080 Ti,提升45%左右。
下面我們再來看看3DMARK中新增的一些具體應用場景的測試。
Speed Way這項測試結合了實時光線追蹤和傳統渲染技術來測量顯示卡效能。場景含有光線追蹤反射、實時全域性光照、網格著色器、體積照明、粒子和後處理效果。所以SW的測試基本可以看做次世代3A遊戲基準。
TUF RTX 4080 SUPER OC對比RTX 4080,從2K和4K解析度提升依次為:3.4%和4.4%,與實際的核心規模差距比較接近。
另外我們使用3DMARK剛剛更新的DLSS3進行了相關效能測試。TUF RTX 4080 SUPER OC相比RTX 4080的提升為:開啟下提升2%,關閉下提升4.6%。
從整體的理論測試成績來看,TUF RTX 4080 SUPER OC相比RTX4080的綜合提升幅度並不大,DX11下提升超過3%,DX12下接近2%。而最新的SW綜合測試的提升幅度在4%左右。看得出來,RTX 4080 SUPER在規模上與RTX 4080相差不大,再加上兩者在架構方面保持一致,最終導致兩者的理論效能差距是比較小的。
五、常規遊戲效能測試
由於本次RTX40系加入了DLSS3新技術,所以後面會進行單獨測試,這裡依然選擇主流的幾款3A大作進行遊戲效能對比。
在《極限競速:地平線5》中,其中TUF RTX 4080 SUPER OC相比RTX 4080,在2K解析度提升3.8%;4K解析度提升2.5%,綜合提升3.1%。相比RTX 3080 Ti提升幅度較大,綜合提升超過66%。
在《無主之地3》中,TUF RTX 4080 SUPER OC相比RTX 4080的提升分別為:2K提升6%;4K解析度提升4.5%,綜合提升超過5%。相比RTX 3080 Ti綜合提升38%。
《光明記憶:無限》光追測試軟體是獨立於遊戲的測試工具,實測TUF RTX 4080 SUPER OC相比RTX 4080的提升分別為:2K提升5.5%;4K提升1.8%,綜合提升3.6%。相比RTX 3080 Ti綜合提升46%。
另外一款國產遊戲《邊境》的跑分軟體中,TUF RTX 4080 SUPER OC相比RTX 4080的提升分別為:2K提升4.9%;4K提升5%,綜合提升5%。相比RTX 3080 Ti綜合提升56%。
在《賽博朋克2077》中,TUF RTX 4080 SUPER OC在超級畫質下,4K解析度下的幀率超過80幀,流暢執行完全沒有問題;即使在光追超級畫質下,4K解析度下的幀率甚至也能超過70幀,遊戲體驗完全沒有問題。2K解析度更不用說了,輕鬆超過百幀,實力非常強悍。
另外我們還測試了DLSS3的效能表現。
在《極限競速:地平線5》這款遊戲中,TUF RTX 4080 SUPER OC在2K和4K解析度中,開啟DLSS3相比DLSS2的提升分別為33%和12%,效果非常明顯。
如今越來越多的遊戲開始支援RTX和DLSS技術,其中已經超過500款遊戲和應用支援RTX技術,支援DLSS3的遊戲數量也在快速攀升,目前已經有72款遊戲和應用支援DLSS3,未來包括《龍之信條2》、《灰區戰爭》、《半條命2》RTX版、《地平線:西之絕境》和《層層恐懼》等遊戲,也將支援DLSS3技術,為配備GeForce RTX 40 系列顯示卡的遊戲玩家帶來前所未有的效能和更高的影象質量。
六、生產力工具測試
在生產力工具上,我們測試了V-Ray渲染器,選擇使用GPU渲染的CUDA測試和RTX測試,成績分別為4992vpaths、7278vpaths。
Blender是一款專業的三維渲染軟體,我們使用的是官方的Benchmark跑分軟體。軟體會自動渲染測試monster/junkshop/classroom共三個場景。TUF RTX 4080 SUPER OC顯示卡得分分別為4623/2163/2267分。
目前AI的應用範圍越來越廣泛,相關算力也得到了大家的重視。目前NVIDIA推出了全新的TensorRT外掛,可以充分呼叫Tensor算力。此次我們使用Stable Diffusion對TUF RTX 4080 SUPER OC在AIGC方面的效能進行測試。所有測試預設開啟xformers最佳化方案。
首先是較為基礎的SD1.5模型測試,在SD1.5中模型的輸出解析度為512x512和768x768。我們將匯出【TRT】引擎,並記錄使用預設模型渲染,以及【TRT】模型渲染的批次時間。
根據NVIDIA提供的統一引數進行輸出,以便記錄結果。其中取樣方式為:Eulera;取樣步驟:50;Batch Count:10。
【預設SD1.5模型】TUF RTX 4080 SUPER OC 運算時間22.2s,約合2.22秒一張圖。【TRTSD1.5模型】TUF RTX 4080 SUPER OC 運算時間14.9s,約合1.49秒一張圖。
第二次測試為的SDXL模型測試,SDXL模型將在1024x1024解析度進行訓練,相比SD1.5來說影象大了2倍,它可以提供更準確的關鍵字匹配,從而獲得更真實的結果。但由於更高的原生解析度和模型複雜性,SDXL模型的計算強度明顯更高。
我們按照相同的引數進行設定,但尺寸規定為1024x1024,下面看看TUF RTX 4080 SUPER OC的表現如何。
【預設SDXL模型】TUF RTX 4080 SUPER OC 運算時間1m44.4s,約合10.44秒一張圖。【TRT SDXL模型】TUF RTX 4080 SUPER OC 運算時間1m4.4s,約合6.44秒一張圖。
在更復雜的模型中,Tensor RT引擎的優勢愈發明顯,並且大視訊記憶體的特點得到充分體現,實測最高佔用達到了12GB視訊記憶體,TUF RTX 4080 SUPER OC的16GB視訊記憶體還有一定餘量。
本次測試新增了ON1 Resize AI 2023的測試,這是一款AI影象修復軟體,包括圖片縮放,內容填充等功能,同時它也可以作為PS等軟體的外掛形式存在,非常方便快捷。
測試選擇NVIDIA提供的5張高解析度圖片進行,我們將在原圖片的尺寸上直接放大200%,可以看到放大後的圖片尺寸已經達到了12000x8000。
使用TUF RTX 4080 SUPER OC進行AI計算後,5張圖片最終用時34641ms,即35秒左右。
放大後使用NVIDIA ICAT進行對比,左側為使用ON1 Resize AI 2023進行放大200%的圖片,可以看到在樹葉的紋理更加清晰。而右側則已經有一些模糊了。
AI對於日常生活的應用的確更加方便,在我們以往的認知中,圖片尺寸放大必然會損失質量。但經由AI的加持,反而更清晰,這對於老照片的修復,起到了更加便捷的作用。
八、RTX影片超解析度測試
另外我們還測試了RTX影片超解析度(RTX Video Super Resolution)這項功能,目前這項功能在B站和YouTube已經可以生效。當然,首先顯示卡必須是RTX40或30系列GPU,並且驅動更新至最新版;其次,使用最新版的Google Chrome和Microsoft Edge瀏覽器。兩者都滿足之後,就可以體驗RTX影片超解析度帶來的優勢。
在NVIDIA控制面板中的【調整影片影象設定】,可以看到最新的RTX影片增強,點選質量下方的選框就可以選擇不同級別。在影片全屏播放的時候,透過任務管理器看到GPU的負載提高,說明開啟成功。
在YouTube隨意觀看影片,開啟RTX VSR後,可以清晰明顯的看到水下珊瑚的質量明顯提高,邊緣更為清晰,並且極大減少了失真現象。
不過需要說明一點的是,RTX影片超解析度對於低解析度影片的效果是比較明顯的,比如480P或720P,能夠明顯感知到RTX影片超解析度帶來的提升。但如果影片解析度在1080P以上,那麼實際RTX影片超解析度帶來的提升,並不會特別明顯。
所以RTX影片超解析度功能比較適合應對網路較差,或者影片源本身並不清晰的情況。
九、溫度及功耗測試
功耗測試中,我們選擇FurMark軟體進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯示卡自身。
可以看到TUF RTX 4080 SUPER OC這張顯示卡的溫度穩定在62℃左右,熱點溫度在74℃左右;顯示卡總功耗在313.6W。
考慮到實際遊戲負載不同,功耗是實時變化的,所以透過《光明記憶:無限》自帶的Benchmark,在光追最高、DLSS質量、2K解析度下,記錄執行過程中顯示卡的實際功耗表現。
從記錄的功耗曲線可以看到,TUF RTX 4080 SUPER OC在《光明記憶:無限》遊戲的Benchmark中,功耗基本可以穩定在300W左右,平均功耗為293W。對於高階定位的顯示卡來說,特別是對比上一代RTX30系顯示卡,功耗並不算高。
十、總結
透過測試,其實大家也能夠看到,RTX 4080 SUPER的效能,相較於RTX4080,提升幅度其實並不大,綜合理論和遊戲實測,效能的提升幅度大約在4%左右。但這並不影響它會成為未來一年高階顯示卡中,消費者首選的那款。原因主要有兩個。
第一,RTX 4080 SUPER的效能,應對4K遊戲是完全沒有問題的,其效能表現可以說相當強悍,是目前能夠流暢執行4K遊戲的效能猛獸。同時在AI效能方面,表現強勁,16GB視訊記憶體也能夠應對絕大多數AIGC需求;
第二,RTX 4080 SUPER的定價,可以說是很多人沒有想到的,起售價居然比RTX 4080便宜了1400元。即使兩者在效能方面差距並不大,但便宜的1400元足以讓這款產品成為更多玩家的高階首選。
回到TUF RTX 4080 SUPER OC身上。這款顯示卡有著西裝暴徒的外觀設計,在效能表現方面可以完美應對4K遊戲,同時強悍的散熱設計讓其在壓力測試下,核心和熱點溫度也沒有超過75℃,整體表現可以說非常亮眼,是首批上市的RTX 4080 SUPER中不可忽視的一款產品。