一、前言:最後一塊GeForce RTX 40 SUPER系列顯示卡
兩倍於RTX 3090 Ti的能效比,效能還強了20%,載溫度僅有60度,還支援完整的DLSS 3.5……
也許你曾經對RTX 4080心動不已,但是面對它9499元起步的售價只能望而卻步。
現在你可以圓夢了!
2024年1月9日,NVIDIA釋出了GeForce RTX 40 SUPER系列顯示卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型號。
此前RTX 4070 SUPER、RTX 4070 Ti SUPER已先後上市,現在終於輪到了RTX 4080 SUPER,這也是GeForce RTX 40 SUPER系列版圖中的最後一塊。
RTX 4080 SUPER採用了完全的、沒有任何精簡的AD103-400核心,共有7組GPC、14組TPC、80組SM單元,一組SM包含128個CUDA核心,共計10240個流處理器。
另外,它還有320個第四代Tensor張量核心、80個第三代RT光追核心、320個紋理單元、112個ROP單元以及64MB二級快取。
視訊記憶體依舊是256Bit位寬,但是頻率從22.4GHz略微提升到了23GHz,對應的視訊記憶體頻寬從716GB/s提升到了736GB/s,提升幅度為2.6%。
RTX 4080 SUPER的詳細規格引數如下:
如果對比RTX 3080 Ti,你會發現二者的核心規格非常相似,它們的流處理器、ROP、紋理單元、RT Core、Tensor Core的數量都是完全相同的。
不過由於升級到了Ada Lovelace架構,以及第四代Tensor張量核心以及第三代RT光追核心,RTX 4080 SUPER的DLSS和光追效率會更加優秀一些,能效也更高。
在價格方面,RTX 4080首發售價9499元起,而現在RTX 4080 SUPER只要8099元起,整整便宜了1400元。
二、圖賞:與RTX 4080差不多 核心供電略有縮水
包裝盒和RTX 4080公版差不多,區別在於原來是白字,現在改成了黑色字型。
開箱。
RTX 4080 SUPER整體是深灰黑色,比RTX 4080要黑一些。
正面。
背面。
3.5插槽厚度,16Pin供電介面在頂部中間。
3個DP1.4和1個HDMI 2.1介面。
和RTX 4090幾乎相同的散熱器,大面積的均熱板,6條8mm複合熱管,鎮壓RTX 4080 SUPER這樣的顯示卡,給人牛刀殺雞的感覺。
非常迷你的PCB板,10+3相供電電路設計,另外還有大量的空焊位。
左邊是RTX 4080,右邊是RTX 4080 SUPER,想不到供電還縮水了,從13+3相縮到了10+3相。
當然這也從另一個方面說明,RTX 4080 SUPER對供電的需求沒那麼高,Ada Lovelace架構的能效確實技高一籌。
RTX 4080 SUPER採用的是滿血的AD103-400-A1核心,芯片面積378mm2,擁有459億電晶體。
GPU旁邊是8顆美光GDDR6X視訊記憶體,單顆2GB,總容量16GB,等效頻率23GHz,頻寬736GB/s。
三、理論效能測試:最高執行頻率2790MHz、風扇轉速最高不到1400RPM
測試平臺配置如下:
1、3DMark Fire Strike
在2K解析度3DMark Fire Strike Extreme測試中,RTX 4080 SUPER圖形分數達到了33387分,核心溫度最高60℃,熱點溫度最高70℃,核心執行最高頻率為2775MHz,最高風扇轉速1221PM,整卡最高功耗276W。
在4K解析度3DMark Fire Strike Ultra測試中,RTX 4080 SUPER圖形分數達到了17379分,核心溫度最高56℃,核心執行最高頻率為2790MHz,最高風扇轉速1397RPM,最高功耗318W。
2、3DMark Time Spy
在2K解析度3DMark Time Spy測試中,RTX 4080 SUPER圖形分數達到了28573分,核心溫度最高57℃,核心執行最高頻率為2790Hz,最高風扇轉速1272RPM,最高功耗319W。
在4K解析度3DMark Time Spy Extreme測試中,RTX 4080 SUPER圖形分數達到了14321分,核心溫度最高58℃,核心執行最高頻率為2790Hz,最高風扇轉速1390RPM,最高功耗317W。
RTX 4080 SUPER的理論效能對比RTX 3090 Ti高了大約25-30%,如果對比RTX 4080則只只高了1-3%。
四、1080P遊戲效能測試:略強於RTX 4080
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰爭機器5
測試資料彙總如下:
1080p解析度對於RTX 4080 SUPER這樣的顯示卡已經有點屈才了,我們還是測試了一下供參考,對比RTX 3090 Ti高了足足19%,但是和RTX 4080差別非常小,平均僅1%,《戰爭機器5》表現最好也不過4%。
五、2K解析度遊戲效能測試:比RTX 3090 Ti強22%
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰爭機器5
測試資料彙總如下
2K解析度下,除了《星空》之外,RTX 4080 SUPER都跑出了超過140FPS的幀率。
和RTX 4080相比,稍微領先2%,但是和RTX 3090 Ti比起來,領先幅度達到了22%。
六、4K解析度遊戲效能測試:所有3A大作都能流暢執行
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰爭機器5
測試資料彙總如下:
在4K解析度最高畫質下,即便在沒有開DLSS的情況下,RTX 4080 SUPER也能在所有遊戲中跑出超過60FPS的幀率。
與RTX 4080相比,依然只有2%的優勢,比起RTX 3090 Ti則能領先18%,比RTX 3080 Ti則強了31%。
七、StableDiffusion體驗:SDXL可將生圖速度提升270%
2023年9月,NVIDIA推出了用於Stable Diffusion Web UI 的TensorRT 加速外掛,能讓具備Tensor單元的GeForce顯示卡在Stable Diffusion Web UI 中獲得翻倍的效能。
本次我們將對比SDXL加速方法與PyTorch xFormers(常規加速方法)的效能差異。
我們生成20張太空大戰影象,解析度1024*1024,使用PyTorch xFormers加速時,耗時8分鐘。
使用SDXL加速之後,耗時僅為2分59秒。
結合終端資料,可以看到RTX 4080 SUPER使用預設加速器時,生圖速度只有2.45t/s,而在TensorRT加持下,生圖速度直接到了9.15it/s,提升幅度為270%。
八、DLSS3遊戲測試之一:4款DLSS3遊戲
此次我們一共測試了8款遊戲,包括4款支援DLSS3的遊戲:《3DMark》、《毀滅全人類》、《星空》、《微軟模擬飛行》。
另外還有4款同時支援DLSS與光追的遊戲:《光明記憶》、《生死輪迴》、《賽博朋克2077》、《霍格沃茨之遺》。
所有DLSS3以及光追測試都是在4K解析度下進行。
1、3DMark
DLSS 2模式下幀率為104FPS,比預設的41FPS提升了154%。
DLSS 3的成績為172FPS,相比預設提升了142%。
2、星空
最高畫質下,RTX 4080 SUPER幀率65FPS。
開啟DLSS 3之後,幀率為137FPS,提升幅度為111%。
3、微軟模擬飛行
4K解析度最高畫質下,RTX 4080 SUPER的幀率為78FPS。
開啟DLSS 3之後,幀率達到了187,提升140%。
4、毀滅全人類2:重新探測
最高畫質下,RTX 4080 SUPER的幀率為93FPS。
開啟DLSS 3之後,幀率來到了180FPS,近乎翻倍。
九、DLSS3遊戲測試之二:4款支援DLSS3的光追遊戲
1、光明記憶:無限
開啟光追時,遊戲的幀率為76FPS。
開啟DLSS 3之後,幀率提升到了168FPS,提升了121%。
2、生死輪迴
開啟光追之後,遊戲的幀率僅有46FPS。
開啟DLSS 3之後,幀率提升到了142FPS,提升幅度為209%。
3、賽博朋克2077
開啟光追時,幀率為28FPS。
這是DLSS 3的畫面,與原生畫面的差距難以分辨,但是幀率提升到了114FPS,提升超過300%。
4、霍格沃茨之遺
開啟光追時,幀率為43FPS。
開啟DLSS 3之後,幀率來到了138FPS,提升幅度高達221%。
測試資料彙總如下:
RTX 4080 SUPER上開啟光追後,平均效能損失幅度為54%,相比於RTX 3090 Ti減輕了一些。
再開啟DLSS 2之後,平均效能提升121%,最高達到了186%。
DLSS 3效果更好,平均提升幅度高達179%,最高更是超過了300%,還是來自《賽博朋克2077》。
十、實際功耗測試:4K遊戲平均功耗274W 能效比2倍與RTX 3090 Ti
1、烤機測試
室溫19度,使用Furmark烤機5分鐘,GPU功耗穩定在320W,核心頻率2220MHz,溫度65度,風扇轉速1550RPM。
2)、真實遊戲功耗測試
1、GTAV
1080P解析度下,RTX 4080 SUPER的功耗為竟然只有70W,溫度更是隻有37度。
RTX 3090 Ti則高達218W,溫度也有60度。
2K解析度下,RTX 4080 SUPER功耗是134W,執行頻率2760MHz,溫度43度。
RTX 3090 Ti的功耗為277W,執行頻率2040MHz,溫度50度。
到了4K解析度,RTX 4080 SUPER的功耗是231W,而RTX 3090 Ti功耗為378W。
2、絕地求生
1080P解析度下,RTX 4080 SUPER的功耗為231W,而RTX 3090 Ti則高達394W。
2K解析度下,RTX 4080 SUPER功耗是230W,執行頻率2730MHz,溫度61度。
RTX 3090 Ti的功耗為404W,執行頻率2010MHz,溫度86度。
到了4K解析度,RTX 4080 SUPER的功耗是257W,而RTX 3090 Ti功耗為433W。
3、古墓麗影:暗影
1080P解析度下,RTX 4080 SUPER的功耗為233W,而RTX 3090 Ti則高達374W。
2K解析度下,RTX 4080 SUPER功耗是252W,執行頻率2745MHz,溫度60度。
RTX 3090 Ti的功耗為400W,執行頻率20250MHz,溫度65度。
到了4K解析度,RTX 4080 SUPER的功耗是273W,而RTX 3090 Ti功耗為432W。
測試資料彙總如下:
RTX 4080 SUPER在1080P、2K與4K解析度下的遊戲功耗分別為205W、240W、274W,大約是RTX 3090 Ti的60%。
考慮到RTX 4080 SUPER的效能要強了20%左右,換算下來它的能效比超過了RTX 3090 Ti的2倍。
十一、總結:能效與散熱表現優秀 8099元會是你的菜嗎!
本次測試小結如下:
1、效能
流處理器從9728個提升到10240,增幅近6%;Boost頻率從2505MHz拉到到2550MHz,也有2%的提升,料想效能應該能比RTX 4080強5%左右,但實際2%的提升幅度比起預期還是低了那麼一些。
考慮到320W的TGP已經非常富餘了,那麼效能提升的瓶頸就只有視訊記憶體。我們稍微做了超頻測試,將視訊記憶體頻率從23GHz超頻到23.7GHz,部分遊戲就有2%左右的幀率提升。
在1080P解析度下,RTX 4080比RTX 3090 Ti強了18%,比RTX 4080強了1%,比起RTX 3080 Ti則是強了26%之多。
2K解析度下,RTX 4080 SUPER相比RTX 3090 Ti領先優勢擴大到了22%,比RTX 4080快了2%,比起RTX 3080 Ti則有32%的優勢。
4K解析度下,RTX 4080 SUPER依舊能夠領先RTX 3090 Ti約18%的樣子,比RTX 4080快了2%,比RTX 3080 Ti快了31%。
2、能效比2倍於RTX 3090 Ti
RTX 4080 SUPER的遊戲功耗大約是RTX 3090 Ti的60%,考慮到它的遊戲效能要強了20%左右,因此可以得知RTX 4080 SUPER的擁有RTX 3090 Ti兩倍的能效比
有一點值得注意,在1080P解析度下,RTX 4080 SUPER在多數遊戲中的功耗都與RTX 4070 Ti SUPER相當甚至更低,比如在《GTA V》中,RTX 4080 SUPER的功耗竟然只有76瓦,而RTX 3090 Ti則高達216W,RTX 4070 Ti SUPER也超過了100W。
在我們所測試的6款遊戲中,在1080P解析度下RTX 4080 SUPER的平均功耗是205W,而RTX 3080 Ti是314W,RTX 3090 Ti則是356W。
2K解析度下,RTX 4080 SUPER在6款遊戲中的平均功耗是240W,RTX 3080 Ti和RTX 3090 Ti則分別是332W、390W。
4K解析度下,RTX 4080 SUPER在6款遊戲中的平均功耗為274W,沒有一款遊戲的功耗超過300W,更別說觸碰320W的功耗牆。而RTX 3080 Ti已經跑到了350W的TGP上限,RTX 3090 Ti則高達428W。
3、DLSS 3和光追
目前可玩的DLSS 3遊戲已有60餘款,此次我們測試了8款。
在開啟DLSS 2之後,遊戲幀率提升幅度為121%。開啟DLSS 3,遊戲幀率提升幅度達到了179%。
在開啟光追和DLSS 3時,RTX 4080 SUPER的平均幀率高出RTX 3090 Ti 50%以上,像《賽博朋克2077》這樣的顯示卡殺手,領先優勢則達到了70%。
4、AI效能
毫無疑問,RTX 40系顯示卡是Stable Diffusion畫圖首選,特別是在使用TensorRT加速時,RTX 4080 SUPER的生圖效能直接從2.45it/s猛增到了9.15it/s,提升幅度超過270%。
5、散熱
就公版而言,拿RTX 4090的散熱套在RTX 4080 SUPER上真的有點大材小用,實測烤機半小時,GPU溫度只有65度,並不輸給頂級非公。
在正常遊戲中,RTX 4080 SUPER的實際功耗遠沒有達到320W的TGP功耗牆,執行3A遊戲時基本上都在50度上下,這和RTX 3080動輒80度簡直就不可同日而語。
最後就是價格了,如果你買不起9499元的RTX 4080,那麼現在8099元的RTX 4080 SUPER會是你的菜嗎!