又到週三十點了,相信不少發燒友們早已翹首以盼這一激動人心的時刻。三張RTX 40 SUPER系列的最後一張顯示卡,也是最好的一張:RTX 4080 SUPER終於解禁上線了。它的AI Tensor Core中有著836 AI TOPS、52 SHADER TFLOPS、121 RT TFLOP。
七彩虹也是給我們寄來了iGame水神:一款一體式水冷顯示卡。在顯示卡上裝水冷確實不多見,這次就讓我們一起看一下iGame GeForce RTX 4080 SUPER Neptune OC 16GB的表現到底如何。
外觀:
iGame GeForce RTX 4080 SUPER Neptune OC 16GB在外形上從30系的黑色變為了白色。全身覆蓋銀白合金外甲,淺色的金屬武裝區別於前一代的黑色,更加的顯眼,更能表達來自深海失落文明亞特蘭蒂斯的元素。正面的圓環變成了雙波浪曲線,遵循著水流的運動節奏打造全新的視覺語言。
背面的金屬支架能為GPU和PCB平均壓力。左側藍色的iGame圖示呼應著亞特蘭蒂斯深海的設計。
左側不鏽鋼I/O面板區域,三個DP1.4a介面和一個HDMI2.1a介面。還有一個一鍵超頻按鈕。
右側藝術字體印有水神的英文“Neptune”,頗具一番設計,也像來自亞特蘭蒂斯的古文明一般。
在散熱上一體式水冷的水神,對硬核玩家,超頻愛好者們而言可以實現優秀的溫度控制。360冷排設計,能實現高效散熱。內部的水泵腔體能加速冷卻液迴圈,提升散熱效率。全覆蓋銅底直觸GPU熱源,更利於快遞導熱。水冷冷頭可旋轉設計,裝機更方便。
在iGame Centen中可以調節ARGB燈效,“波動”燈組和水排風扇都支援神光同步,我們也是調節為了象徵亞特蘭蒂斯大海的藍色。
測試環境:
效能:
在引數效能上,iGame GeForce RTX 4080 SUPER Neptune OC 16GB,使用Ada Lovelace架構,核心代號AD103-400,核心工藝TSMC 4N,10240個流處理器,光柵單元112顆,紋理單元320顆,位寬256bit、頻寬736GB/s,基礎頻率2295MHz,加速頻率2550MHz,TGP功耗320W。相比RTX 4080,增加了512個CUDA核心,整體規格漲幅5.2%。
iGame GeForce RTX 4080 SUPER Neptune OC 16GB使用的NVIDIA Ada Lovelace 架構,它涵蓋了如下創新技術:
(1)全新SM多單元流處理器可以提供高達2倍的效能和功耗效率。
(2)第四代張量核心(Tensor Core)能實現和加速變革性 AI技術,我們熟知的 DLSS 技術就得益於它。
(3)第三代光線追蹤核心(RT Core),有著高達 2 倍的光線追蹤效能,提供令人難以置信的細節,帶玩家前往前所未有的虛擬世界。
(4)著色器執行重新排序(SER)將光線追蹤操作提高了2倍。
(5)擁有64MB的 L2 快取,提供更好的效能、減少記憶體匯流排流量和更高的能效。
(6)DLSS 3.5,AI 驅動圖形的革命性突破,可大幅提升效能,並透過神經渲染提升光線追蹤質量,帶來極為逼真的畫面。
(7)全新的第八代NVENC雙硬體編碼器,支援AV1,有效提升了生產力方面的表現,對於創作型使用者、遊戲主播等群體來說更是如虎添翼。
我們使用3DMark進行了幾項常規測試,並與RTX 3080 Ti來進行對比。毫無疑問,4080 SUPER都是碾壓的,平均漲幅超過了50%,達到了51%。僅僅是資料上就有如此大的差距,如果在遊戲中進行實測,開啟DLSS 3、Reflex等黑科技後,恐怕還會更加誇張。
我們使用Furmark進行十五分鐘左右的烤機,顯示卡平均溫度在59度,功率約320W,視訊記憶體頻率2875Mhz。
待機時顯示卡溫度29.6度,因為有冷排的緣故功耗在39W。
NVIDIA的DLSS技術本質是透過深度學習演算法將單幀的低解析度提升成高解析度,讓遊戲幀率獲得大幅度提升。DLSS 3在超解析度、DLAA的基礎上增加了幀生成技術:利用AI技術生成更多的幀,以進一步提高效能。當我們在遊戲中開啟DLSS 3後,遊戲渲染解析度降低,運算壓力也就變小了,AI就會智慧的根據當前的影象以及之前渲染好的影象,自動運算構建出在高解析度下的畫面。
目前已經有超過500款遊戲和應用支援NVIDIA RTX技術,RTX遊戲玩家每週花費8700萬小時玩光追遊戲,其中97%的時間都是在玩《賽博朋克2077》.我們也期待未來有越來越多的遊戲支援這項技術。
接下來是遊戲測試,首先是2k和4k解析度下的DLSS3遊戲測試。2k下幀數在150幀左右,4k也是過了100,可以獲相當流暢的體驗了。
有些遊戲暫不支援幀生成技術,例如《地鐵離去》,所以只能開啟DLSS 2,我們也是對DLSS 2進行了測試。4k下3A遊戲開啟DLSS2,除了《賽博朋克2077》外,其他遊戲差不多在80幀以上的水平。
目前DLSS已經升級到了3.5,主要是針對光追遊戲,增加了光線重建技術,這個AI模型可以進一步提升密集型光追遊戲和應用的光線追蹤影象。光線重建將此前人工設計的圖形降噪器替換成了經過NVIDIA 超級計算器訓練的AI網路。光線重建可以從訓練資料中識別光照模式,例如全域性光照或環境光遮蔽的光照模式,其最終效果比需要人工設計的降噪器更出色。
《賽博朋克2077》就是一款支援DLSS 3.5的遊戲,我們開啟和關閉光線重建來進行對比。這是一處水塘,正好反射出了一塊霓虹廣告牌,在沒有開啟DLSS3.5時,水面上非常模糊,幾乎看不清楚廣告上面的字。而開啟後,則是非常清晰,遊戲體驗拉滿。
《心靈殺手2》也支援DLSS3.5,地面上陽光照射在建築物上的倒影,透過肉眼我們能明顯的看出光線重建開關的區別。沒開時,地上的陰影就是一團黑,而開啟後建築的輪廓和邊緣能清晰的分辨。
現在眾多遊戲也都已經支援光線追蹤,這能讓遊戲畫面達到質的飛躍,但是可能會大大降低幀率。基本上在開啟光線追蹤後幀數下降了30%-50%。
iGame GeForce RTX 4080 SUPER Neptune OC 16GB的TGP功耗在320W。但是不同遊戲的溫度和功耗也會不同,就像幀率一樣。我們在2k和4k解析度下都進行了測試。2k到4k功率大約提升了30W,但是溫度大約提升了1度。
NVIDIA Reflex技術普遍運用在FPS遊戲上,這一技術主要是同步GPU和CPU,透過刪除CPU到GPU之間的渲染佇列,最佳化響應速度並降低系統延遲。它包含兩項技術:一項是 Reflex 低延遲模式,用於縮短遊戲中的系統延遲,以幫助玩家提升競技表現;另一項是Reflex 分析器,用於輕鬆快速地測量系統延遲。
我們可以在FPS遊戲內將NVIDIA Reflex設定為開啟+增強,我們也是選擇了幾款熱門FPS遊戲如《Apex英雄》,《無畏契約》在2k和4k下都進行了測試。
除了遊戲方面,在STUDIO創作,SUPER系列也迎來了重大提升。NVIDIA STUDIO可為有110多款應用加速,iGame GeForce RTX 4080 SUPER Neptune OC 16GB在3D渲染方面可以縮短渲染時間,DLSS功能的加入也能提升畫面幀數;支援AV1解碼器可以增加影片清晰度;還有比如超分圖片的全新生成式AI軟體的加入。
使用Blender Open Data benchmark進行測試,它會自動渲染官方支援的Blender基準測試場景,並顯示其渲染時間。他有三項測試,monster,junkshop和classroom,成績分別為4509,2108,2189個樣本每分鐘。
OctaneRender是一個公正且準確的 GPU 渲染引擎,能夠利用NVIDIA的CUDA和RTX系列GPU為創作者提供快速、高質量的渲染輸出。OctaneRender可用於所有創作3D軟體。該基準測試將測量 4 個單獨場景的渲染效能,每個場景使用 3 個不同的OctaneRender、Info Channels、Direct Lighting和Path Tracing 中的渲染選項,預設狀態下為開啟光追得分975.83,關閉光追後,得分732.80。
GeForce RTX 40系列GPU使用第八代NVENC為AV1影片編碼器提供硬體加速編碼功能。AV1與H.265/H.264在相同的位元率下可以提供更好的視覺質量,在畫面質量相同的情況下使用AV1,位元率會更低,檔案大小更小,影片上傳更快。除了新增AV1編碼支援外,40系列GPU還具有生成改進功能用於H.265(HEVC)編碼的NVENC。
在剪映專業版上已經支援AV1編解碼器加速。我們嘗試渲染匯出了4k30幀,時長為10分鐘的影片,來對比AV1和H.264。AV1編碼匯出影片的大小在1.52GB,而H.264編碼匯出影片的大小則是1.98GB。
在觀看直播時也有AV1和H.264兩種編解碼器,在4k 60fps、10 Mbps體驗一下兩者的視覺質量。不難看出AV1下觀看直播,影片會高畫質非常多,H.264則模糊不清。
ON1 Resize A是圖片無損放大軟體軟體,搭載最先進的神經網路和領先的AI人工智慧技術以及全新的超解析度技術。原本一張6M的照片在放大後變成了30M,下圖是我們將兩張圖片放大3倍,可以直觀的影象並沒有任何失真,色彩過渡自然,根本看不出這是經過放大過後的圖片。
D5渲染器是一款基於實時光線追蹤技術的3D渲染軟體,支援多種模型、材質和光源。它也融合了最新的 NVIDIA DLSS 3.5技術,例如DLSS光線重建以及現有的DLSS技術,例如DLSS超解析度,以及DLSS幀生成。
我們渲染了一段影片並透過開啟或關閉DLSS來觀察幀率的變化。在開啟DLSS後平均幀率翻了將近2.5倍,1%low幀與平均幀的差值也減少了。
接下來我們再來看一下開啟或者關閉光線重建畫面會有什麼樣的變化。第一張椅子腳的照片,可以看到關閉光線重建,噪點肉眼可見。第二張是桌子對窗外景色的反射,光線重建未開啟時噪點依舊非常明顯,而且畫面比較模糊。反觀兩幅圖在開啟光線重建後噪點大幅度減少了畫面也清晰了。
RTX VSR是一種AI技術用於提升影片播放質量上,在NVIDIA控制面板中,我們可以開啟RTX影片增強,同時也有自動、1、2、3、4五個擋位可以調節。1是最低,4是最高。
我們觀看了一段影片從關閉,質量1,質量3,三個擋位來對比畫面質量,肉眼就能非常直觀的發現,從充滿畫素顆粒到清晰。
Stable Diffusion是一個基於影象的AI模型,使使用者能輕鬆地將文字描述轉換為複雜的視覺表現。Stable Diffusion AI模型利用GPU加速優勢,使創作者能進行快速建立和完善,以獲得理想輸出,其速度比在CPU上處理AI模型快數百倍。
在1024×1024影象資料上執行SDXL模型並開啟TRT加速,耗時82秒,經計算得出每分鐘7.6張圖片。關閉TRT加速,耗時150秒,每分鐘4張圖片。
在512×512影象資料上執行SD1.5模型並開啟TRT加速,耗時約17秒,經計算得出每分鐘33張圖片。關閉TRT加速後,耗時37秒,每分鐘16張圖片。慢了將近一倍的時間。
僅在SD1.5模型下使用更高批次大小來測試TRT效能,在512×512影象下,耗時60秒,每分鐘可生成20張圖片。在768×768影象下,耗時177秒,每分鐘可生成7張圖片。
在SD測試上,兩種模型在開啟TRT加速後,每分鐘生成的圖片都翻了一倍。RTX 4080 SUPER上擁有著SUPER GPU中最多的AI Tensor Core,全新的生成式AI,將AI應用的浪潮推向了PC,也將這張顯示卡的受眾拓展到了更加廣泛的領域,建模師,剪輯等職業都非常適合。
總結:
iGame GeForce RTX 4080 SUPER Neptune OC 16GB不愧是超快的生成式AI,在生產力和遊戲上的提升還是很明顯的。4k下輕鬆100幀。水神的一體式水冷設計,相比一般顯示卡的風冷在散熱上大約能降低兩度。和4080相比,效能提升了5.2%,但是價格卻要便宜,突出一個加量不加價。如果有更換顯示卡的需求,遊戲發燒友、藝術工作者、影片剪輯等都可以選擇4080S。
目前,iGame GeForce RTX 4080 SUPER Neptune OC 16GB已在七彩虹官網商城、京東、天貓、拼多多、抖音等電商平臺及全國授權零售經銷渠道同步開售。除了本次評測款,七彩虹還同時準備了iGame Vulcan、Advanced、Ultra及「甲辰智龍」龍年定製版 等多個不同系列的GeForce RTX 4080 SUPER顯示卡供使用者選購,售價8099元起。