在今年的CES 2024上,NVIDIA進一步完善了RTX 40系列顯示卡品類——帶來了GeForce RTX 40 系列SUPER顯示卡。就在今天,GeForce RTX 40系列的第九款顯示卡——NVIDIA GeForce RTX 4080 SUPER正式到來。
全新的GeForce RTX 4080 SUPER GPU在遊戲、創作和日常工作等方面提供革命性的AI效能,再配合基於RTX GPU構建的豐富軟體加速庫,可使顯示卡的AI效能再進一步增強。
本次我們為大家帶來技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡的效能實測,來看看這款RTX 4080 SUPER顯示卡在外觀、做工、散熱等方面的表現如何,並實際測試RTX 4080 SUPER在AI製圖、3D渲染等方面有怎樣的表現,遊戲效能跟RTX 4080以及上代的RTX 3090 Ti相比能領先多少,與RTX 4090還有多少的效能差距。
GPU-Z檢測下的技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G引數資訊
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡擁有10240個流處理器、112個光柵處理單元、320個紋理單元、64MB L2快取,顯示卡核心頻率為2295-2595MHz,電源輸入介面為16pin(12+4)。採用16GB GDDR6X視訊記憶體,視訊記憶體位寬為256-bit,視訊記憶體頻寬736.3GB/s,等效速率為23Gbps。
規格方面,與RTX 4080顯示卡相比,RTX 4080 SUPER顯示卡CUDA核心數量從9728個增加到滿規格的10240個,增幅為5%。基準、加速頻率分別提升90MHz、50MHz,TGP保持不變。
RTX 4080 SUPER所使用的AD103-400 GPU
RTX 4080 SUPER所使用的是完整的AD103 GPU核心,採用TSMC 4N工藝製程,核心面積為379mm2,整合459億電晶體。共擁有7個GPC,其中6個GPC內包含6個TPC,另外1個GPC內包含4個TPC,每個TPC擁有兩組SM,共計為80組SM,即10240個CUDA。
RTX 40系列SUPER顯示卡優勢簡析
要說NVIDIA GeForce RTX 40系列GPU最讓人驚豔的技術,那一定非DLSS 3莫屬了。
DLSS 3幀生成技術由GeForce RTX 40系列GPU所搭載的全新第四代Tensor Core和光流加速器提供動力支援,透過在DLSS 2超解析度技術的基礎上增加了AI驅動的幀生成技術,可利用AI建立更多幀並提高影象質量,在讓遊戲畫面更加逼真的同時,大幅度提升遊戲幀率。
NVIDIA於2023年8月底正式釋出了DLSS 3.5,該技術加入了全新的光線重建(Ray Reconstruction,簡稱RR),其主要功能是用NVIDIA超級計算機訓練的AI網路取代人工設計的降噪器效果,使取樣光線之間生成更高質量的畫素,從而顯著提升所有GeForce RTX GPU的光線追蹤影象質量。
在實際遊戲中,開啟光線重建後的光照變得更加精確,遊戲畫質更加清晰,細節更為豐富,同時重影更少,並且在光線條件發生劇烈變化時響應更快。
GeForce RTX 40系列GPU所採用的Ada架構能夠充分釋放光線追蹤的強大優勢,可模擬真實世界中的光線特性。藉助GeForce RTX 40系列GPU和第三代RT Core的強勁效能,可以讓玩家在虛擬世界中可以體驗到未曾感受過的驚豔細節。
目前為止已有超過500款遊戲與應用支援NVIDIA RTX技術,NVIDIA官方也是開啟RTX 500活動以慶祝這一里程碑式的成果。
除了遊戲方面之外,GeForce RTX 40系列GPU在AI方面也擁有十分亮眼的表現,搭載專用AI Tensor核心,配合十分受影片創作者歡迎的Studio剪映、將簡單線條轉化為逼真風景圖的NVIDIA Canvas、直播應用NVIDIA Broadcast、AI製圖Stable Diffusion、以及光線追蹤3D渲染器D5 Render等軟體,可為使用者提供強大效能和革新功能,輕鬆做到提升創作能力,提高工作效率。
技嘉RTX 4080 SUPER魔鷹顯示卡外觀(一)
本次測試使用的是技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡,魔鷹是技嘉旗下定位中高階的顯示卡系列,該系列顯示卡在效能、散熱、外觀與售價之間做到了很好的平衡。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡配件,除了基本上算是必備的16pin轉3*8pin的轉接線之外,還有一個定製顯示卡支架。該支架為這款顯示卡量身定做,在讓顯示卡可以更加穩定安全輸出的同時,其樣式與配色還和顯示卡外觀十分契合,可以輕鬆與顯示卡融為一體。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡的配色以黑色為主,正面採用磨砂質感外殼,輔以各種斜線條修飾,整體外觀低調內斂又不失個性。顯示卡尺寸為342*150*75mm,可以相容大部分機箱。
顯示卡採用三風扇散熱設計,擁有三個110mm的導流風扇。導流風扇可以使氣流由風扇邊緣分流,並平滑引導氣流透過扇葉表面的3D條紋曲線。風扇採用奈米石墨烯潤滑油,該潤滑油在有效延長風扇使用壽命的同時,還能讓風扇轉動的更加安靜。
風扇採用正逆轉設計,相鄰風扇的旋轉方向不同,可有效減少擾流並增加氣壓。顯示卡風扇支援自動停轉功能,當溫度較低時風扇會停止工作,遊戲開始後溫度上升,風扇將自動恢復旋轉。智慧啟停在有效減小噪音的同時,還能增加風扇使用壽命,為玩家提供更佳的使用體驗。
技嘉RTX 4080 SUPER魔鷹顯示卡外觀(二)
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G側面設計有GIGABYTE RGB信仰燈,中間則為GEFORCE RTX標識。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G採用12+4pin電源介面
電源介面下方設計有供電指示燈,當遇到異常供電時,指示燈會透過頻繁閃爍來提醒玩家。
顯示卡輸出介面為標準的3*DP 1.4a + 1*HDMI 2.1a組合
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡採用造型強化金屬背板,該背板可以有效提升顯示卡結構強度與靜電防護能力,保護顯示卡PCB。
背板尾部設計有一個超大的風窗,讓風扇的氣流可以以較低阻力穿透鰭片和背板,從而實現更高效的散熱。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡採用雙BIOS設計,擁有OC(效能)與SLIENT(靜音)兩種模式,可在顯示卡背面進行調節,預設是OC模式。
技嘉RTX 4080 SUPER魔鷹燈光效果
顯示卡採用RGB幻彩光輪,支援1680萬色彩調節與多種燈光效果切換,可以透過技嘉智慧管家進行自定義燈效設定。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡點亮實拍
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡點亮實拍
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡點亮實拍
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡點亮實拍
技嘉RTX 4080 SUPER魔鷹顯示卡拆解
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G PCB板
顯示卡的PCB板要比散熱模組短一些,配合開孔背板與三風扇設計,讓顯示卡可以迅速排出內部熱量,使顯示卡效能得到充分發揮。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡PCB正面主要散熱部位都覆蓋有高效導熱貼,能夠把視訊記憶體和供電元件的溫度快速傳導到散熱模組上,加速排出顯示卡內部產生的熱量。
RTX 4080 SUPER所使用的AD103-400-A1核心
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡核心供電部分
顯示卡採用16+3相供電設計,顯示卡每個MOSFET都擁有過溫保護設計,確保顯示卡能夠持續穩定工作,保證顯示卡效能發揮。
視訊記憶體部分
GPU核心周圍排布了8顆來自美光的GDDR6X視訊記憶體顆粒,單顆容量為2GB,共計16GB視訊記憶體。視訊記憶體位寬為256-bit,視訊記憶體頻寬為736.3GB/s。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G採用風之力散熱系統,該系統擁有三個110mm導流風扇,配合直觸GPU的純銅底座、9根複合式熱管、進氣格柵等,使顯示卡能夠將GPU核心熱量迅速傳遞出去,讓顯示卡擁有更快的熱傳遞速度,噪音更低的同時,散熱效能更加強大。
透過拆解可以發現,技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡在供電、散熱方面的料堆的很足,為顯示卡效能的充分發揮打下了良好的基礎。
測試平臺與測試方法介紹
測試平臺一覽
測試專案一覽
技嘉智慧管家 (GCC)
GIGABYTE CONTROL CENTER (GCC) 首頁
技嘉智慧管家GIGABYTE CONTROL CENTER (GCC) 是一款適用於所有GIGABYTE產品的統一軟體,該軟體擁有直觀的介面與較為豐富的功能體驗。透過軟體可實時調節顯示卡的頻率、電壓、風扇模式、RGB燈效、以及功耗等,讓玩家可以輕鬆掌控顯示卡狀態。
GIGABYTE CONTROL CENTER (GCC)RGB燈效調節介面
GIGABYTE CONTROL CENTER (GCC)風扇控制介面
GIGABYTE CONTROL CENTER (GCC) 效能調節介面
3DMark基準測試
3DMark Fire Strike測試
3DMark Fire Strike Extreme測試
3DMark Fire Strike Ultra測試
3DMark Time Spy測試
3DMark Time Spy Extreme測試
3DMark光追、DLSS測試
3DMark Port Royal測試
3DMark DirectX光線追蹤功能測試
NVIDIA GeForce RTX 40系列顯示卡的一大變化就是新增了對DLSS3技術的支援,DLSS3在前代DLSS的基礎上,透過光流加速推斷下一幀生成的目標畫面,使傳統CUDA算力得到極大的節省,讓GPU在應對高解析度實時渲染遊戲時可以更加遊刃有餘,與不使用DLSS相比,理論上游戲效能的提升可高達4倍。 DLSS3由於Frame Generation的加入,它的理論幀數效能能達到原先DLSS2的雙倍,這使得GeForce RTX 40系顯示卡能夠以更小的壓力用高解析度高畫質執行所有支援DLSS3的遊戲。
3DMark DLSS3功能測試
3DMark DLSS2功能測試
在3D MARK DLSS的測試項中,4K解析度下,關閉DLSS的測試結果十分接近,然而開啟DLSS後(Performance),技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡在4K解析度下DLSS3可提升235%的效能,遠超DLSS2 159%的提升。
DLSS 3.5遊戲《2077》、《心靈殺手2》實測
由於RTX 40系列顯示卡最具價值的優勢就是新增了對DLSS3的支援,因此遊戲測試環節我們選擇6款支援DLSS3,並且其中兩款還支援最新DLSS 3.5的遊戲大作來進行遊戲效能對比測試。
我們透過分別測試顯示卡開啟DLSS3(RTX 40系列)、DLSS2(RTX 30系列),與關閉DLSS後的遊戲效能,來看看RTX 4080 SUPER顯示卡比RTX 4080顯示卡能領先多少,與RTX 4090顯示卡有多少差距,DLSS3加持下的RTX 4080 SUPER能領先開啟DLSS2的RTX 3090 Ti多少。
4K解析度《賽博朋克2077》遊戲效能對比
2K解析度《賽博朋克2077》遊戲效能對比
4K解析度《心靈殺手2》遊戲效能對比
2K解析度《心靈殺手2》遊戲效能對比
《消逝的光芒2》、《F1 22》遊戲實測
4K解析度《消逝的光芒2》遊戲效能對比
2K解析度《消逝的光芒2》遊戲效能對比
4K解析度《F1 22》遊戲效能對比
2K解析度《F1 22》遊戲效能對比
《光明記憶》、《瘟疫傳說》遊戲實測
4K解析度《光明記憶:無限》遊戲效能對比
2K解析度《光明記憶:無限》遊戲效能對比
4K解析度《瘟疫傳說:安魂曲》遊戲效能對比
2K解析度《瘟疫傳說:安魂曲》遊戲效能對比
遊戲測試小結:
透過測試我們可以發現,與RTX 4080相比,技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡整體擁有2.24%的效能優勢,並且建議零售價比RTX 4080下降1400元,確實做到加量還降價。
與上代旗艦RTX 3090 Ti顯示卡相比,技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡的遊戲效能優勢明顯,整體效能優勢為43%,其中開啟DLSS3後的實際遊戲幀數提升高達55%,即便是不開啟DLSS,也有25%的效能優勢。
與當代旗艦RTX 4090相比,技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡還是有一定差距的,實際遊戲效能要低22%。
在實際遊戲體驗方面,4K解析度最高畫質與光追效果前提下,開啟DLSS3質量後,技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡表現得遊刃有餘,在當下唯二支援全景光線追蹤的高畫質遊戲《賽博朋克2077》與《心靈殺手2》遊戲中也能保證60+FPS的平均遊戲幀數,可以為玩家帶來流暢的遊戲體驗。
AI製圖——Stable Diffusion測試
除了擁有出色的遊戲效能之外,GeForce RTX 40系列GPU還逐漸成為了創作者的法寶,其中AI就是工作效率的倍增器。
Stable Diffusion是一款熱門的AI繪畫生成工具,只需要輸入一句話、或者特定的關鍵詞,即可輕鬆生成一幅想要的影象。該軟體基於AI計算,可廣泛應用於平面和3D設計,透過藉助擴散模型生成海量的圖片,從而大幅縮短作圖時間,顯著提升效率。該軟體由NVIDIA RTX GPU加速,視訊記憶體容量越大,支援生成影象的解析度越高,GPU級別越高,渲染速度越快。
AI繪圖工具Stable Diffusion支援TensorRT,TensorRT是NVIDIA推出的一款高效能深度學習推理SDK,可最佳化推理效能、加速各種工作負載,並支援大型語言模型推理。
在下載並引用相關外掛後,即可在Stable Diffusion中增添“TensorRT”標籤,之後再經過一系列設定,就能透過TensorRT來加速AI繪畫。
本次測試所使用的顯示卡為:
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G
NVIDIA GeForce RTX 3090 Ti
測試選用模型為sd_xl_base_1.0_0.9vae.safetensors
測試中所選擇的取樣方法是Eular a,取樣步數為50,圖片寬度和高度為1024×1024,提示詞相關係數為7,總批次數為10,單批數量為1,隨機數種子為13(確保中可以生成相同的影象)。
Stable Diffusion常規繪圖(RTX 3090 Ti),總計用時173.3秒,平均每分鐘可生成3.46張影象
Stable Diffusion常規繪圖(RTX 4080 SUPER),總計用時136.8秒,平均每分鐘可生成4.4張影象
經過TensorRT加速的Stable Diffusion繪圖(RTX 4080 SUPER),總計用時63.5秒,平均每分鐘可生成9.5張影象
透過對比測試可以發現,同樣使用SD_XL進行Stable Diffusion常規繪圖時,使用RTX 4080 SUPER顯示卡要比RTX 3090 Ti的效能強27%。而加入支援RTX 4080 SUPER的TensorRT加速後,RTX 4080 SUPER顯示卡的AI繪圖效率大幅提升,對比RTX 3090 Ti高出175%,即便對比未開啟TensorRT加速的RTX 4080 SUPER顯示卡本身,開啟TensorRT加速後也擁有116%的效率提升,可以給予使用者更加快速的AI生成體驗。
3D光追渲染器——D5 Render測試
D5 Render(D5渲染器)是一款免費的實時光線追蹤渲染器,主打從事大型建築或景觀專案的3D設計師和專業人士。憑藉先進的實時光線追蹤技術、D5 GI全域性照明解決方案、以及眾多即用型資源,讓D5 Render可以在更短時間內完成專案的同時,還具備高真實感。
在最新一代的D5 Render中,加入了為實現逼真的光線追蹤視覺效果而開發的NVIDIA DLSS 3.5,此次整合包含由AI神經網路提供支援的DLSS超解析度、幀生成和光線重建功能。
其中光線重建是一種新的神經渲染AI模型,它可以透過為各種內容提供快捷的智慧降噪解決方案,進一步增強光線追蹤的視覺質量;而NVIDIA DLSS幀生成功能增強了光線追蹤效能並提高了實時視窗幀速率,可帶來更流暢的編輯體驗,進而實現直觀的互動式 3D 建立。
本次我們透過使用技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G與NVIDIA GeForce RTX 3090 Ti顯示卡來進行測試,來看看最新加入的DLSS 3.5對於D5 Render渲染有著怎樣的增幅。
D5 Render測試(RTX 4080 SUPER),開啟DLSS3.5中的超解析度取樣+光線重建+實時高幀率,平均幀數為97FPS
D5 Render測試(RTX 4080 SUPER),關閉DLSS3.5中的超解析度取樣+光線重建+實時高幀率,平均幀數為34FPS
D5 Render測試(RTX 3090 Ti),開啟DLSS3.5中的超解析度取樣+光線重建,平均幀數為44FPS
D5 Render測試(RTX 3090 Ti),關閉DLSS3.5中的超解析度取樣+光線重建+實時高幀率,平均幀數為20FPS
可以看到使用RTX 4080 SUPER顯示卡開啟DLSS 3.5中的全部選項之後,使用D5 Render渲染場景可以獲得高達2倍的效能增幅。對比RTX 3090 Ti顯示卡,RTX 4080 SUPER開啟DLSS 3.5中能夠開啟的選項後擁有120%的效能優勢。在同樣關閉DLSS 3.5內選項前提下,RTX 4080 SUPER對比RTX 3090 Ti也有70%的效能優勢,可以給予使用者更加流暢的創作體驗。
網頁影片使用者福利——RTX VSR技術
相信大家線上看影片時,經常會遇到由於畫面清晰度較低導致難以獲得滿意觀影體驗的情況。在以前,遇到這種情況的使用者是束手無策的。然而隨著RTX VSR技術的出現,上述問題已經可以得到妥善解決——使用GeForce RTX 40、RTX 30系顯示卡的使用者可以藉助RTX VSR技術對流媒體影片進行實時畫面增強,從而顯著提升觀影體驗。
RTX VSR全稱是RTX Video SUPER Resolution,它透過利用RTX GPU中Tensor核心做AI計算去對各個瀏覽器中經過壓縮演算法的影片移除塊狀壓縮偽影,以達到提升解析度和清晰度的目的。這項功能目前支援谷歌Chrome、微軟的Edge等主流瀏覽器(要升級到最新版本),此外技嘉RTX 4080 SUPER GAMING OC魔鷹16G擁有雙編解碼器,還增加了對AV1的硬體編碼功能,無論你是在B站、鬥魚還是其它什麼平臺上觀看影片,它讓影片質量值得你去匹配4K顯示器。
VSR的功能開關整合在了NVIDIA控制面板中,可以在“影片”下拉欄“調整影片影象設定”的介面中看到它——RTX 影片增強。勾選這個選項並點選應用,就可以開啟RTX VSR了,它還支援最佳化級別的設定,預設為1,最高為4。
透過逐級增加VSR演算法的複雜性,最大可以將360p的影片最佳化到1440p的視覺效果,GPU的佔用率也會隨之提高,它與VSR的質量級別成正比。1~2級的GPU佔用率較小,已經能明顯改善影片質量,它對較低端的GPU也是十分友好的。
影片分割線左側為原影片畫面,右側為開啟RTX VSR的畫面,可以看出清晰度明顯增強,幾乎接近渲染CG的效果。
我們在網路上看到的影片絕大部分都是經過重新編碼壓縮的,降低容量的同時也會損失一部分質量。之前已有的影片銳化處理在提高畫質晰度的同時往往會失真,而RTX VSR則透過將NVIDIA Tensor Core與最先進的Al影象處理技術相結合,在智慧銳化和強化特徵與邊緣的同時,還能消除惱人的壓縮偽影,從而呈現出可媲美影片所標原生解析度的優秀畫質。
散熱測試與結語
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡風扇支援空閒停轉功能,該功能可以大幅降低顯示卡在低負載工作時的噪音,提升風扇壽命。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡的散熱表現出色,室溫26℃,待機20分鐘後的GPU溫度為40.5℃,風扇處於靜止狀態。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡散熱測試
我們使用FurMark烤機進行顯示卡的散熱測試,測試方法為在顯示卡溫度穩定一段時間後,觀察顯示卡的最終溫度。
烤機時間約為20分鐘,顯示卡核心溫度為63.6℃,視訊記憶體溫度為52℃,此時GPU的使用率為100%,當前功耗為318.4W。風扇負載為53%,轉速為1883RPM。透過散熱測試可以發現,技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡在散熱方面的表現是十分出色的。
結語
作為NVIDIA GeForce RTX 40 SUPER系列的第三張顯示卡,RTX 4080 SUPER顯示卡的整體表現不俗,在價位比此前RTX 4080低1400元的基礎上,CUDA核心增加5%,並且核心頻率、視訊記憶體頻寬與等效頻率等方面均有一定程度的提升,確實做到加量又降價。
遊戲效能方面,在定價更低的前提下,RTX 4080 SUPER顯示卡的遊戲效能可小幅超越RTX 4080,在4K解析度最高畫質遊戲中可以達到60+FPS的平均遊戲幀數,可以為玩家帶來流暢的4K遊戲體驗。
在AI方面,NVIDIA專用的AI Tensor核心配合Stable Diffusion、D5 Render等軟體,可以為使用者帶來更高的效能與效率,給予使用者更加流暢的創作體驗。
本次評測的技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡外觀低調內斂卻不失個性,配合RGB幻彩光輪與RGB信仰燈效,顏值不錯。
顯示卡用料紮實,16+3項的高規格供電設計配合加大面積的散熱模組,再加上給力的風之力散熱系統,使GPU可以長久保持在最佳的工作狀態當中,為顯示卡持續高效能輸出提供了極佳的發揮空間。顯示卡擁有高達4年的質保,使用起來毫無後顧之憂,是一款兼具外觀、效能與散熱的顯示卡產品。
技嘉RTX 4080 SUPER GAMING OC 魔鷹 16G顯示卡已經在各大電商平臺上架,售價為8799元,適合喜歡RGB燈光環繞,對顯示卡的散熱與靜音有較高要求,並主打4K高畫質遊戲大作的玩家或對AI效能有較高要求的內容創作者。