GeForce RTX50系來襲 技嘉RTX 5080超級雕評測
作為圖形計算與人工智慧的領軍者,NVIDIA於今年的CES2025上正式推出基於BlackWell架構的新一代GeForce RTX 50系遊戲顯示卡,拉開了2025年PC行業大更新的序幕。在CES主題演講上,黃仁勳興奮地表示新一代的RTX 5070即可持平上代旗艦RTX 4090的效能,但價格只有後者的三分之一,不過這句話指的是AI算力,並不是顯示卡的綜合效能。但也讓我們對於RTX50新系列顯示卡的效能期待值拉滿。RTX 5070都這樣了,RTX 5080、5090 D那不得起飛嘍?今天我們就使用率先上市的首批產品——來自技嘉的AORUS GeForce RTX 5080 MASTER ICE 16G顯示卡(以下簡稱技嘉RTX 5080超級雕)來看看新一代的顯示卡效能有多強。
作為全球知名科技品牌,技嘉科技一直是NVIDIA重要的合作伙伴,在NVIDIA GeForce RTX 50系列釋出之時,技嘉就公佈了多款RTX 50系列顯示卡。此次的技嘉RTX 5080超級雕就是首批RTX 50顯示卡中的重磅型號,下面為大家帶來這款產品的詳細體驗。
正式測評開始之前,先來介紹下NVIDIA GeForce RTX 50系列顯示卡的架構特性。相比上代Ada Lovelace架構,新的Blackwell架構在製程方面依然採用TSMC定製4N工藝,新型多單元流處理器 (SM) 具有更高的處理吞吐量,並與第五代Tensor Core緊密結合,著重最佳化了神經網路著色器的效能。
第四代GENERATION RT Cores的光線三角形相交率為上一代的2倍並增強了壓縮以減少記憶體佔用。同時,為了滿足下一代DLSS 4多幀生成的幀率穩定性需求,BlackWell架構搭載了基於硬體的Flip Metering,以提供流暢、高質量的體驗。Blackwell還透過PCIe 5.0和DisplayPort 2.1b UHBR20實現了頻寬增強,從而支援高達8K 165Hz的顯示器。
GeForce RTX 5080採用GB203核心,共有10752個CUDA單元,336個第五代Tensor Core張量核心,藉助FP4精度模型和DLSS 4提供了強勁的AI效能。特別地是,視訊記憶體方面,RTX 50系列採用了速度高達30Gbps的GDDR7視訊記憶體,成為目前消費級顯示卡中速度最快的視訊記憶體配置。
本次測試平臺配置為:英特爾酷睿Ultra 9 285K處理器、技嘉Z890 AORUS PRO ICE主機板、Kingston FURY Beast DDR5 8000MHz、Crucial T705 PCIe 5.0 SSD 2TB、ROG龍神III ARGB 360一體式水冷、ROG Strix AURA 1000W金牌電源。作業系統方面採用Windows 11專業版,版本24H2,除顯示卡外驅動程式以外其它硬體均使用廠商公開的正式版驅動程式。
MASTER家族品質保證 強悍風之力散熱系統
首先我們來看看技嘉RTX 5080超級雕的設計。MASTER系列一向是技嘉AORUS板卡家族的中流砥柱,無論是主機板還是顯示卡,MASTER以大師之名代表著嚴苛的品質和超強的效能,每一個細節都經過精心打造,致力於為玩家帶來出色效能和穩定體驗。技嘉RTX 5080超級雕當然也不例外。
技嘉RTX 5080超級雕採用數字供電,長壽命電容和合金電感等耐久用料延續技嘉超耐久設計。為滿足新一代顯示卡的散熱要求,技嘉RTX 5080超級雕採用“風之力”散熱系統,配備3個110mm大尺寸主動散熱仿生風扇,設計靈感來源於鷹的翅膀空氣動力學,在低噪音的同時提高了風壓和風量。扇葉表面還採用了分層紋理,具有不同的飾面,將力量與優雅完美融合。
左右兩個風扇與中間風扇採用正反轉設計,減少了相鄰風扇之間的擾流並提高了氣流壓力,同時支援3D智慧啟停,在GPU溫度較低或低負載時會自動停轉。雙滾珠軸承結構比傳統結構具有更好的耐熱性和效率,使用壽命更長。
加長的散熱片允許空氣透過,有效散熱,隨附的額外的風扇進一步增強了冷卻效能。特別的是,內部採用複合金屬潤滑脂,利用液態金屬的高導熱性和矽潤滑脂的易用性,滿足GPU高功率散熱需求。
伺服器級導熱凝膠用於冷卻VRAM和MOSFET等關鍵元器件,大型均熱板直接與GPU接觸,再加上複合式熱管,可快速將GPU和VRAM的熱量傳遞到散熱器。稜角分明且不等的鰭片高度設計有效引導鰭片之間的氣流,從而增加與空氣的接觸表面積並提高散熱效率。
技嘉RTX 5080超級雕採用全尺寸金屬背板,不僅很堅固,能為PCB帶來全面保護,同時也提升了顯示卡質感。透過全自動化製造過程,還實現了光滑PCB設計,避免組裝時劃傷手指。
供電方面採用16pin供電,提供1個HDMI 2.1b、3個DP 2.1b輸出介面,最多支援四屏顯示,最大輸出解析度7680*4320。
比較細節的一點是,技嘉RTX 5080超級雕的這個供電介面,採用了下凹設計,不像傳統設計那樣位於顯示卡邊緣,這樣無論是使用1轉3的PCIe介面還是16針的直插介面,電源線都不會彎折,連線更穩定。
同時顯示卡電源介面還設計了指示燈,一眼就能看出電源狀態(熄滅表示連線正常,亮起表示電源線未連線,閃爍表示電源異常),避免了因連線問題導致的隱患。
光效方面,熟悉技嘉顯示卡炫彩光輪的使用者會很喜歡,風扇周圍的圖案和漩渦靈感設計突出了動態三環燈效,營造出迷人的光影效果。
此外,技嘉RTX 5080超級雕配備了LCD 顯示屏,不僅能顯示顯示卡資訊,還可自定義文字、圖片和GIF,透過GCC(技嘉智慧管家)軟體可以進行個性化設定,並與主機板、記憶體等裝置同步燈效。GCC也可以對顯示卡的風扇執行、效能模式進行配置,十分易用。
基準效能表現 領先RTX 4080高達60%
接下來我們來看看技嘉RTX 5080超級雕的效能表現。
首先我們使用業內通用的3Dmark軟體來進行測試。包括FHD解析度下的Fire Strike測試、2K解析度的Fire Strike Extreme測試和針對4K遊戲的Fire Strike Ultra等三個場景,以及針對DX12的TimeSpy與TimeSpy Extreme測試和Port Royal光線追蹤測試。
從測試結果來看,6個場景中,技嘉RTX 5080超級雕都取得了非常出色的成績,Fire Strike場景中得分高達59502,FireStrike Extreme場景41051分,即使是負載較重的Fire Strike Ultra模式下也有21879分。在專門針對DX12環境的TimeSpy測試中,得分33820,4K解析度下的TimeSpy Extreme也達到了16788分,光線追蹤Port Royal測試中得分為22328,同樣是強悍的表現。
光看數字可能沒感覺,RTX 5080超級雕的這個成績具體是什麼樣的水平呢?簡單來說,與上代的RTX 4080相比,RTX 5080的3DMARK理論跑分綜合提升約為23%左右,可能玩家們覺得不如RTX40系當時的幅度大,但其實也是非常可觀的代際提升了。即使是與RTX 4080 SUPER相比,除了FireStrike場景,也有著7%~15%左右的提升。
主流遊戲測試 4K+光追暢玩最高畫質
接下來,我們看看在遊戲中的實際效能表現。我們測試了《CS2》《古墓麗影:暗影》《極限競速地平線5》《F1@24》《戰爭機器5》《賽博朋克2077》(V2.2版本)《黑神話悟空》等7款遊戲進行了試玩,遊戲設定均為4K(3840*2160)/2k(2560*1440)/FHD(1920*1080)三種解析度,畫質設定為最高,開啟DLSS(效能檔)與光線追蹤。
從結果來看,技嘉RTX 5080超級雕是一款可以讓你在4K解析度、光追全開、畫質拉滿,暢玩所有大型3A的的高效能遊戲顯示卡,當然,除了眾生平等的“黑猴子”,4K幀率可能略顯低了一點,其他遊戲均在100FPS以上,至於《賽博朋克2077》,這裡我們先賣個關子,在下一章節的DLSS 4中,將會帶給大家不小的驚喜。
我們也對比了幾款遊戲中與RTX 4080的遊戲效能,除了黑神話悟空,4K解析度最高畫質的設定下技嘉RTX 5080超級雕的平均幀率超過RTX 4080多達20%以上,領先RTX 4080 SUPER約在10%左右,《極限競速地平線5》中甚至高出RTX 4080達41%,效能提升幅度還是非常可觀的。
DLSS 4黑科技!畫質與幀率的雙重提升
NVIDIA的DLSS(Deep Learning Super Sampling)技術是一種基於AI深度學習的提升畫質的方法,可以讓玩家在不花費額外成本的情況下享受到更高的畫質和幀率,自推出以來深受廣大使用者的歡迎,尤其是DLSS 3+幀生成的組合更是被譽為遊戲拯救器,適配的遊戲數量也越來越多。
作為RTX 50系列顯示卡中最為重點的功能之一,全新的DLSS 4將幀生成(FG)升級為多幀生成(MFG),已有超過75款支援DLSS幀生成技術的遊戲及應用在GeForce RTX 50系列顯示卡上升級至DLSS多幀生成。
所謂多幀生成,就是隻需執行一次即可為每個渲染幀生成多個幀(最多3幀),得益於第五代Tensor Core和新的速度更快的AI模型,幀生成速度更快,並且視訊記憶體佔用更低,這意味著DLSS 4對於遊戲幀率的提升是革命性的。
我們先來看看在3DMark測試版的DLSS Feature專項測試中的表現。首先在DLSS 3的設定下,也就是預設2x幀生成的情況,在4K解析度效能檔的設定下,技嘉RTX 5080超級雕開啟DLSS之後,幀率相比關閉時的49.32 FPS提升到191.77 FPS,提升幅度高達288%,已經是非常巨大的提升,相信使用過DLSS 3玩過遊戲的使用者們已經有所感受。
但如果使用DLSS 4的多幀生成,選擇4x幀生成的話,幀率則由原生的24.13 FPS提升到326.8 FPS,提升超過12倍!基本印證了NVIDIA所說的,在4x多幀生成的情況下,只有1/16的畫面是原生渲染的,剩下的全部交給了AI,多幀生成的威力太強了!
在DLSS 4 3x和2x的設定下,幀率提升幅度分別為432%和280%。2x設定下,也就是與DLSS 3一樣的插入1幀設定下,DLSS 4由於採用了新的Transform模型,插幀後的絕對幀率會略低一點點。
理論如此,實戰如何呢?接下來我們看看在首批支援DLSS 4技術的《賽博朋克2077》遊戲中的表現,也就是上一章節結尾說到的驚喜。在最新的V2.21版本遊戲中,已經加入了DLSS 4中的多幀生成功能,分為2x、3x、4x三檔,也就是支援在原生渲染的一幀畫面中再插入AI生成的1、2、3幀。
同時在遊戲的DLSS超級解析度預設方案中,可以選擇最新的Transformer模型,基於Transformer架構的DLSS超解析度和光線重建模型具備2倍的引數量和4倍的計算量,相比原始的DLSS CNN模型,影象穩定性更高、重影更少,提升了抗鋸齒功能,可以理解為超分的畫質具有更多細節。
我們分別測試了DLSS 4多幀生成在2x、3x和4x設定下的幀率表現,實測非常驚人,開啟4x之後遊戲的幀率直接來到新高度。尤其是在4K解析度下,開啟4x多幀生成之後,相比2x多幀生成幀率幾乎翻倍,直接達到原生效能的10倍!即使是3x幀生成也是直接邁過4K@120的頂級體驗門檻,對於遊戲體驗流暢度的提升非常明顯,2K解析度下也是一樣的表現,FHD解析度雖然負載相對較低,但療效也很明顯,開啟DLSS 4多幀生成4x檔位之後,平均遊戲幀率超過400幀,相比2x提高了82%,如果與關閉幀生成相比,幀率提升超過2倍,如果與原始的光柵遊戲效能比的話簡直沒有可比性,幀率差距多達5倍。
除了已經更新DLSS 4的遊戲,我們也可以使用NVIDIA APP在程式設定裡開啟DLSS 4的多幀生成。例如在《漫威爭鋒》遊戲中,4K解析度下,我們測試了使用NVIDIA APP分別開啟2x、3x、4x幀生成,幀率都有著明顯提升。4x幀生成下高達371FPS,相比2x幀生成提高了60%,如果與原生效能相比,提升了1倍多。
除了DLSS 4的幀率提升,新的Reflex 2技術支援Frame Warp,可在將渲染幀傳送至顯示器前,根據最新的滑鼠輸入訊號對其進行更新,從而降低遊戲延遲。與原生渲染相比,Reflex 2最高可降低75%延遲,為多人競技類遊戲玩家帶來制勝優勢,也能提高單人遊戲操作時的響應速度。玩家們所擔心的開啟DLSS超分後遊戲“不跟手”的情況會得到改善。不過目前還沒有正式支援Reflex 2的遊戲釋出,我們暫時沒能進行實測。
DLSS 4得到了許多全球領先的遊戲開發者和遊戲引擎的支援,GeForce RTX 50系列GPU釋出之日即有超過75款遊戲和應用支援該技術。除了上面的《賽博朋克2077》之外,還有《黑神話悟空》《心靈殺手2》《星球大戰:亡命之徒》等熱門遊戲都加入了DLSS 4更新,推薦大家更新到最新版本的遊戲,以便更好享受DLSS 4技術所帶來的暢快遊戲體驗。
更強生產力 更廣泛的AI模型支援和驅動工具
NVIDIA GeForce RTX 50系列顯示卡出色的效能除了能為玩家提供極致的遊戲體驗之外,還可用於內容創作,在渲染複雜場景、編輯超高畫質RAW影片、多工負載等方面,都能夠提升創作者的效率。NVIDIA顯示卡擁有先進的GPU和驅動支援,藉助NVIDIA Studio驅動,RTX 50面對創意設計、AI運算等場景時候可獲得更高效的效能體驗。目前已經支援多達120+款常用的設計類、創意類或者AI相關設計開發軟體。
RTX 50系列GPU作為首款支援FP4(4-bit floating point)計算精度的消費級GPU,與上一代產品相比,讓AI 影象生成(如Flux模型)效能至高提升2倍,並可讓生成式AI模型在本地以更小的視訊記憶體佔用執行。
我們使用ULProcyon載入Flux模型進行了影象生成測試。首先使用FP8精度模型,生成4張1024解析度的圖片,耗時約57秒,每張圖片耗時14秒。
而如果使用FP4精度模型,生成同樣解析度的4張圖片,總耗時僅有36秒,平均9秒一張,相比FP8模型精度,影象質量並沒有什麼損失,但耗時大大減少了35%,同時減小了視訊記憶體佔用。
V-Ray是目前3D設計行業常用的渲染器,廣泛應用在3DSMax、MAYA、Sketchup等眾多創作設計軟體中。V-Ray Benchmark是專門測試GPU、CPU 3D渲染效能的工具,支援CUDA與RTX加速,也支援CPU和GPU協同加速。在v6.01版本的測試中,技嘉RTX 5080超級雕在GPU RTX測試中得分9411,相比僅使用CUDA效能高出3倍,如果與4080相比,RTX得分高出24%,更快的渲染速度無疑能夠幫助設計工作者提高效率。
基於3D設計渲染軟體Blender Cycles的Blender Benchmark也常被用來衡量CPU、GPU的渲染效能。如果使用技嘉RTX 5080超級雕顯示卡進行渲染,monster、junkshop、classroom三個場景中渲染速度相比僅使用CPU大大加快,如果與RTX 4080相比,分別提升5%、15%、5%。
前面提到的DLSS 4多幀渲染技術,除了可以為遊戲玩家們帶來巨大幫助,對於生產力工作也有裨益,例如在D5渲染器中,已經支援DLSS 的超解析度預覽,利用NVIDIA APP可以開啟超解析度預覽,提高預覽影片時候的畫面流暢度,進一步提升了工作效率。
此外,NVIDIA新推出的Broadcast應用也可以利用RTX 50系顯示卡帶來效能最佳化,為主播帶來兩項AI驅動的新功能:音棚音效和虛擬補光。前者可升級麥克風音訊質量,後者可對面部重新打光,以獲得更精緻的直播畫面,可以說是直播場景的福音。
3DMARK壓力測試與功耗表現
最後我們來簡單進行顯示卡壓力與功耗測試。3DMark中Stress Test的壓力測試模組基於Speed Way、TimeSpy、Fire Strike等不同等級的專案,可以長時間給GPU施加高負載,檢驗其穩定性與可靠性,其中Speed Way是新加入的GPU基準測試程式,使用光線追蹤和實時全域性照明來渲染,支援DirectX 12 Ultimate以最佳化效能和視覺質量。
在3DMARK的Speed Way場景的20個迴圈壓力測試中,技嘉RTX 5080超級雕幀率穩定度高達99.2%,輕鬆透過。
功耗方面,RTX 5080的預設TGP設定相比上代的RTX 4080略有提升,為360瓦。我們使用FurMark在4K解析度下進行了15分鐘的烤機測試,技嘉RTX 5080超級雕表現十分出色,得益於高效的風之力散熱系統,GPU平均溫度僅有61°C,平均CPU功耗(Board Power Draw)為356瓦,基本跑滿TGP上限。GPU核心頻率為2565 MHz,效能輸出十分強勁。
核心科技+AI狠活兒 RTX5080價效比超高
相信透過以上的內容,大家對於GeForce RTX 5080顯示卡的效能有了一個直觀的印象。全新的BlackWell架構,更強的算力,還有AI主導的DLSS 4多幀生成黑科技,讓RTX 5080擁有了超越代際效能提升的體驗,無論是遊戲玩家還是生產力創作,使用者們都能體驗到超乎想象的效能和效率。
一直以來,80系列作為GeForce RTX顯示卡家族中的次旗艦,受到不少遊戲玩家們的關注,今年的RTX 5080顯示卡如果與旗艦RTX 5090(5090 D)相比,其實更顯價效比。因為在早前解禁的RTX 5090 D效能評測中,其實並沒有領先RTX5080太多,但價格可是要高出一倍的。因此,除了算力層面,對於遊戲玩家們來說,RTX 5080顯然是更加實惠的選擇。
技嘉RTX 5080超級雕作為首批上市的RTX 5080非公版產品,不僅有著優秀的設計與做工,超強的風之力散熱系統釋放出顯示卡更強大的效能,目前已經正式上市,有想盡早享受新一代GeForce RTX50顯示卡魅力的使用者快去搶購吧。
值得一提的是,同時上市的技嘉RTX 5080系列產品中,還有多款不同型號,例如技嘉RTX 5080風魔(WINDFORCE系列),將強大的效能融入到小巧的外形中,售價為8299元。技嘉RTX 5080風魔也採用了OC超頻設計,核心頻率2670MHz相比公版略有提升。效能/靜音雙BIOS設計,出廠預設設定為效能模式,可為使用者提供更強效能,切換到靜音模式將享受更安靜的體驗。
散熱方面採用伺服器級導熱凝膠、仿生風扇、超導熱管、大面積均熱板及進氣格柵等多項技術組成的風之力散熱系統,確保高負載下仍能穩定工作。並且顯示卡符合NVIDIA的SFF-READY小型規格,將強大的效能融入到小巧的外形中,實現了尺寸和效能的平衡。新設計的可調式顯示卡支架提供更好的相容性,讓顯示卡得到牢固支撐並防止下垂,時尚的設計也增強了系統的整體美感。
風魔系列也有RTX 5090 D可選,效能更加極致,售價16499元,新年有組建新平臺計劃的使用者可以多多關注。