前言:
在 2025 年的國際消費類電子產品展覽會(CES 2025)上,的創始人兼執行長黃仁勳隆重推介了基於全新 Blackwell 架構的 GeForce RTX 50 系列顯示卡。這一訊息宛如一顆重磅炸彈,迅速引發了整個行業的廣泛關注。特別是系列中的旗艦產品 GeForce RTX 5090,憑藉其卓越的效能,成為眾人矚目的焦點。與此同時,次旗艦 RTX 5080 也憑藉其出眾的效能表現與緊湊的SFF READY尺寸,吸引了眾多遊戲玩家和硬體愛好者的目光。
技嘉 GeForce RTX 5080 GAMING OC 魔鷹 16G顯示卡(下述簡稱“技嘉RTX 5080魔鷹”)是技嘉在 RTX 5080 系列顯示卡中的核心產品之一。雖然它並非頂級旗艦顯示卡,但在中高階市場中卻擁有不可忽視的影響力。該產品承襲了技嘉 GAMING OC系列的設計理念,在效能、散熱和用料等方面都表現出色,致力於為玩家提供穩定而強大的圖形處理能力,滿足遊戲、創作等多種場景的使用需求。本文將對其進行全方位地解析,揭示其在效能、技術、設計等方面的亮點與特色。
技嘉 GeForce RTX 5080 GAMING OC 魔鷹 16G,規格介紹
在評估顯示卡效能之前,我們首先來了解一下技嘉RTX 5080魔鷹顯示卡的規格,其顯示核心為 NVIDIA GeForce RTX 5080,基於全新的 Blackwell 架構,相較於上一代,在架構層面就帶來了效能的飛躍。而先進的架構使得顯示卡在光線追蹤、DLSS4 、AI效能等方面的運用上更加高效,能夠為使用者帶來更逼真的遊戲畫面和更流暢的遊戲體驗。
作為一款非公版顯示卡,技嘉RTX 5080魔鷹顯示卡搭載了更高的核心Boost頻率、更強大的PCB設計,以及更為出色的散熱系統。在核心頻率方面,技嘉RTX 5080魔鷹顯示卡的基礎頻率與RTX 5080 FE保持一致,但在Boost頻率上實現了顯著的提升,達到了2730MHz。此外,技嘉RTX 5080魔鷹顯示卡還配備了雙BIOS模式,允許使用者在效能模式和靜音模式之間輕鬆切換。
因此,從紙面資料來看,技嘉RTX 5080魔鷹顯示卡在效能、散熱以及噪音控制方面均優於FE公版。如果定價合理,這款顯示卡無疑將在同級別產品中展現出強大的競爭力。
Blackwell架構簡介:
Blackwell架構首次亮相是在去年的GTC 2024技術大會上,正如 CEO所言:“Blackwell GPU是推動新一輪工業革命的引擎”。基於Blackwell GPU架構的B200與GB200 Grace Blackwell超級晶片憑藉其卓越的效能,再次超越眾多競爭者,成為AI行業史上最強的產品。
GeForce RTX 50系列顯示卡同樣採用了Blackwell架構,儘管在規模和規格上存在顯著差異。自Ada Lovelace架構以來,NVIDIA便對數學家們情有獨鍾,而此次Blackwell架構的命名也源自一位數學家——大衛·布萊克威爾,一位備受尊敬的數學家和統計學家,在博弈論和統計學領域作出了不可磨滅的貢獻。
NVIDIA以他的名字命名這一架構,體現了新平臺的創新性和卓越的計算能力。Blackwell架構是NVIDIA近年來更新幅度最大的GPU架構,相較於以往的架構,它革命性地引入了神經網路著色器,旨在為遊戲創造先進、高效且更逼真的渲染方式,為玩家帶來全新的遊戲體驗。
相比前代Ada架構,Blackwell的升級聚焦於四大方向:分別是AI算力的爆發、光線追蹤技術的革新、視訊記憶體能效的提升以及劃時代的神經網路渲染。
第五代Tensor核心
其中AI算力的爆發就不得不提到Blackwell架構上的第五代Tensor核心,新一代Tensor Core新增了對FP4浮點運算精度的支援。FP4是一種較低的量化方法,類似於檔案壓縮,可以減小模型推理過程中資料儲存和計算量大小,提高計算效率,降低該過程對視訊記憶體的要求。與大多數模型預設使用的FP16相比,FP4使用的視訊記憶體不到其一半,並使GeForce RTX 50系列GPU的效能相比上一代提升高達2倍。
第四代RT核心
而光線追蹤技術的革新則仰賴於第四代RT核心的加持,相較於第三代RT核心來說,Blackwell架構的第四代RT核心主要提升了檢測光線、路徑與三角形相交的效能,過往在檢測時往往只能檢測單個三角形,一旦場景複雜,檢測能力不足就容易導致渲染出錯等問題,而現在檢測能夠以簇集方式進行,檢測效率更高。同時還有三角形簇集解壓縮引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以減少渲染毛髮所需的幾何圖形數量,並使用球體代替三角形以獲得更準確的毛髮形狀擬合,能夠讓顯示卡發揮更好的效能但只消耗較小的視訊記憶體佔用。
綜合來看,Blackwell架構的光線追蹤多邊形相交效率是上一代Ada架構的2倍,是Turing架構的8倍,同時還可以節省25%的視訊記憶體使用率。
第四代RT核心的改進主要是為實現更好的光追效果。其中有兩項新技術能夠受益,第一項是RTX Mega Geometry技術。隨著光線追蹤遊戲場景的幾何複雜性不斷增加,遊戲畫面中幾何圖形的計算量也呈現出快速增長的趨勢。而RTX Mega Geometry技術能夠加速構建邊界體積層次結構(BVH),使得在實時渲染中可以處理多達100倍的三角形數量。
該技術的出現,也使得開發者能夠在遊戲場景中使用更復雜的幾何圖形,而不會影響遊戲幀率。過去需要一個個算BVH,現在RTX Mega Geometry能夠智慧地在GPU上批次更新三角形簇,減少了CPU的負擔,既保證了效能,也兼顧了影象質量。相信隨著這些技術的不斷發展和應用,未來的遊戲將能夠呈現出更加逼真和細膩的視覺效果,同時保持高效的效能表現。
另外一個能夠受益的技術則是Curve Primitive,方便光追在曲面中的應用,例如一位男士的頭髮可能需要多達400萬個三角形,再加上光線追蹤技術,畫面所需要的運算負載極大。NVIDIA則透過第四代RT核心中的Linear- Swept Spheres(線性掃描球體)技術有效減少了渲染頭髮所需的幾何體數量,以球形代替多邊形,更貼合頭發的形狀,從而將記憶體佔用量大幅縮減至三分之一,並進一步提升了實際幀數,讓頭髮的渲染效果更加自然流暢。
GDDR7視訊記憶體
第三點改變則是視訊記憶體效率的提升,Blackwell架構中還首次加入了對GDDR7視訊記憶體的支援,此前GDDR6視訊記憶體的訊號編碼為NRZ/PAM2,而RTX 40繫上的GDDR6X則是PAM4編碼。最新的GDDR7視訊記憶體,訊號編碼改成了PAM3,NRZ/PAM2每週期提供1位的資料傳輸,PAM4每週期提供2位的資料傳輸,而PAM3每兩個週期的資料傳輸為3位。說人話就是,新的編碼機制可以使雜訊失真比減小,訊號品質更清晰,同時還能帶來更高的視訊記憶體執行頻率以及更低的電壓,根據NVIDIA的介紹,使用GDDR7視訊記憶體後,資料傳輸速率可達GDDR6時的2倍,並且功耗接近GDDR6的一半,經典加量還減價。
神經網路著色器
接著我們再細說一下這一代架構的最大變化,NVIDIA這次將Blackwell架構的SM單元直接稱為神經網路著色器。相比較於之前的可程式設計著色、CUDA統一著色、通用計算著色來說,其最大的變化就是引入了AI,AI將會徹底改變GPU的著色方式。
在Blackwell架構中,NVIDIA 進一步拓展了神經網路渲染的範疇,引入了諸多創新元素,包括神經網路紋理壓縮(Neural Textures)、神經網路材質(Neural Materials)、神經網路體積(Neural Volumes)、神經網路輻射場(Neural Radiance Fields)以及神經網路輻射快取(Neural Radiance Cache)等,這些元素共同構成了神經網路渲染中神經網路著色的重要呈現方式。
這裡舉個例子讓大家能夠更簡單地理解神經網路渲染,過去複雜的物品或大量異材質的貼圖往往會佔用相當大的記憶體空間,如果疊加光追的話,計算量將會更大。然而,得益於神經網路渲染技術中的神經網路材質功能,這一問題得到了顯著改善。開發者可以先在離線渲染出物品的光照資料,然後再用這些資料訓練一個小的AI模型,遊戲執行時只要實時呼叫這個AI模型當場推理就好了,這樣就能還原出想要的光照效果了,再配合神經網路紋理壓縮技術,就能顯著降低實際生成的材質資料量,從而在佔用更少顯示記憶體的同時,實現了細節更豐富的材質表現,達到了實時生成如電影般細膩素材的效果。
目前神經網路渲染技術已經得到了微軟的大力支援,未來也將會加入DirectX中,玩家能夠體驗到更真實的遊戲世界。
而在硬體層面,由於神經網路渲染的加入,Blackwell架構的SM單元相較於RTX 40系的Ada架構還是有不小變化的,Ada架構內的SM內,SM單元會拆分成一半的CUDA專門用於處理FP 32(單精度浮點數),另一半則依需求動態調整去處理FP32和INT32(32位整數)。而在Blackwell架構上,SM單元則改成了CUDA核心可以完全依需求動態處理FP32和INT32的形式。
另外一個改進是,過往的著色工作往往只有SM單元的Shader在處理,而Blackwell架構上引入了神經網路渲染以後,使得Blackwell架構上的第五代Tensor核心也能共同分擔著色工作,大大提高了著色效率。
這樣改進的好處是,Blackwell架構能夠進一步針對神經網路渲染工作進行排序,即把傳統的著色工作分配給Shader,而需要動用神經網路渲染的工作負載則可以給到Tensor核心上,兩種核心同時運用,效率最高可以提升2倍之多。並且得益於Tensor核心也加入了可程式設計渲染管線,現在開發者或API也能更好地呼叫Tensor核心,未來遊戲內我們能見到的AI技術勢必越來越多。
先進的AI管理處理器
此外,AI的應用也越來越多,不僅遊戲中應用AI技術,現在連可程式設計渲染的過程裡也引入了AI,因此如何去分配顯示卡內部多樣化工作就成了一個問題。如過往顯示卡在開啟DLSS玩遊戲時,其中應用到的語言模型和遊戲引擎需要同時與GPU的不同核心互動,生成遊戲幀,但是往往很難做到每一幀都有一致的生成時間,抑或者是遊戲AI對話的響應不夠及時,這些情況都會造成遊戲體驗不友好。
而Blackwell架構為了解決這一問題,引入了AI管理處理器(AMP)。它能夠實時排程資源,確保在神經網路渲染、幀生成和 AI 驅動的遊戲互動中實現智慧化的任務分配。這種設計不僅帶來了更高效的效能輸出,還讓顯示卡在遊戲渲染和 AI 運算之間實現了絕佳的平衡,確保幀的間隔均勻,對話型別的AI能夠及時響應,玩家的遊戲體驗一致效能夠比較好地保障。
技嘉GeForce RTX 5080 GAMING OC 魔鷹 16G顯示卡,產品介紹:
作為NVIDIA顯示卡的核心合作伙伴,技嘉首批上市的RTX 5080產品共有五款,包括:旗艦產品(AORUS GeForce RTX™ 5080 MASTER ICE 16G與AORUS GeForce RTX™ 5080 MASTER 16G)、SFF-RAEDY產品(GeForce RTX™ 5080 AERO OC SFF 16G與GeForce RTX™ 5080 WINDFORCE OC SFF),以及本文的測試物件——GeForce RTX 5080 GAMING OC 魔鷹 16G。
除了遵循NVIDIA的外封設計規範,顯示卡的外包裝還融入了技嘉GAMING系列產品的獨特設計元素。中央位置印有極具機械質感的“G”字,以及隱約可見的“GAMING”字樣,既提升了視覺衝擊力,又強調了技嘉GAMING系列產品“追求卓越”的品牌調性。
外包裝背面是技嘉RTX 5080魔鷹顯示卡的幾大亮點:風之力散熱系統、RGB幻彩光輪、金屬背板加固結構、仿生風扇設計、大型均熱板,以及背部穿透鏤空散熱等。
原廠OC設定、16GB大容量視訊記憶體、風之力散熱,以及4年有限保修(需網上註冊)
在使用技嘉RTX 5080魔鷹顯示卡之前,務必撕掉其保護封條以及背部金屬部分的透明保護膜。
從外觀設計來看,新一代的RTX 50系列技嘉GAMING產品顯著增強了“G”元素的運用。這不僅體現在風扇中心的貼紙上,顯示卡右上角也特意加入了GAMING的“G”標識,從而提升了產品的辨識度和美觀度。同時,這也滿足了年輕使用者對個性化需求的追求。
技嘉RTX 5080魔鷹顯示卡整體設計擺脫了上代RTX 40系列GAMING產品中的“圓弧”的設計,兩側的金屬角處理讓整塊顯示卡更顯硬朗,配上豐富的直角線條、凹槽以及三把大型風扇的搭配,營造出一種強化型機甲金屬的風格,更具個性,更顯張揚。
風之力散熱系統無疑是技嘉RTX 5080魔鷹顯示卡的一大亮點。此次,該散熱系統融合了多項尖端技術,包括新一代導熱墊、仿生風扇配合正逆轉功能、超導熱管設計、大面積均熱板、風扇啟停功能以及進氣格柵等,共同為顯示卡提供了卓越的散熱效能。
風扇葉片採用了新一代仿生風扇,其葉片設計汲取了鷹翼的空氣動力學原理,顯著減少了風阻和噪聲;在保持低噪音水平的同時,風壓可提升至53.6%,風量增加12.5%。
為了降低相鄰風扇之間的相互干擾,技嘉RTX 5080魔鷹顯示卡配備了三把採用正反轉設計的風扇,其中央風扇的旋轉方向與兩側風扇相反。此外,這三把風扇均支援智慧啟停技術,在負載較低時能夠自動停止轉動,從而實現近乎無聲的執行體驗。
凹槽形成一個機構散熱孔即時感
GAMING無處不在
顯示卡肩上的金屬質感拉滿
同時,技嘉RTX 5080魔鷹顯示卡的背面延續了尾部的貫穿式通風設計,擁有大面積的開孔,使得風扇可以直接吹透散熱器主體,從而增強散熱效果。
背部的金屬板起到加強和保護顯示卡的作用,防止顯示卡PCB長期受力而發生形變。
顯示卡的供電介面經過內收設計,有效防止了因介面過高導致無法安裝側板的問題,從而提升了顯示卡安裝的相容性。此外,供電介面還配備了獨立的LED指示燈,當供電連線未完成時,LED燈會亮起以示警示,幫助防止意外情況的發生。
隨顯示卡附著的3*8Pin轉12VHPWR供電轉換線
PCIe Gen5金屬插槽
技嘉RTX 5080魔鷹顯示卡配備了3個DP 2.1b介面和1個HDMI 2.1b介面,能夠輕鬆支援4K 480Hz和8K 165Hz的超高解析度與重新整理率,甚至能夠滿足多屏高解析度和高重新整理率的配置需求,迎合了不同玩家的喜好。
關於拆解過程,由於某些特定原因,我們無法在此展示。然而,根據技嘉官方提供的資料,這款散熱器採用了大面積散熱片、均熱板以及多熱管的複合式散熱設計。GPU直接與均熱板相連,而視訊記憶體和供電模組則透過新一代導熱墊進行輔助散熱。
裝機展示
採用頂部滑動式側板設計,並嵌入GIGABYTE LOGO,底部設有ARGB燈效區域。
三環RGB燈效
側裝效果依舊令人滿意,尤其方便的是反裝12VPWR介面,輕鬆實現供電介面的連線與拆卸。
測試平臺介紹:
開始效能測試前介紹一下本次的測試平臺, CPU使用的是目前毫無爭議的遊戲神U——AMD Ryzen R7-9800X3D。
主機板則是同樣來自技嘉的X870 AORUS ELITE WIFI7小雕主機板,重新整理到最新版本BIOS的同時,在BIOS中開啟X3D模式,以便獲得更好的效能表現。
而記憶體,我們這次選用的是24G×2套條的T-FORCE XTREEM ARGB 幻鏡DDR5記憶體,在這塊主機板上直接開啟AMD EXPO即能輕鬆達成DDR5-8000 C38的成績,確保這張顯示卡能夠釋放全部效能。
技嘉智慧管家(GCC)介紹
從技嘉官網下載並安裝GCC之後即可以正確識別出X870 AORUS ELITE WIFI7小雕主機板與 GeForce RTX 5080 GAMING OC 16G 魔鷹顯示卡,還能控制整機RGB燈效。
技嘉RTX 5080魔鷹顯示卡自帶風扇啟停技術,可以自定義風扇轉速,以及關閉風扇啟停。
至於效能頁面更是可以對技嘉RTX 5080魔鷹顯示卡進行核心Boost頻率、GPU電壓、電源上限、溫度上限,以及視訊記憶體頻率的設定,方便大家對顯示卡進行超頻。當然普通玩家更是可以透過OC Scanner掃描進行自動超頻,以及獲得更好的顯示卡效能表現。
理論效能測試
在測試環節,我們首先關注3DMARK的理論效能指標。在FireStrike系列測試中,技嘉RTX 5080魔鷹顯示卡的表現引人注目,其效能超出RTX 4080 SUPER約27%,與RTX 4080相比,領先優勢更是擴大至35%。在以DX12為基準的Time Spy測試中,技嘉RTX 5080魔鷹顯示卡的得分為33526,相較於RTX 4080 SUPER或RTX 4080顯示卡,均能保持約20%的領先優勢。由此可見,效能的提升是相當顯著的。
DLSS 4專項測試
看完了理論效能部分的測試,接著我們再來看看本次RTX 50系顯示卡最“頂”的升級,DLSS 3在RTX 40系顯示卡上引入了幀生成技術,能夠依靠AI在兩幀之間生成一幀AI幀,從而實現幀數的翻倍,用過的玩家都說好!不過由於每生成一個新的幀都需要光流加速器和 AI 模型參與,因此生成多幀的開銷相當高昂,而過高的效能開銷會帶來瓶頸,導致幀率提升受限。
而這次DLSS 4全新升級,引入了多幀生成技術,它可以利用 AI 為每個渲染幀額外生成多達3幀!相比傳統渲染的方式,能夠最多實現8倍的效能提升。並且每次渲染額外幀只需要幀生成AI模型執行一次,就能輸出三幀畫面,因此無論是對效能、視訊記憶體的開銷還是延遲都比之前要好了許多。
另外,由於多幀生成技術,輸出的幀多了,要給每一幀都安排一個合理的間隔重新整理才能讓觀感更好。因此NVIDIA還引入了專屬的Flip Metering來代替CPU Pacing,它將幀節奏邏輯轉移到顯示引擎,讓GPU能夠更精確地管理顯示時間,儘可能地將每一幀畫面的生成時間保持一致,從而提高整體遊戲視覺的流暢感。不過由於Flip Metering是硬體級的控制器,因此DLSS 4的多幀生成目前只有RTX 50系顯示卡支援。
同時DLSS 4 還引入了圖形行業首個 Transformer 模型實時應用。熟悉AI的應該對它很熟悉了,它在AI生成領域已經應用多年了。基於Transformer架構的 DLSS 超解析度和光線重建模型,相比之前DLSS使用的(CNN)模型來說,具備2倍的引數量和4倍的計算量。在遊戲場景中,能夠提供更高的穩定性、更少的拖影、更高的細節和更強的抗鋸齒能力,使畫面更加清晰、流暢和逼真。
不過雖然DLSS 4的多幀生成功能是RTX 50系顯示卡的獨佔功能,但新的Transformer模型將適用於所有GeForce RTX顯示卡。並且根據NVIDIA的說法,超過75款遊戲和應用將在GeForce RTX 50系列開售時支援DLSS 4的全新DLSS多幀生成功能,包括《賽博朋克2077》《戰神:諸神黃昏》《心靈殺手2》《霍格沃茲之遺》等,《黑神話:悟空》也將於今年晚些時候升級支援 DLSS4的多幀生成。隨著時間的推移,支援DLSS 4的遊戲和應用數量將不斷增加。
簡單介紹完,我們再看看DLSS 4的理論表現如何,還是經典的3DMark測試。不得不說技嘉RTX 5080魔鷹顯示卡搭配上DLSS 4有如神助,幀數再度實現了飛躍!
其中2K解析度下,開關前後效能差距足足有4倍有多,4K解析度就更誇張了,開關幀數差距得有6倍,即便是對比DLSS 3的話,幀數也能提升69%,接近翻倍的體驗了。最離譜的還要數8K,要知道RTX 40時代,次旗艦顯示卡玩8K遊戲是在玩PPT的狀態,而現在技嘉RTX 5080魔鷹顯示卡可以做到156 FPS,很是流暢了。
《霍格沃茲之遺》
經過體驗,《霍格沃茲之遺》這款遊戲的最佳化表現相當出色。在4K解析度和光線追蹤均調至最高設定的情況下,使用技嘉RTX 5080魔鷹顯示卡,即便不啟用任何超取樣技術,平均幀率也能達到79 FPS,確保了遊戲的流暢執行。當啟用DLSS 3效能模式後,幀率進一步提升至206 FPS,遊戲體驗變得異常流暢。而開啟DLSS 4模式時,幀率更是驚人地達到了360 FPS,這已經遠遠超出了當前大多數顯示器的高重新整理率範圍。與原生4K設定相比,效能提升了超過4.5倍。在實際遊戲過程中,無論是1%最低幀率還是延遲表現都相當優秀,特別是延遲,甚至比原生解析度下還要低,帶來了更佳的操控感。
《星球大戰》
第二款遊戲我們測試的是《星球大戰》,一樣你能在設定中看到其幀生成功能已經支援×4的選項,也就是DLSS 4多幀生成功能。不過這項功能是RTX 50系獨佔,想要體驗最強的遊戲效能,那就趕緊升級最新的技嘉RTX 5080魔鷹顯示卡!
在這款遊戲中,DLSS 4的實際效果令人印象深刻。在4K原生解析度下,技嘉RTX 5080魔鷹顯示卡的平均幀率僅為20 FPS,延遲也高得令人擔憂。然而,當啟用DLSS 4效能模式後,遊戲的平均幀率飆升至173 FPS,遊戲體驗瞬間變得如絲般順滑。與原生4K相比,效能提升了大約8.5倍。即便是與DLSS 3的97 FPS相比,效能也幾乎翻了一番,這確實是一個令人滿意的效能提升。
《賽博朋克2077》
下一款遊戲則是有“顯示卡殺手”之稱的《賽博朋克2077》,有一說一,《賽博朋克2077》的設定頁面就更豐富,除了能夠設定DLSS 4的多幀生成外,還可以切換DLSS 4的另一個特性——Transfomer Mode,據說能夠讓畫質更清晰,同時還能解決此前的拖影問題,對玩家可以說是一大利好。
接下來,讓我們深入瞭解DLSS 4的效能表現。作為“顯示卡殺手”,DLSS 4對顯示卡的挑戰確實非同小可。在最高畫質與路徑追蹤的設定下,即便是效能強勁的技嘉RTX 5080魔鷹顯示卡,其表現也僅為19 FPS,幾乎難以提供流暢的遊戲體驗。然而,當啟用DLSS 3技術後,遊戲的幀數躍升至106 FPS,流暢度顯著提升。進一步開啟DLSS 4,技嘉RTX 5080魔鷹顯示卡的表現更是驚人,達到了189 FPS,效能提升了驚人的8.9倍。更令人印象深刻的是,1%Low的幀數幾乎與DLSS 3下的平均幀數持平,這意味著遊戲中的掉幀現象極為罕見,整體穩定性極高。
《漫威爭鋒》
如果你想玩的遊戲還不支援DLSS 4,那也不用擔心,NVIDIA App還提供DLSS 4 Override功能,說人話就是能夠讓遊戲強開DLSS 4,這裡我們以《漫威爭鋒》為例,在NVIDIA App中簡單設定,就能將幀生成調至“4X”,一鍵實現多幀生成。
經過實際測試,啟用多幀生成功能確實帶來了顯著的效能提升。技嘉RTX 5080魔鷹顯示卡在4K全高設定下,未啟用超解析度技術時,幀率僅為76 FPS,勉強能夠流暢執行遊戲。然而,當開啟DLSS 3技術後,幀率飆升至190 FPS,相較於原生解析度,效能提升了超過一倍。若進一步啟用DLSS 4多幀生成技術,效能提升更是驚人,達到了原生解析度的4倍以上,實現了332 FPS的驚人幀率,輕鬆步入電競級3A遊戲體驗。此外,延遲表現同樣卓越,原生解析度下的延遲為26ms,而啟用DLSS 4後,延遲進一步降低至23ms,使得遊戲響應更加迅速,玩家體驗更加流暢。
總的來說,DLSS 4多幀生成功能的出現,毫無疑問讓玩家的遊戲體驗又上了一個臺階。對比上代RTX 40系的DLSS 3幀生成功能,再度實現了幀數的飛躍。同樣的畫質設定,RTX 5080的表現遙遙領先於RTX 4080,實測在上面提到的四款遊戲中,開啟DLSS 4的GeForce RTX 5080,幀數幾乎是RTX 4080的翻倍!並且這還不是靠硬體的提升,全靠“科技與狠活”!
另外,值得一提的是,與DLSS 4一起到來的還有全新的NVIDIA Reflex 2技術。延遲一直是電競中繞不開的話題,玩家的每個動作都會經過複雜的計算,再在螢幕上渲染,其中的每一步都會增加延遲。雖然延遲往往只有幾十毫秒,但是你卻能明顯地感覺到遊戲的不流暢、卡頓。
為了儘可能地降低延遲所帶來的不良遊戲體驗,NVIDIA釋出了NVIDIA Reflex技術,它可以使GPU和CPU同步,確保最佳響應速度和低系統延遲。目前NVIDIA Reflex已整合到超過100款遊戲中,可以將PC延遲降低50%。
而GeForce RTX 50系顯示卡再度升級,帶來了NVIDIA Reflex 2技術。它結合了Reflex低延遲模式與Frame Warp技術。它可以把最新的滑鼠輸入指令同步給渲染幀,及時更新渲染的遊戲幀並在渲染幀被髮送到顯示器之前獲取最新的滑鼠資訊,透過重新整理渲染的遊戲幀以進一步減少延遲,將PC延遲進一步降低多達75%。
另外,Frame Warp的加入,能夠進一步將延遲降低。當一個幀被GPU渲染時,CPU會根據最新滑鼠或手柄輸入計算工作流中下一幀的視角位置。Frame Warp從CPU取樣新的視角位置,然後將GPU剛才渲染的幀扭轉到最新的視角位置。在渲染幀被髮送到顯示器之前,在儘可能最短的時間進行扭轉操作,確保螢幕上反映最新滑鼠輸入。
而當Frame Warp轉移遊戲畫素時,影象中可能會產生縫隙撕裂、鏡頭位置的變化會讓遊戲場景中顯示新的部分。NVIDIA則開發了一種最佳化了延遲的預測渲染演算法,該演算法使用來自先前幀的視角、顏色和深度資料,對這些撕裂空白的畫素進行準確的影象修復。玩家可以透過更新的視角看到沒有撕裂的渲染幀,並降低了改變遊戲內視角位置而產生的延遲。說人話就是現在NVIDIA Reflex 2還可以根據上一幀的資訊去腦補一些空白的畫素,有種無中生有但你又看不出來的感覺。
首發支援NVIDIA Reflex 2技術的遊戲是《THE FINALS》以及《無畏契約》,後續我們也會第一時間帶給大家該技術的詳細評測。
遊戲效能測試
在見識了DLSS 4的卓越效能之後,我們接下來將目光轉向傳統遊戲效能的評估。一如既往,我們首先進行3DMark的DLSS 3效能測試。技嘉RTX 5080魔鷹顯示卡在2K解析度下的效能相較於RTX 4080或RTX 4080 SUPER提升了約29%,而在4K解析度下,啟用DLSS 3後,效能優勢也大致保持在29%的水平。考慮到這三款顯示卡在CUDA核心數量上的微小差異,我們不得不對Blackwell架構的強大效能表示讚歎。
當然理論效能終歸是紙上談兵,還得進遊戲裡實際測試一下才知道技嘉RTX 5080魔鷹顯示卡的實力。這裡我們選取了11款遊戲進行測試,包含光追及光柵效能方面的測試,而遊戲畫質方面均全部選擇最高畫質,光追設定部分,如有則採用最高。
在實際測試中,技嘉RTX 5080魔鷹顯示卡在4K解析度下輕鬆應對了大多數遊戲,尤其是在DLSS技術的加持下,實現4K@144Hz的電競體驗毫無壓力。即便是將《黑神話:悟空》的設定調至全高,這款顯示卡仍能提供87 FPS的流暢體驗,幾乎觸及了高重新整理率的極限。可以預見,隨著DLSS技術的進一步升級,幀數的提升將更為顯著。在效能對比方面,技嘉RTX 5080魔鷹顯示卡在眾多遊戲中表現出色,相較於RTX 4080 SUPER,其效能大約高出20%,而與RTX 4080相比,效能領先幅度更是可以達到25%以上。
影象影片創作效能測試
遊戲測試完成後,接下來讓我們關注創作者們所關心的生產力效能。在PCMark10 Extended測試中,技嘉RTX 5080魔鷹顯示卡在遊戲和數字內容創作方面的表現更為出色,相較於RTX 4080,其效能提升了大約7%和12%。然而,在生產力測試方面,成績略顯遜色,這可能是因為當前驅動程式尚未完全最佳化。
辦公軟體測試中,技嘉RTX 5080魔鷹顯示卡表現也不錯,整體效能可以領先4%左右,其主要領先在Excel、PPT以及Outlook三項,不過有一說一,這三張卡用來辦公只能說確實有些浪費了,用它們開啟這些軟體,差距應該都是微乎其微的。
在Adobe以及達芬奇的Benchmark測試裡,GeForce RTX 5080整體相比RTX 4080或RTX 4080 SUPER也有小幅提升,不過提升比較大的還是影片編輯部分,究其原因還是因為這一代RTX 5080再度對編碼器進行了升級,不僅編解碼的效率更高,同時支援的格式也更豐富。
例如在達芬奇和PR的測試中,技嘉RTX 5080魔鷹顯示卡領先RTX 4080約7%~17%,還是非常誇張的。同時在PS以及AE裡也有小幅的效能提升,大約在4%~12%之間,總體來說就是內容創作的效率更高了。
3D渲染創作效能測試
看完了影象影片方面的創作,我們再把目光投向3D渲染以及工業領域的軟體中,看看RTX 50系顯示卡又有怎樣的精彩表現。還是熟悉的朋友Blender以及V-Ray,在這兩款軟體中,技嘉RTX 5080魔鷹顯示卡的表現也是大殺四方,其中前者基本上能領先RTX 4080 SUPER達5%~12%,而後者就誇張了,對比兩張40系卡,甚至可以領先至86%。
再看看另外一款渲染器,D5 Render是一款基於DXR和光線追蹤技術構建的GPU渲染器。正因為其有光線追蹤技術,其渲染的畫面相當出色。這款軟體在RTX 40系顯示卡測試時支援了DLSS 3幀生成,而現在隨著RTX 50系顯示卡的釋出,它也可以透過NVIDIA App的方式支援最新的DLSS 4多幀生成功能。
實測技嘉RTX 5080魔鷹顯示卡在開啟DLSS 4以後,整個渲染預覽的介面變得絲滑流暢,幀數基本在226 FPS附近,而對比不開DLSS時,僅59 FPS的表現來看,效能幾乎是提升了4倍以上。即便是面對RTX 40系的DLSS 3,也一點不虛,效能優勢也有50%以上。
再看看工業領域的表現,SPEC2020能夠反映顯示卡的工業能力,在多項測試中技嘉RTX 5080魔鷹顯示卡依舊傲視群雄,對比RTX 4080平均有30%的提升,而對比RTX 4080 SUPER也在25%左右,這個效能提升還是很可觀的,甚至有些超乎想象。
NVIDIA編解碼測試
接下來的測試則是介紹RTX 50系顯示卡的編解碼器,GeForce RTX 50系列顯示卡上換裝了第9代NVENC編碼器與第6代NVDEC解碼器,在影片規格上支援AV1 UHQ(超高畫質 AV1)與MV-HEVC(多視角HEVC)編解碼。同時由於GeForce RTX 50系列顯示卡還升級支援DisplayPort 2.1 UHBR20輸出,單一通道支援20Gbps頻寬,因此使用者可以體驗到令人驚歎的HDR視覺效果、超高解析度和更流暢的遊戲體驗。
這裡我們直接使用NVIDIA提供的4K60片源與工程檔案分別測試AV1、H.265以及H.264下的編碼匯出時間。實測同一段素材下,GeForce RTX 5080匯出三段影片的時間分別是9秒、10秒以及13秒,效率分別比RTX 4080或RTX 4080 SUPER快了111%、90%以及54%。
同時,我們也對匯出的不同格式的影片進行了畫質對比,實測AV1編碼的影片在畫質上與H.265或H.264也沒有明顯差距,無論是在文字、人像還是建築等畫面裡,三者的畫質可以說是伯仲之間,如果不特地標註其格式,一般人很難用肉眼分辨出來。隨著目前越來越多影片網站、剪輯軟體和硬體廠商的推動,未來AV1勢必會成為下一個最受歡迎的格式。
值得一提的是,GeForce RTX 50系顯示卡還能夠支援4:2:2色度取樣的影片編解碼,這將節省CPU的負擔,加快創作速度。上面的圖表裡也可以看到我們的測試成績,實測匯出時間會比上代顯示卡快不少,畢竟RTX 40系顯示卡不支援該功能,僅支援4:2:0色度取樣,如果一定要4:2:2匯出只能靠CPU軟解。
4:2:2色度取樣的影片檔案採用的是YUV顏色格式,與儲存紅色、綠色和藍色(RGB)值不同,顏色被儲存為亮度Y、藍差色度U和紅差色度V。在這類影片中,影片的完整亮度將被保留,而原始色度資訊只保留一半,因此相比4:4:4的影片,其影片幀資料量僅有不到三分之二,而相比4:2:0的影片又能提供兩倍的顏色解析度,因此創作者採用這種格式拍攝,能夠在保留更多色彩資訊的同時還能減少檔案大小和頻寬需求。
AI效能測試
AI是老黃在CES上談及的重點,而RTX 50系顯示卡上針對AI效能的改進則是加入了對FP4精度模型加速處理的支援,它相比此前RTX 40繫上的FP8精度,能夠實現更快的生成速度,同時視訊記憶體佔用也更低。
不信你看,我們用UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA進行測試。在均使用FP8精度模型時,技嘉RTX 5080魔鷹顯示卡能夠做到13.705s生成一張圖,而RTX 4080或RTX 4080 SUPER則要17秒以上;而切換到FP4精度模型後,速度才真正拉開了差距,其中技嘉RTX 5080魔鷹顯示卡生成圖片的速度能夠提升到6.742秒一張,效率翻了一倍不止。而RTX 4080或RTX 4080 SUPER的生成時間則不降反升,RTX 5080對比它們的效能,拉大到了3.5倍以上。
並且FP4精度模型生成的圖片也非常能打,從下圖就能看出來,其與FP8生成的圖片幾乎沒有區別,無論是對關鍵詞的理解還是影象的質量,都非常有保障,新時代AIGC玩家的最佳選擇了。
再看看GeForce RTX 5080在Stable Diffusion中的表現如何,還是用UL Procyon進行測試,在比較輕鬆的SD 1.5文生圖測試裡,無論是採用FP16精度模型還是INT8精度模型,RTX 5080的表現都展現了旗艦級顯示卡應有的實力,特別是在INT8精度下,生成一張圖的速度僅需0.54秒,效率比上代顯示卡快了48%,已經接近一倍了。而即便是在壓力比較大的SDXL中,優勢也非常明顯,生成一張圖的速度為8.439秒,同樣領先RTX 4080或RTX 4080 SUPER達1~2秒。
在AI文字生成測試中,技嘉RTX 5080魔鷹顯示卡在一眾大語言模型裡同樣表現出眾,我們用MLPerf Client v0.5大語言模型進行測試,它是基於meta的Llama 2 7B開源LLM打造,涵蓋了四項AI任務,分別是內容生成、創意寫作以及對兩份不同長度文字進行總結摘要。實測技嘉RTX 5080魔鷹顯示卡在每一項中都表現出了絕對的統治力,各項領先幅度均在17%~19%左右。
接著我們又用UL Procyon的AI Text Generation測試了更多的大語言模型,技嘉RTX 5080魔鷹顯示卡的優勢依舊十分明顯,在以Llama 3.1 7B LLM打造的Phi-3.5測試中,新一代顯示卡取得4550分的成績,相比RTX 4080提升了17%,相比RTX 4080 SUPER則提升了7%;將引數擴大至Llama 2 13B的測試中,技嘉RTX 5080魔鷹顯示卡的表現更加亮眼,4831分的表現已經離RTX 4090不遠了,對比效能的話,則可以領先RTX 4080約29%,領先RTX 4080 SUPER 23%以上。
功耗與溫度表現
最後一項測試烤機,這也是許多玩家關注的重點,畢竟雙槽卡的厚度但是塞下了360W的核心,不免讓人擔心它的溫度表現。不過實測Furmark燒機10分鐘後,得益於技嘉RTX 5080魔鷹顯示卡出色的風之力散熱系統,核心溫度並不高,僅有63.1度,視訊記憶體溫度也是58度,此時顯示卡的最大功率為359.98 W,已經完全頂著TDP的上限了,風扇轉速則是1647RPM,噪聲還真的少。
橫向對比RTX 4080或RTX 4080 SUPER時可以看到,雖然技嘉RTX 5080魔鷹顯示卡的TDP提升了,不過整體的烤機功耗並不算高,同時雙槽卡在減低了厚度的情況下,核心與視訊記憶體的溫度控制確實不錯,屬於是非常驚喜了。這對ITX玩家可以說是一大喜訊,現在小主機也能有強效能!
評測總結
對於追求極致遊戲體驗的高階玩家來說,技嘉RTX 5080魔鷹顯示卡無疑是一個不錯的選擇,目前售價8299元。它能夠在高解析度、高畫質下暢玩各種 3A 大作,為玩家帶來沉浸式的遊戲感受。對於從事創意設計工作的專業人士,如影片編輯、3D 建模師等,這款顯示卡強大的圖形處理能力和加速效能,能夠顯著提高工作效率,為創作提供更多的可能性。
無論是遊戲實測還是創意設計工作中的表現都可圈可點,技嘉RTX 5080魔鷹顯示卡能夠滿足大多數玩家和創作者對高效能顯示卡的需求。獨特的風之力散熱設計有效控制了顯示卡溫度,保證了顯示卡在高負載下的穩定執行,智慧啟停技術和 RGB 燈效也為使用者帶來了更好的使用體驗和個性化選擇。
然而,這款顯示卡也並非完美無缺,較大的體積可能會給一些小型機箱使用者帶來安裝難題。對此技嘉也推出了符合SFF-RAEDY的產品(GeForce RTX™ 5080 AERO OC SFF 16G與GeForce RTX™ 5080 WINDFORCE OC SFF),這樣就不擔心安裝問題了。