隨著基於 Blackwell 架構的 GeForce RTX 50 系列遊戲顯示卡的推出,諸多廠商的遊戲顯示卡也逐步上市,本期我們來聊聊索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡。作為 RTX 50 系列的中高階型號,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡搭載了全新的 Blackwell 架構,支援 DLSS 4 技術和第五代 Tensor Core,在遊戲效能和 AI 計算方面都有顯著提升。無論是追求極致畫質的 3A 大作,還是需要高效計算的創作任務,這款顯示卡都能輕鬆應對。接下來,我們將從效能、散熱、設計等多個維度對這款顯示卡進行詳細評測。
索泰近幾年在高階和旗艦顯示卡產品上採用了雙 BIOS 的激進效能排程。為了釋放索泰 GEFORCE RTX 5080 16GB SOLID OC 的全部效能,本次的測試平臺配置如下:
一、外觀設計
索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡整體設計風格低調硬朗,黑金配色及硬朗的卡身線條、凌厲的散熱鰭片,使整體呈現出一種工業風美學。
黑色中心帶有高亮 Logo 的環刃風扇,於光影之間閃爍出迷人的光澤,盡顯高階質感。而低飽和度的灰色金屬裝甲,憑藉精細的柵條佈局,營造出豐富的層次感,彰顯出濃郁獨特的工業風格。
值得一提的是,全新設計的環刃風扇部分引入了環形倒流風罩,這一創新設計不僅最佳化了扇葉曲率,還增強了結構穩定性,在降低風噪的同時顯著提升風量與風壓,進而大幅提高散熱效率。
尺寸方面,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡的三圍分別是 348mm x 121.9mm x 69.1mm(不含擋片),淨重約 2.2kg 左右。
索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡背板採用硬核工業風設計,右側大面積斜切矩形開孔頗具特色。
透過鏤空開孔,能夠看到卡身內部密集的散熱格柵,還有看不到的巨型 VC 均熱板和鍍鎳複合熱管加持,散熱設計為貫穿式散熱,能夠最大化的增加散熱效率。
顯示卡兩側配備了厚實的散熱裝甲,並在靠近背板的一側新增了金色鋁合金加固條。頂部側面帶有鏤空字元的“ZOTAC GAMING”標誌及旁邊的索泰 Logo 均支援 RGB 燈效,亮機後可展現出炫酷多彩的燈光效果。
居中位置為幻光同步介面、雙 BIOS 開關以及 16pin 顯示卡供電介面。其中幻光同步介面配合隨箱附送的專屬線材連線至主機板 ARGB 埠,用來控制顯示卡燈光,而雙 BIOS 開關可提供加速模式和寂靜模式兩種風扇策略預設,兼顧滿血效能和靜音表現。
I/O 介面方面,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡提供了 3 個 DP2.1b 介面以及 1 個 HDMI 介面,擋板中間還印有一個白色的索泰 Logo。
二、架構解析
NVIDIA 全新推出的 GeForce RTX 5080 顯示卡採用革命性 Blackwell 架構設計,透過深度整合 AI 運算單元與圖形管線,突破傳統渲染技術的物理限制。該架構創新性地構建了神經網路渲染體系,使單幀畫面生成效率較傳統方式提升 400%,成功解決畫面品質與幀率同步提升的技術瓶頸。
在計算架構方面,Blackwell 引入了第五代混合精度計算技術。新一代 Tensor Core 支援 FP4 自適應量化,透過智慧資料壓縮演算法,視訊記憶體佔用降低了 56%,同時保持了模型的計算精度。這一改進使得 AI 推理速度提升至原來的兩倍。實際測試表明,在 Stable Diffusion XL 等 AI 影象生成任務中,處理耗時僅為 Ada 架構的 38%,大幅提升了效率。
光線追蹤效能也得到了顯著提升。重構後的 RT Core 採用了並行光線-幾何體交叉檢測機制,三角形相交檢測速度達到初代 Turing 架構的 8 倍。配合新型 BVH 壓縮演算法,視訊記憶體頻寬佔用減少 25%,使得單場景實時渲染的多邊形數量超過 50 億。在《賽博朋克 2077》全極致設定下,路徑追蹤幀率相比 RTX 4080 提升了 170%,為玩家帶來了更加逼真的光影效果和流暢的遊戲體驗。這些改進共同推動了 Blackwell 架構在圖形處理與 AI 計算領域的全面升級。
儲存子系統同步升級至 GDDR7 標準,應用 PAM3 三重脈衝調製技術,每個時鐘週期可傳輸 1.5bit 資料,在 28Gbps 基礎速率下實現 672GB/s 視訊記憶體頻寬,功耗較 GDDR6X 降低 18%。配合 PCIe 5.0x16 介面與第四代 NVIDIA 視訊記憶體壓縮技術,4K 紋理載入速度提升至毫秒級響應。
這項架構革新標誌著圖形處理器正式進入智慧渲染時代,透過將 AI 運算深度嵌入圖形管線,使 8K 全景光線追蹤這類曾受限於摩爾定律的技術得以實用化。NVIDIA 官方資料顯示,Blackwell 架構在 3DMark Speed Way 測試中取得較前代產品 215% 的效能增幅,AI 加速效能更達到驚人的 570% 提升。
具體到產品規格上,索泰 GEFORCE RTX 5080 16GB SOLID OC 基於最新一代 GB200-400-A1 核心和 TSMC 4N 架構製程工藝打造,內有 10752 個 CUDA 核心、336 個 Tensor 核心、84 個光追核心、336 個紋理單元、128 個 ROP 單元,核心規模相比 RTX 4080 提升約為 10.5%,單元內的 SM 和 TPC 群組數量也均有增加,視訊記憶體方面升級為 256-bit 16GB GDDR7,頻寬來到了 960GB/s。TGP 功耗為 360W,相比上代 RTX 4080 增加了 40W。
三、理論跑分
接下來就進入理論測試環節,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡屬於中高階定位,自帶雙 BIOS 切換和超頻功能,所以測試之前必須先介紹一下索泰官方這次更新的 FireStorm 超頻應用,它允許使用者實時檢視顯示卡狀態,並進行自定義效能調節和雙 BIOS 切換。
進入主頁,FireStorm 應用整體採用了黑金配色,預設展示效能標籤頁內容。風扇標籤頁中提供了自動和手動風扇調節模式,也可以透過曲線模式更精細化調節風扇轉速曲線。右側還有外觀部分提到的雙 BIOS 切換開關,切換時會彈出提示彈窗,告訴使用者當前模式狀態及要切換的模式,確認切換模式則需要重啟系統生效。
此外,FireStorm 應用還給到了使用者更加全面的顯示卡資訊展示和燈效控制,設定標籤中還允許使用者進行介面的一些人性化設定。具體的功能大家可以在購買索泰 50 系顯示卡後自行體驗,這裡就不展開了。IT之家拿到的版本是 5.0.0.001C,官網正式版的 FireStorm 版本號可能會與我們有所區別。
先看烤機,單烤甜甜圈 10 分鐘,GPU 的核心溫度穩定在 66.2℃左右,顯示卡頻率 2752MHz,功耗穩定在 369W 左右,和公版保持一致。
在 3DMark Time Spy DX12 測試中,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡分數達到了 32797 分,比公版的 32022 要高出接近 800 分,作為對比 GeForce RTX 4080s 公版的分數為 29220 分,提升約為 12%,提升幅度較大。
而在 3D Mark Time Spy Extreme DX12 測試中,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡分數達到了 16412 分,作為對比 RTX 4080s 公版的分數為 14541 分,提升幅度約為 13%。
在 3DMark Portal Royal 實時光追測試中,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡的綜合分為 22458 分,作為對比 RTX 5080 公版為 22060 分,RTX 4080s 公版的分數為 18439 分,提升幅度達到了 22%。
從一系列 3D Mark 的測試來看,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡相較於上一代 RTX 4080s 相比 RTX 4080s 各項測試有著 12%-22% 左右的提升幅度。
四、遊戲實測
遊戲測試方面,雖然 NVIDIA 官方宣稱首批支援 DLSS 4 的遊戲高達 75 款,不過考慮到目前能夠順利開啟 DLSS 4 相關選項的遊戲非常有限,所以多數主流遊戲我們依舊測試的是 DLSS 3 和幀生成的表現,再透過《賽博朋克:2077》和《心靈殺手 2》兩款遊戲單獨為大家呈現 DLSS 4 技術的實際表現。
1、《CS2》
首先是《CS2》,在更新升級後效能要求大幅提升的《CS2》中,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡以 4K 解析度 + 高畫質下跑出了 286 幀的遊戲平均幀數,1% Low 幀為也有 138 幀。
而在 2K 解析度 + 高畫質下則跑到了平均 471 幀的遊戲幀數,1% Low 幀提升到 208 幀,遊戲過程中絲毫不會影響發揮。
2、《古墓麗影:暗影》
傳統光柵單機遊戲可以考察一下 RTX 5080 在非光追和 DLSS 時的效能表現:
在 4K 解析度 + 最高畫質下,遊戲平均幀數為 234 幀;
在 2K 解析度 + 最高畫質下,遊戲平均幀數為 297 幀;
3、《極限競速:地平線 5》
《極限競速:地平線 5》有著較為出色的最佳化:
在 4K 解析度 + 極端畫質下,遊戲平均幀數為 152 幀;
在 2K 解析度 + 極端畫質下,遊戲平均幀數為 198 幀;
相比公版 RTX 4080s,4K 和 2K 解析度下的遊戲平均幀數提升分別達到了 22% 和 40%。4、《孤島驚魂 6》
接下來就是光追遊戲了,首先是《孤島驚魂 6》,它對 CPU 的單核效能要求也很高,支援光追和 DLSS。經過實測:
在 4K 解析度 + 極高畫質下,遊戲平均幀數為 159 幀,1% Low 幀 77 幀;
在 4K 解析度 + 極高畫質 + 開啟光追 + DLSS 質量下,遊戲平均幀數為 134 幀,1% Low 幀 51 幀;
在 2K 解析度 + 極高畫質下,遊戲平均幀數為 191 幀,1% Low 幀 53 幀;
在 2K 解析度 + 極高畫質 + 開啟光追 + DLSS 質量下,遊戲平均幀數為 146 幀,1% Low 幀 81 幀;
5、《黑神話:悟空》
接下來就是顯示卡測試繞不開的“眾生平等”之作《黑神話:悟空》了:
4K 解析度 + 影視級畫質 + 30% 超取樣解析度 + 高全景光追,遊戲平均幀數為 53 幀;
4K 解析度 + 影視級畫質 + 30% 超取樣解析度 + 高全景光追 + 幀生成下,遊戲平均幀數為 87 幀;
而切換到 2K 解析度後:
在 2K 解析度 + 影視級畫質 + 30% 超取樣解析度下,遊戲平均幀數為 83 幀;
在 2K 解析度 + 影視級畫質 + 30% 超取樣解析度 + 高全景光追 + 幀生成下,遊戲平均幀數為 128 幀。
五、DLSS 4 遊戲體驗
其實在上一代 RTX 40 系列已經支援的 DLSS 3 技術上,實際效果就已經非常強大了,而 DLSS 4 在 DLSS 3 的技術上,再次提升了幀生成的效能潛力,運用全新的多幀生成技術,結合第五代 Tensor Core 的強大效能,利用 AI 為每個渲染幀生成至多 3 個額外幀,從而大幅提升遊戲的 FPS 水平。
DLSS 4 能夠與光線重建、超解析度和 DLAA 等 DLSS 技術協同,最高可使遊戲幀率提升至傳統渲染方式的 8 倍。玩家在遊戲中啟用 DLSS 4 並搭配 RTX 5080 顯示卡,即可輕鬆享受開啟全景光線追蹤的 4K 高幀率遊戲體驗。
NVIDIA GeForce RTX 50 系列搭載的第五代 Tensor Core 在 AI 處理效能上實現了質的飛躍,相比前代提升了 2.5 倍,顯著降低了遊戲延遲。後續將透過實際遊戲測試展示延遲的具體變化。此外,Blackwell 架構的顯示引擎對 DLSS 4 技術的支援也至關重要,它透過提升畫素處理能力,使 DLSS 4 能夠更好地適應高解析度和重新整理率的需求,最高可將畫素處理能力提升至原來的兩倍。
DLSS 4 技術在模型架構上進行了重大革新。它整合了 DLSS 光線重建、DLSS 超解析度以及 DLAA 等特性,並由首個實時 Transformer 模型驅動。這一模型透過自注意力機制,能夠評估每一幀或多幀畫面中每個畫素的重要性,從而更精準地理解場景中的複雜關係。這種設計不僅提升了生成畫素的穩定性,減少了偽影,還在運動細節和邊緣處理上表現出色,使畫面更加平滑自然。
DLSS 4 技術實現了模型架構的顯著升級,其 DLSS 光線重建、超解析度及 DLAA 特性均基於首個實時 Transformer 模型。該模型透過自注意力操作評估幀中每個畫素的重要性,最佳化場景理解,提升生成畫素的穩定性,減少偽影,並增強運動細節與邊緣平滑度。
《賽博朋克:2077》目前的 steam 測試版已支援 DLSS 4,我們透過它來了解下 DLSS 4 的實際體驗。如果是 4K 解析度 + 超級畫質,不開光追和 DLSS,遊戲平均幀數可以達到 72.92 幀。
開啟幀生成選項後,可以看到下面多出了一個多幀生成的倍率選擇項,即 DLSS Multi Frame Generation,可選擇包括 2x、3x 和 4x 在內的 3 種生成倍率。
我們依次在 4K 解析度 + 超級光追畫質 + DLSS 效能設定下,選擇 2x、3x 和 4x 多幀生成,執行遊戲基準測試,分別得到了 146.11 幀、202.76 幀和 250.73 幀的遊戲平均幀數,2x 和 3x 多幀生成的表現,非常接近 72.92 幀的 2 倍和 3 倍幀數,在 4K 解析度下超 250 幀的超級光追畫質體驗遠超我們的預期,畫面流暢度極高。
接下來進一步切換到超速光追畫質 + DLSS 4 多幀生成時,遊戲平均幀數分別也有 101.99 幀、147.06 幀、186 幀。對於硬體效能要求極高的一款 3A 遊戲中,竟然能有如此高的幀數。可以說 DLSS 4 技術的出現,完全打破了大家以往對遊戲效能的固有認知。
當然,無論是何種形式的插幀,延遲的增加都不可避免,所以我們也實測了關閉和開啟多幀生成後的延遲表現。在關閉幀生成選項的情況下,我們測試 4K 超速光追畫質的遊戲平均延為 33ms。依舊在同一場景下分別開啟 2x、3x 和 4x 多幀生成,遊戲平均延遲分別為 41ms、44ms 和 49ms。
如此看來相比開啟幀生成之前,延遲的確有一定的增加。不過隨後的 3x 和 4x 多幀生成延遲依次遞增 3ms、5ms,總體延遲都控制在 50ms 以內,對於非競技類單機遊戲來說這個表現完全可以接受。
事實上,幀生成確實會提升一定的遊戲延遲,好在對於《賽博朋克:2077》這款遊戲來說,影響並不大。開啟多幀生成後,總體延遲都控制在 30ms 以內,實際遊戲過程中即便是射擊和砍殺體驗也不會出現延遲不跟手的情況。那接下來我們再來看看《心靈殺手 2》的表現。
在 4K 解析度 + 原生最高畫質下,遊戲的平均幀數為 48 幀,注意此時遊戲的延遲只有 55ms。
而一旦我們開啟光追選項,遊戲平均幀數立刻會跌到無法流程遊玩的水平:
4K 解析度 + 原生最高畫質 + 光追下,遊戲平均幀數為 25 幀,1% LOW 幀 24 幀;
4K 解析度 + 原生最高畫質 + 路徑光追下,遊戲平均幀數為 17 幀,1% LOW 幀 15 幀;
與此同時,大家應該也注意到開啟光追後的遊戲平均延遲會大幅提升,由原先的 36ms 提升到了 101ms 和 148ms,遊戲體驗已經無法保證。那麼 DLSS 4 技術能扳回一城嗎?
開啟多幀生成後,局勢立刻發生了逆轉,2x、3x 和 4x 多幀生成下的遊戲平均幀數分別為 80 幀、121 幀和 154 幀,雖然沒有《賽博朋克:2077》那樣誇張,但效能的提升也是顯而易見的。
而在遊戲平均延遲的表現上,開啟多幀生成後幀數相比 4K + 路徑光追下少了一半,來到 70ms,2x、3x 和 4x 多幀生成下的增幅和《賽博朋克:2077》保持一致,都是 3ms 左右的遞增,毫無疑問 Reflax 低延遲功勞很大。考慮到《心靈殺手 2》剛剛適配 DLSS 4,目前的延遲表現可以接受,希望遊戲後續能夠進一步最佳化延遲表現。
說到延遲,針對目前 DLSS 4 適配遊戲較少的問題,英偉達推出了 DLSS Override 功能進行緩解,這個功能能讓支援 DLSS 且還沒有適配 DLSS 4 的遊戲獲得 DLSS 4 的幀生成和超分體驗。
我們以《漫威爭鋒》為例,在 4K 解析度 + 高畫質 + 關閉 DLSS 情況下,遊戲平均幀數 191 幀,1% Low 幀 166 幀,遊戲平均延遲 13ms;
在 4K 解析度 + 高畫質 + DLSS 質量檔,遊戲平均幀數 206 幀,1% Low 幀 148 幀,遊戲平均延遲 24ms;
在同樣情境下,啟用 DLSS Override,並將 DLSS 4 幀生成設定為 X4 後,遊戲平均幀數 429 幀,1% Low 幀 338 幀,遊戲平均延遲 20ms。遊戲幀率得到大幅度提升,體驗和原生適配 DLSS 4 已經很接近了。
NVIDIA Reflex 2 作為新一代低延遲技術,在 DLSS 4 之外進一步提升遊戲響應速度,最佳化操作手感。自推出以來,NVIDIA Reflex 已應用於超過 100 款遊戲,有效降低 PC 延遲達 50%。Reflex 2 引入 Frame Warp 技術,同步滑鼠輸入與渲染幀,實現遊戲幀的實時控制,提供定製化的低延遲體驗。展望未來,NVIDIA Reflex 2 將為包括《無畏契約》在內的多款主流競技和動作遊戲提供支援,結合 DLSS 4 技術,打造更卓越的低延遲遊戲表現。
六、生產力
生產力方面,IT之家實測了 UL Procyon 的影象影象編輯、影片剪輯、以及 AI 文字撰寫等效能。在影象編輯上,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡配合 AMD 9800X3D 獲得了 9201 分比公版 RTX 5080 高了 515 分。
在影片剪輯效能測試中,GPU 加速,得益於 RTX 5080 Blackwell 架構的第九代 NVENC,其在 H.264 / H.265 4:2:2 編碼的 8 位和 10 位影片上有著非常大的優勢,技嘉魔鷹 RTX 5080 最終獲得了 63774 分,比公版 RTX 5080 高了 1141 分。
最後是考驗 AI 效能的大語言模型測試,面對 13B 引數量的 LLAMA 2 模型平均 OTS 也有著 85.82tokens / s,相比於公版 RTX 5080 的 83.48tokens / s 有所提升。
總結
在 DLSS 4 的加持下,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡給我們留下了深刻的印象,特別是當其與第五代 Tensor Core 結合使用,對遊戲實現了極大的助力,可以說讓遊戲幀數成倍增長也變得觸手可及。
此外,索泰 GEFORCE RTX 5080 16GB SOLID OC 顯示卡在設計上延續了經典的黑金配色風格,搭配硬朗的裝飾線條和可自定義的 RGB Logo 燈效,既彰顯了高階質感,又充分滿足了玩家對個性化的追求。這種設計思路無疑是一個明智的選擇。此外,顯示卡還採用了雙 BIOS 設計,為玩家提供了效能模式和靜音模式兩種選擇,既滿足了追求極致效能的使用者需求,也照顧到了對執行噪音敏感的使用場景。這種將選擇權交給使用者的設計理念,體現了廠商對玩家需求的深刻理解與尊重,值得點贊。