IT之家 2 月 1 日訊息,英偉達現已公佈 Blackwell GPU 架構白皮書,披露了 GeForce RTX 50 系列顯示卡的大量技術細節,其中相當值得注意的一點是 Blackwell 架構的全部單精度 CUDA 核心同時支援 FP32 / INT32 資料,這點上回歸了九年前的 Pascal 架構。
▲Blackwell 架構 SM 設計
▲Pascal 架構 SM 設計
英偉達在 GeForce 10 "Pascal" 世代仍採用單精度 CUDA 單元兼顧 FP32 / INT32 的設計,而在 Volta 和 Turing 兩代上換用了兩組 1:1 比例的 CUDA 核心分別承擔 INT32 和 FP32 的方案。
▲ Volta(左)、Turing(右)兩代架構 SM 設計
來到 Ampere 架構,英偉達則為每個 SM 流式處理器的四個處理塊(IT之家注:Processing Block)之一提供了 1 組 16 個 FP32 / INT32 單元和 1 組 16 個純 FP32 單元;而在 Ada GPU 上,這一設計得到延續。
▲ Ampere(左)、Ada(右)兩代架構 SM 設計
Blackwell 架構上的統一 CUDA 使得每 SM 可能的 INT32 整數運算能力較 Ada 翻倍。不過在任何給定的時鐘週期內,Blackwell 統一核心只能以 FP32 或 INT32 模式中的一種執行。
英偉達提到,Ada 架構 SM 是為標準著色器設計和最佳化的,而 Blackwell SM 則是為神經著色器設計和最佳化的。