IT之家 2 月 10 日訊息,根據 Phoronix 對 GH100(包含單個 Grace 晶片)的評測, Grace 伺服器 CPU(72 核 Arm 架構)相比 AMD 和英特爾的產品似乎顯得非常具有競爭力,在很多測試專案中都勝過了最頂級的 EPYC 9754 或 Xeon Platinum 8592+ 處理器(但整體效能依然落後於 X86 產品)。
值得一提的是,英偉達不單獨銷售 Grace 晶片,所以最基礎的 GH100 和 GH200(包括一個 Hopper GPU 和一個 72 核的 Grace CPU,配備 480GB LPDDR5X 記憶體)就是唯一可以測試 Grace CPU 效能的產品。
Phoronix 藉助 GPTshop.ai 遠端對GH100 進行了測試(基於 Ubuntu 23.10 進行),並與其他CPU 進行了比較,IT之家彙總結果如下:
BenchmarksGH200EPYC 9754Xeon 8592+High Performance Conjugate Gradient41.6925.8935.42Algebraic Multi-Grid Benchmark 1.21,997,929,1112,291,049,6671,839,912,667LULESH 2.0.323,185.1822,356.7539,468.91Xmrig 6.18.117,25329,356.140,381.2John The Ripper 2023.03.1468,817204,828178,108ACES DGEMM 1.017.9443.6829.14GraphicsMagick 1.3.38 Sharpen1,363924749GraphicsMagick 1.3.38 Enhance1,7611,4511,192Graph500 3.0 Median1,239,790,0001,147,090,0001,238,670,000Graph500 3.0 Max1,315,650,0001,184,510,0001,304,200,000Stress-NG 0.16.04 Matrix512,759.08552,067.04301,894.53Stress-NG 0.16.04 Matrix 3D17,483.028,009.2113,854.38
下面是 GH200 CPU 基準測試結果(越低越好):
BenchmarksGH20097548592+Rodinia 3.1 (Lower is better)30.3125.1539.89NWChem 7.0.2 (Lower is better)1,403.51,700.81,850.8Xompact3d Incompact3d (Lower is better)254.49493.5323.53Xompact3d Incompact3d (Lower is better)9.819.0310.18Godot Compilation 4.0 (Lower is better)139.1118.25111.96Primesieve 8.0 (Lower is better)35.4921.7649.06Helsing 1.0-beta (Lower is better)67.6148.9584.95DuckDB 0.9.1 IMDB (Lower is better)92.08147.696.87DuckDB 0.9.1 TPC-H Parquet (Lower is better)148.76177.13134.73RawTherapee (Lower is better)46.7266.1345.53Timed Gem 5 Compilation 23.0.1 (Lower is better)180.62208.58174.18Overall Average Performance2,175.032,459.112,242.9
結果顯示,這顆 Grace 晶片與 Emerald Rapids 相比有15 項結果更優秀,而與 AMD Bergamo 和 Genoa相比則取得了 13 場勝利。
平均而言,Grace 效能依然要比 Emerald Rapids 系列的 Xeon Platinum 8592+ 落後 3%,比 Bergamo的 EPYC 9754 和 Genoa的 EPYC 9654 落後 13%。
據 Phoronix 稱,目前仍然有一些工作負載對於 AArch64(Arm)最佳化不到位,這也是 Grace 在部分場景中出現大幅劣勢的一個關鍵原因。