歡迎關注EETOP,並 “設為星標” 可第一時間收到我們的推送訊息
AMD與勞倫斯利弗莫爾實驗室(LLNL)今日宣佈,搭載AMD晶片的El Capitan超算以1.742百億億次浮點運算的效能,登頂半年度的Top500榜單,成為全球已知最快的超級計算機,超越了此前位居榜首的1.3百億億次浮點運算的Frontier。而原本位居第二、由驅動的Aurora系統因未提交新的基準測試成績而跌至第三位,暗示其部分執行的系統仍在多方面面臨故障問題。
El Capitan的規模令人驚歎,該系統擁有11,136個節點,配備了44,544個AMD的MI300A加速處理器(APU)、5.4PB的主記憶體以及效能卓越的“Rabbit”近節點儲存子系統。在基準測試中,El Capitan實現了每秒1.742 exaflops 次運算(百億億次浮點運算)的效能,相當於如果按照每秒一次的運算,需要540億年才能實現(540*365*24*3600)。這個成績,比榜單上排名第二的系統快了45%。
美國核安全管理局(NNSA)將利用該系統透過模擬爆炸來更新美國核武庫,從而消除地下核爆的需要,並模擬核儲備的老化影響、安全性和可靠性。該系統還將用於開發兩種新的洲際彈道導彈設計,並服務於高效能計算(HPC)和人工智慧(AI)工作負載,或兩者的融合。
El Capitan的理論峰值(Rpeak)效能達到2.746百億億次浮點運算。 然而,這一數字是在所有系統元件均以峰值速度執行且效能線性擴充套件的完美條件下計算得出的,這在現實中是不可行的。
在高效能Linpack(HPL)基準測試中,El Capitan的實際使用效能(Rmax)達到了1.742百億億次浮點運算,這是衡量頂級超級計算機效能的標杆。 未來透過進一步的系統調優,Rmax有望進一步提升。 該機構表示,在El Capitan被轉移到機密網路之前,還將進行一次全面的HPL基準測試。
值得注意的是,HPL中的超級計算機系統性能是以全精度FP64來衡量的。相比之下,以AI為中心的超級計算機則使用更小的資料型別,從而獲得更高的“AI百億億次浮點運算”評級,但這些評級並不能直接與Top500榜單上的排名相比較。
在滿載執行時,El Capitan的功耗超過35兆瓦,能效比為58.89 Gigaflops/watt,在最高效超級計算機的Green500排名中位列第18位。
El Capitan擁有驚人的11,039,616個計算核心(CPU+GPU),分佈在44,544個AMD MI300A處理器上。這些APU將CPU和GPU核心整合在同一個物理封裝中。每個MI300A晶片包含13個小晶片,其中許多是3D堆疊的,從而建立了一個包含24個Zen 4 CPU核心、一個CDNA 3圖形引擎以及總計128GB的八層HBM3記憶體的單個晶片封裝。
總體而言,MI300A晶片擁有1460億個電晶體,是AMD投入生產的最大晶片。九個計算晶片(混合了5nm CPU和GPU)被3D堆疊在四個6nm基礎晶片之上,這些基礎晶片作為活躍的中介層,處理記憶體和I/O流量等功能。您可以深入瞭解El Capitan的拓撲結構。該架構採用快取一致性記憶體來減少CPU和GPU之間的資料移動,這通常比計算本身消耗更多的功率,從而降低延遲並提高效能和能效。它還極大地簡化了舊程式碼的移植和新程式碼的建立。
HPE採用其Shasta架構構建了El Capitan系統,該架構由高密度液冷EX4000機櫃和EX225a加速器刀片組成,透過Slingshot-11網路互連連線在一起。這一平臺還為美國能源部(DOE)的其他兩臺百億億次超級計算機提供了動力:此前世界上最快的超級計算機Frontier以及屢遭推遲、由英特爾晶片驅動的Aurora。這使得HPE在Top500榜單上佔據了前三名,且這三臺機器都是榜單上首批且僅有的百億億次級別系統。
相比之下,El Capitan比Top500榜單上排名第二的超級計算機Frontier快45%。現在,由AMD驅動的Frontier在Top500榜單上排名第二,為AMD再添一枚榮譽勳章——AMD的晶片驅動了世界上兩臺最快的超級計算機。有趣的是,Frontier超級計算機也提交了新的基準測試結果,達到了1.353百億億次浮點運算,高於此前提交的1.194百億億次浮點運算。其理論峰值效能也從1.714百億億次浮點運算提升到了2.055百億億次浮點運算。
雖然El Capitan現在是世界上已知最快的超級計算機,據推測中國應該也擁有多臺百億億次級別的機器。但這些機器並未被提交至Top500榜單。
令人驚訝的是,美國能源部並未為英特爾的Aurora提交新的基準測試結果。六個月前,Aurora的提交使其在Top500榜單上穩居第二,但當時該系統並未完全執行。相反,基準測試僅包含了87%的系統活躍度。當時,英特爾表示Aurora存在諸多硬體問題,包括硬體和冷卻系統故障、操作錯誤以及網路不穩定等。未提交新的測試結果意味著這些問題尚未得到完全解決。不過,Aurora在以AI為中心的HPL-MxP混合精度基準測試中仍保持領先,成為世界上已知最快的AI超級計算機,效能達到10.6 AI百億億次浮點運算。
事實上,在Top500榜單前十名中,有五臺超級計算機由AMD驅動,三臺由英特爾驅動,一臺由英偉達驅動,而日本定製構建的Arm Fugaku也佔據了一席之地。LLNL還評論稱,就類似規模而言,該系統是部署成本效益最高的系統,這表明El Capitan不僅是世界上最快的超級計算機,而且在技術前沿也是最經濟的。
本文由EETOP編譯整理自:tomshardware
https://www.tomshardware.com/pc-components/cpus/amd-powered-el-capitan-is-now-the-worlds-fastest-supercomputer-with-1-7-exaflops-of-performance-fastest-intel-machine-falls-to-third-place-on-top500-list
倒計時 2天!