雖然液冷成為未來資料中心的首選,但是液冷產業標準不完善,使用者獲取成本和使用門檻高的問題依然突出,如何化解這一難題?
近日,浪潮資訊與英特爾聯合釋出全球首個全液冷冷板伺服器參考設計,並面向業界開放,為全球液冷產業鏈上下游提供極具價值的參考樣板,推動先進全液冷冷板解決方案在全球資料中心的大規模部署應用,實現資料中心更加綠色低碳可持續發展。
產業化程度比較低是液冷規模化落地的最大挑戰
當下,算力是熱門的話題,畢竟ChatGPT為代表的大語言模型對於算力的需求持續攀升。為了增大算力供給,現在晶片的功耗越來越高,隨之散熱的需求也在增加。在過去十年,CPU 熱設計功率(TDP)幾乎翻了一番,而GPU熱設計功耗已從2008年的不足200W到目前的700W。
中國資訊與通訊研究院產業與規劃研究所副總工程師王青表示,根據測算,當晶片的製程演進到10奈米的時候,整個晶片的效能每提升一倍,功耗至少要提高30%到40%,而散熱能力決定了整個晶片的效能發揮。
在這樣的背景下,液冷技術成為資料中心的首選散熱方式,液冷的“熱度”不斷增加。根據IDC的資料,2022-2027年,中國液冷伺服器市場年複合增長率將達到54.7%,2027年市場規模將達到89億美元。未來,中國將成為液冷技術應用最大的試驗場,據測算,預計到2025年中國液冷資料中心市場規模將達20%以上。
雖然這樣的資料令業界激動不已,很多客戶也對液冷技術躍躍欲試,但是液冷技術在資料中心的落地並不是順暢。浪潮資訊伺服器產品線總經理趙帥告訴記者,2023年與浪潮資訊交流液冷技術的客戶數量增加了10倍以上,但是實際部署的也就佔了交流客戶的十分之一。
為什麼會出現這種情況呢?除了技術難點,在趙帥看來,產業標準化程度比較低是液冷技術規模化落地的最大挑戰。由於液冷產業標準不完善,產業鏈上各個企業技術路徑多種多樣、產品規格千差萬別,產品質量良莠不齊,各液冷模組無法相容,讓使用者難以選擇。
比如使用者的現有資料中心存在多品牌和型別的伺服器,是否能夠引入液冷伺服器是個大問題。而解決這樣問題的關鍵是標準化。
產業化的表現是批次化和規模化,但是現在液冷產業的生產廠家少,使用者購買和部署成本高,同時各家的產品之家不能對接和互通,這樣無疑增加了使用者的成本。“標準的意義是推動規模化,互聯互通才能降低門檻,讓市場快速發展。”趙帥說。
全液冷冷板伺服器最佳實踐
正是由於開放標準的重要性,浪潮資訊、英特爾還與中國電子技術標準化研究院、開放計算標準工作委員會OCTC聯合釋出了《全液冷冷板系統參考設計及驗證白皮書》,包含冷板式液冷技術最佳化方向,冷板全液冷伺服器系統架構設計、關鍵部件設計、效能測試,鋁冷板全液冷方案設計與測試,以及冷板液冷技術應用拓展等主要內容,對全液冷伺服器設計和規模應用中面臨的主要難點和痛點提供了設計參考,對全液冷冷板技術在通用產品上實現快速匯入和推廣具有重要指導意義。
2022年起,浪潮資訊聯合英特爾率先針對基於通用伺服器架構的全液冷冷板技術方案進行研究與實踐,深耕通用高密伺服器液冷最佳化設計。浪潮資訊資料信心產品部副總經理李金波表示,過去一年,幾十位浪潮資訊和英特爾的資深工程師經過了各種設計、打樣、測試、驗證,共同完成了這部白皮書。
在眾多液冷方式中,冷板式液冷在對資料中心與伺服器架構的改造程度、產業鏈成熟度、部件更換運維便捷性、初期投資等方面有突出優勢,而且冷板液冷技術發展正逐步向全液冷演進。
浪潮資訊與英特爾聯合釋出的全球首個全液冷冷板伺服器參考設計實現了CPU、高功耗記憶體、NVMe硬碟、OCP網絡卡、電源、PCIe轉接卡和光模組等伺服器主要發熱部件的冷板全液冷覆蓋,首創的記憶體枕木散熱器液冷方案結合了傳統風冷散熱和冷板散熱的優勢,比現有的管路(Tubing)記憶體液冷方案,更加易於組裝和維護,且通用性更強。
基於該參考設計,浪潮資訊推出全液冷冷板伺服器,實現伺服器部件接近100%液冷散熱,達到PUE值接近於1的極致水平。以部署浪潮資訊高密度伺服器i24M7的資料中心為例,在風冷散熱條件下資料中心PUE為1.58,採用風液混合散熱PUE可降至1.16,而全液冷冷板散熱則可將PUE降至1.05以下,實現最佳的節能降碳效果。
趙帥表示,經過豐富的產品實踐和產業實踐,我們把發現的問題形成標準和指導規範,向產業開放,跟客戶產生共鳴,消除客戶顧慮。這個共鳴就是產業價值,加速液冷的快速部署。“在適宜的產品上應用適宜的技術,有了產業上游最強大的結合,我們給客戶帶來信任感,經過產業化實踐認可的產品和標準能夠進行批次化、大規模的部署和快速落地。這是我們現在所做事情的價值。”
“從0到1很重要,從1到N也同樣重要。我們解決的是從1到N的事情,真正打通液冷產業的最後一公里。同時,我們把源自於國內的標準變成國際標準,全球使用者都可以享受到來自中國市場的最佳實踐。”英特爾解決方案諮詢顧問李昌中說。
將綠色算力進行到底
如今,高質量發展成為算力基礎設施的共識。2023年10月,工業和資訊化部等六部門聯合印發的《算力基礎設施高質量發展行動計劃》,提出完善算力綜合供給體系等六方面重點任務,著力推動算力基礎設施高質量發展。
王青表示,高質量的算力基礎設施具備四個特點:多元泛在、智慧敏捷、普惠賦能、綠色安全。特別是隨著算力需求的持續增長,綠色化和低碳化是算力發展的一個非常重要的特徵。
在浪潮資訊看來,高質量算力採用先進的計算架構,具備高算效、高能效、可持續、可獲得、可評估五大特徵。其中,高能效是指在最低碳排放前提下實現最大化算力輸出,確保能源利用最優解。
趙帥指出,高能效的本質是實現全生命週期的綠色計算,讓算力可持續發展。算力中心是耗電大戶,國家雙碳背景下,節能降碳、提高算力能效,既是算力產業的共同使命也是國家要求的硬指標。因此,綠色算力成為高質量算力的重要支撐。
對於發展綠色算力、實現高能效,浪潮資訊認為,不僅侷限於能耗PUE,算力全生命週期都存在碳排放,需要從綠色採購、綠色設計、清潔生產、綠色包裝和運輸、綠色運營、回收處理的算力全生命週期進行碳足跡管理,推進全產業鏈節能減排。
例如採用液冷先進散熱技術,浪潮資訊已實現伺服器全線產品支援冷板式液冷,首創液環式真空CDU,從根源解決漏液問題,釋出全液冷機櫃,具有一櫃頂十櫃的高算力密度,年平均PUE可低至1.1以下,單櫃每年可節省電費21萬元,並提供從資料中心的規劃、建設到實施全套的綠色化解決方案,還可根據客戶所處環境,幫助客戶採用模組化、預製化等不同建設模式,最大程度上實現節能降碳。
為全面推進綠色計算,浪潮資訊提出了“低碳、高效、健康”的綠色算力理念,從伺服器基礎部件到整機系統,再到整個資料中心,在算力生產、運營與服務各環節,透過綠色設計、清潔生產、綠色包裝和運輸、綠色運營、回收處理、綠色採購等方面實現算力全流程的綠色化,從而促進綠色算力在企業的廣泛應用。
目前,以液冷為代表的先進綠色節能技術缺乏行業標準,亟需建立綠色節能技術體系化標準。此外,現有的綠色算力評估體系多聚焦單一維度,對算力的能效評估缺乏深入研究,限制了綠色算力的應用廣度和效果。
浪潮資訊已參與制定併發布了十餘項液冷相關設計技術標準,牽頭編制併發布了國內首批冷板式液冷核心部件團體標準,填補了冷板式液冷資料中心標準的空白;同時,牽頭制定了《集裝箱式資料中心機房通用規範》《模組化資料中心通用規範》國家標準。
此外,浪潮資訊還圍繞部件、節點、整機、資料中心等各層級建立綠色評價體系,併發布碳排報告。其中,浪潮資訊與中國資訊通訊研究院聯合釋出《綠色算力白皮書》,構建併發布“綠色算力評測體系”,在行業內首提伺服器“算力/碳排放量”對應關係,推出了業界首個伺服器碳排放評測標準,在達到伺服器效能要求的前提下,滿足低碳、綠色、PUE等要求,實現最小顆粒度的碳排放量化可視指標,將有效推動綠色節能伺服器設計發展,併為使用者選擇最優綠色算力平臺提供重要參考依據。
浪潮資訊持續踐行“All in液冷”戰略,全棧佈局液冷,並提出了2025年實現風液同價的目標。“我們希望透過產品技術創新、標準建立、開源開放,與上下游協作交流,最大化降低資料中心使用者液冷的使用門檻,更好地驅動資料中心邁入液冷時代。”趙帥最後說。