可以放在鞋盒中的資料中心 。
科學家預測,到2040年,計算消耗的電力將佔全球總量的50%。
這一預測是在生成式人工智慧爆發之前作出的。過去十多年來,訓練大型人工智慧模型所需的計算資源大約每6個月就會翻一番。按照這個速度,到2030年,訓練一個人工智慧模型所需的計算資源將是當前十大超級計算機年度所需資源之和的100倍。簡而言之,計算需要的巨大電力能源,很快將超出地球所能提供的範圍。
要想解決計算行業不可持續的能源需求問題,從根本上改變計算方式是一個行之有效的方案。超導體可以幫我們實現這一點。
超導體提供了大幅降低能源消耗的可能性,因為在傳輸電流時,它們不消耗能量。的確,超導體只能低溫條件下工作,冷卻需要一些開銷;但作為交換,它們可以提供幾乎零電阻的互連,所具備的基於極短脈衝的數字邏輯只需要極少能量,而且它們易於實現3D晶片堆疊,可以實現驚人的計算密度。
這些優勢足以克服低溫冷卻的成本嗎?我們的研究表明,確實能。隨著計算資源規模的增長,冷卻開銷的邊際成本變得越來越小。我們的研究表明,從每秒約10億億次浮點運算開始,超導計算機在節能方面輕鬆地超越了傳統超級計算機。而這正是當前高效能計算機的運算規模,因此,超導超級計算機的時代已經到來。
過去兩年,我們在比利時微電子研究中心(Imec)致力於開發可以使用標準互補金氧半導體(CMOS)工具製造的超導處理單元。由此製成的處理器的節能效率將是當前節能高效晶片的100倍,這種計算機可以將一個數據中心所需的計算資源壓縮到一個鞋盒大小的系統內。
超導性是指在足夠低的溫度下, 某些材料能夠以零電阻的方式傳輸電流的能力。這種能力早在1911年被發現,自20世紀50年代中期就出現了將其用於計算的想法。然而,這項技術雖然具有低功耗和高計算密度的潛力,但仍無法與摩爾定律下互補金氧半導體驚人的尺寸縮小速度相媲美。幾十年來,這方面的研究一直在持續,2020年,日本橫濱國立大學的一個團隊展示了一款超導CPU。然而,作為輔助計算,超導仍然主要侷限在實驗室中。
為了推動這項技術走出實驗室,朝著可擴充套件設計方向發展,並在現實世界中具有競爭力,我們不得不改變自己在比利時微電子研究中心的研究方法。我們沒有采用自下而上的方式(從物理實驗室中的可行性工作開始,然後推動技術的實用化)來發明系統,而是以自上而下的方式開展設計,即從必要的功能開始,直接與互補金氧半導體工程師和全棧開發團隊合作,確保其可製造性。團隊不僅研究製造工藝,還研究軟體架構、邏輯閘,以及邏輯和記憶體元件的標準單元庫,構建完整的技術。
實際上,高效節能計算的基礎理念可以追溯到1991年。傳統處理器消耗的大部分電力和散發的熱量源自資訊在邏輯單元之間或邏輯與記憶體元件之間的傳輸,而不是來自實際操作。然而,由超導材料製成的互連不會耗費任何能量,這些導線的電阻為零,因此,處理器在內部移動位元時基本不需要能量。這種能量損耗極低的特性即便在非常高的資訊交換頻率下也是成立的,而在普通互連中,能量損耗會急劇增加。
超導計算機內部的邏輯實現方式也進一步節省了能源。超導邏輯的基本元素不是電晶體,而是約瑟夫森結。
約瑟夫森結就像一個三明治:一片薄薄的絕緣材料夾在兩個超導體之間。連線這兩個超導體,就形成了一個約瑟夫森結環路。
正常條件下,約瑟夫森結這個三明治中的絕緣“肉”夾層非常薄,不會阻礙超電流,因為整個三明治作為一個超導體來執行。而如果電流超過閾值,即“臨界電流”,絕緣材料周圍的超導“麵包片”就會短暫地脫離超導狀態。在此期間,約瑟夫森結會發出一個微小的電壓脈衝,僅持續1皮秒、消耗2×10-20焦耳能量,相當於在傳統快閃記憶體中寫入1位元資訊所需能量的千億分之一。
關鍵在於,超導環路中有一種被稱為“磁通量子化”的現象,這使得這個脈衝始終是完全相同的,被稱為單磁通量子(SFQ),其值固定為2.07毫伏皮秒。在約瑟夫森結環路內放置一個電感器,電壓脈衝將驅動電流。由於環路是超導的,這種電流將在環路中無限迴圈,且不需要任何的能量。
超導計算機中的邏輯運算是透過操縱這些微小的量子化電壓脈衝來實現的。具有單磁通量子持續電流的約瑟夫森結環路表示為邏輯1,而沒有電流的環路表示為邏輯0。
為了儲存資訊,CPU快取中基於約瑟夫森結的靜態隨機存取儲存器(SRAM)也使用單磁通量子。要儲存1位元資料,需要將兩個約瑟夫森結環路相鄰放置。左側環路中具有持續電流的單磁通量子是儲存邏輯0的儲存元件,而左側沒有電流、右側有電流的環路是邏輯1。
要將實驗室概念變成可供製造的晶片原型, 我們必須對整套硬體體系進行創新。該體系主要分為3層:基礎材料工程、電路開發和架構設計。這3層必須結合在一起:一套新的材料需要新的電路設計,而新的電路設計需要新的架構。3層的協同開發是成功的關鍵,並且要嚴格遵守互補金屬氧化物半導體制造能力要求。
在材料層面,我們不得不放棄之前實驗室常用的超導材料鈮。雖然鈮易於成型並且在可預測的實驗室條件下表現良好,但它很難縮小。鈮對工藝的溫度和周圍材料都很敏感,因此不適用於標準的互補金氧半導體工藝。所以我們改為使用鈮鈦氮化物作為基礎超導材料。鈮鈦氮化物可以承受互補金屬氧化物半導體制造過程中的溫度,不會失去超導能力,並且它與周圍各層的反應也少得多,是一個更為實用的選擇。
此外,我們採用了一種新的材料作為約瑟夫森結的“肉”夾層:非晶矽,或稱α矽。傳統的約瑟夫森結材料,特別是氧化鋁,不能很好地縮小規模。使用鋁是因為它能夠“潤溼”鈮,使表面變得光滑,並且氧化物可以在受控良好的條件下生長。然而,為了達到超高密度目標,我們必須使用非常薄的氧化物,這在實際生產中很難實現。而在相同的臨界電流下,α矽允許我們使用較厚的阻擋層。
我們還必須設計一種新的方法,為能夠縮小到晶片尺寸的約瑟夫森結供電。以前,實驗室超導計算機使用變壓器向電路元件供電。然而,在每個電路元件旁邊放置笨重的變壓器是不可行的。為此我們另外設計了一種方法,利用整塊晶片上散佈的特有電容搭建諧振電路,一次為晶片上的所有元件供電。
在電路層面,我們不得不重新設計整個邏輯和記憶體結構,以充分利用新材料的能力。我們設計了一種新型邏輯架構,稱為“脈衝守恆邏輯”。脈衝守恆邏輯的關鍵是元件的輸入與輸出數量相同,並且單磁通量子的總數保持不變。邏輯操作透過約瑟夫森結環路和電感器的組合,將單磁通量子路由到適當的輸出,產生邏輯“或”和“與”。為了補充該邏輯架構,我們還重新設計了相容的基於約瑟夫森結的靜態隨機存取儲存器。
最後,我們必須進行架構創新,充分利用新材料和電路設計的優勢。其中包括將傳統的矽基動態隨機存取儲存器冷卻至77開爾文,並設計了一個玻璃橋,連線77開爾文區和主超導區。玻璃橋內有細導線,可以在不發生熱混合的情況下進行通訊。我們還設法將晶片上下堆疊,並且正在開發垂直連線電路板的超導互連。
最終, 我們設計出一款為人工智慧處理最佳化設計的超導晶片。放大其中一塊電路板可以發現,它與一般的3D互補金氧半導體片上系統有許多相似之處。這塊電路板由計算晶片組成,我們將其稱為“超導處理單元”(SPU),內建超導靜態隨機存取儲存器、動態隨機存取儲存器記憶體棧和開關,所有互連都透過矽插入或玻璃橋先進封裝技術實現。
但也存在一些顯著差異。首先,晶片大部分都被浸入液氦中冷卻至4開爾文。這包括安裝在插入板上、依賴於超導邏輯而不是互補金氧半導體的超導處理單元和靜態隨機存取儲存器。然後,有一個玻璃橋通往溫度為77開爾文的中溫區,這裡安放的是動態隨機存取儲存器。動態隨機存取儲存器沒有采用超導技術,而是採用了傳統的矽,由室溫冷卻下來,使其更加高效。自此,透過定製聯結器與室溫部分交換資料。
摩爾定律的核心是在同一空間放入越來越多的計算資源。隨著電晶體小型化越來越困難,半導體行業正在轉向晶片3D堆疊,來保持密度的增加。在基於互補金氧半導體的傳統技術中,晶片內部會消耗大量功率並散發熱量,將計算晶片上下相互堆疊在一起非常具有挑戰性;而在超導技術中,消耗功率很少,熱量很容易被液氦消除,邏輯晶片可以使用先進的3D整合技術直接堆疊在一起,實現晶片之間更短、更快的連線,並且佔用的空間更小。
要實現這一點,可以直接將多塊3D超導晶片板堆疊在一起,之間只留下很小的間隙。我們透過建模對100塊這樣的晶片板進行堆疊,都在同樣的冷卻環境中執行,裝在一個體積為20釐米×20釐米×12釐米的空間中,大致相當於一個鞋盒的大小。我們計算出這個堆疊可以實現每秒20百億億次浮點運算的速度(使用BF16數字格式),這是目前最大的超級計算機的20倍。更重要的是,該系統的總功耗僅有500千瓦,這意味著其能效是目前最高效的超級計算機的100倍。
到目前為止,我們的約瑟夫森結和互連尺寸已經連續縮小了三代。接下來,比利時微電子研究中心的路線圖包括解決3D超導晶片整合和冷卻技術。對於第一代,路線圖設想的是堆疊大約100塊板,目標效能達到20 百億億次浮點運算。然後逐漸堆疊越來越多的邏輯晶片,同時減少板的數量。這將進一步提高效能,同時降低複雜性和成本。
我們並不認為數字超導技術會取代傳統的互補金氧半導體計算, 但我們確實希望它能夠在特定應用中成為互補金氧半導體的補充,並推動應用創新。例如,這項技術將與基於超導技術的量子計算機無縫整合。或許更重要的是,我們相信它將支援人工智慧和機器學習計算量的增長,並以比目前更可持續的方式向大型人工智慧模型提供基於雲的訓練。
此外,藉助這項技術,我們可以建設佔地面積很小的資料中心。急劇縮小的資料中心可以放置在靠近目標應用的地方,而不必位於一些遙遠的、足球場大小的設施中。
這種變革性的伺服器技術是科學家的夢想。它打開了用真實資料對人工智慧模型進行線上訓練的大門。真實資料是急劇環境變化的一部分,以極具潛力的機器人農場為例,如今,訓練這些模型是一項具有挑戰性的任務,因為所需的計算能力只能從遙遠、耗電量大的資料中心獲得。而有了近距離的微型資料中心,就可以即刻處理資料,使人工智慧瞭解農場的當前情況。
同樣,這些微型資料中心可以散佈在能源電網中,在每個節點即時學習,更加高效地在世界各地分配電力。此外,智慧城市、移動醫療系統、製造業、農業等領域也有望從相關人工智慧學習者的即時反饋中受益,從而實時最佳化和改進決策。
文章來源於悅智網,作者Anna、Quentin
倒計時 3天!