【導讀】10月19日上午,由文匯講堂和北大博雅講壇聯合承辦,上海市算力網路協會、北京大學出版社、上海圖書館聯合主辦的“展望下一代算力暨《對話時代》新書研討講座上海場”在上圖東館成功舉辦,近10萬人次觀看直播。主講嘉賓為上海超級計算中心主任李根國,對話嘉賓為上海超級計算中心高效能計算部部長王濤、商湯科技大裝置事業群生態執行總監劉遠輝,主持圓桌環節的上海市算力網路協會專家會員沈巍。
經整理,主講篇已刊發,此為對話篇。
上海市算力網路協會三位專家沈巍、劉遠輝、王濤在李根國主講後進一步展開探討
沈巍:上海市算力網路協會成立於2022年9月,是全國首個聚焦算力網路領域的專業協會,目前已有100多家成員單位。我們的願景是拉通算力網路的供需兩端,使得未來的算力能像電力、自來水一樣,讓每個使用者都能非常方便的使用,將算力的綠色化、高效化、智慧化賦能每一個行業。今天和理事長單位上海超算中心等一起和大家探討下一代AI算力,也是協會的社會責任。
日常工作和生活背後的AI執行
先請兩位專家分享和揭秘,日常工作和生活中使用的AI場景,背後是哪些基礎設施在支撐其執行。
*金融各個領域從信用評估到風險管理都用大模型
劉遠輝:關於算力需求的問題,本質上就是AI大模型在生活、科研等場景下如何被應用的問題。
我的工作從IBM到華為,再到商湯科技公司,經歷了計算機發展的不同時代。大型機時代經過30多年被小型機淘汰,小型機時代經過十幾年進入雲的時代,後又進入大模型出現稱為的AI1.0時代,2022年openAI釋出chatGP後,TITD(資料中心)釋出《2022中國大模型發展白皮書》標誌著進入大模型2.0時代。
劉遠輝三段工作履歷見證了計算機的發展各階段
我從事了很多關於金融數字化的研究。當下,大模型已被廣泛應用於信用評分、風險管理、高頻交易和客戶服務等多個方面。比如信用評分,大模型可以分析借款人的歷史交易、社交媒體活動,評估信用風險,提高貸款審批的速度和準確性。比如風險管理,藉助AI大模型技術分析時事新聞報道、財報和社交媒體,識別可能影響市場或特定資產的突發事件,使金融機構能夠快速調整策略,以及應對潛在風險,但這個功能需要巨大的算力,需要GPU(圖形處理器)、HOUR(HOUR函式)、TPO(市場輪廓圖)計算小時時差。
大語言模型在準確性和精準計算上還有很大空間,但金融領域的應用無論是信貸還是材料分析,都需要嚴謹。而且金融需要嚴監管,這是對AI的考驗。但是初期也積極擁抱大模型,在邊緣業務、推薦業務上有了一定的成果,近期之內會有大量的應用進入金融領域。
由此看出,大模型的迭代時間在不斷縮短,我們要有耐心,相信大模型在未來幾年內就會取得更大的成果。
*由AI支撐的微短劇年收入接近400億,有望超電影業
微短劇在愛奇藝平臺頗受歡迎,通常38元看全集
同時,我觀察到AI在新興領域的應用。例如微短劇行業可以是大模型原生的一個方向,AI現在已經應用於許多微短劇中。據市場統計,2023年中國電影票房約560億,同期微短劇的收入將近400億,預計2027年微短劇的市場可能會達到1000億,一兩年之內就超過了電影票房市場。
微短劇的商業模式與AI密切相關,其製作週期大約只需幾周,甚至幾天。微短劇使用的文字可以由AI代寫。像當下比較熱門的文生影片大模型,未來也可用來製作微短劇。
*超算中心運作兩套算力系統:超算算力與AI算力
王濤:我從事超算行業已有20多年。上海超算中心不是一個科研機構,而是一個應用和推廣超級計算機的平臺,它成立於2000年,是國內第一家面向公眾開放的超算平臺,主要工作是讓大家用好超級計算機,改善公眾的生活,促進科學發現。工作人員大多是應用學科方向。
超級計算中心是提供算力的一個主要機構,我們目前有兩套具有不同應用特點的系統,一套是用來做傳統的模擬模擬類的計算,是傳統意義上的通用型超級計算機,名字叫“魔方三號”,大約有將近36000個CPU核。另一套是用華為系統做的人工智慧平臺,大約提供了100P的16位浮點算力(FP16)的計算能力。
上海超算中心其實並不神秘,可以預約參觀
*人工智慧如何幫助藥物研發縮短几十倍的時間
人工智慧在基礎科學方面更好地體現了輔助工具的作用。舉個例子,我們正在設計一款化學反應的催化劑,按照傳統的研發流程,第一步是思考怎樣的催化劑能與反應物結合,讓它變得能量更低。做設計時可以利用計算機計算分子結構,推算出能否合成這樣的分子。設計結果出來後再與反應物進行計算,測試它能否結合成一個穩定的結構並降低能量。從最初設計分子之時起,我們就要窮舉各種可能性,每種都要計算一遍,可能要算1000次、10000次,計算機需要幾個月時間。但這至少比做實驗快多了,因為透過實驗合成每一個分子需要較長時間,若要合成1000次、10000次,可能幾年都完不成。
人工智慧的出現告訴我們,最初猜想的那幾千個分子無須全部計算,只需要計算其中的10%。當然人工智慧還有許多不確定性,它提供的是一個機率性的答案。它會把最初列舉窮盡的幾千種情況減少至幾十個,此時再進行計算只需幾天。計算完畢後再進行實驗驗證。
王濤詳盡介紹AI如何參與催化劑設計發揮巨大作用
無論是藥物設計還是交通工具設計,整個人類的研發邏輯都是如此,先窮舉無限的可能性,再逐步縮小。在這方面,人工智慧工具可以極大加快研發過程。
*冰箱2度電,機櫃200度電,AI算力機櫃1500度電
沈巍:進入算力中心看到的是一排排的機櫃,機櫃裡密集地擺放著伺服器,可以把伺服器機架想象成數字世界的書架。上海圖書館的書籍約有5700萬冊,全部擺放到書架上大約需要10萬個書架。如果將這些書全部數字化變成資料後,大約只需100個儲存機櫃就能儲存。
截止2023年底,上海資料中心的伺服器機架約有20萬個。截止2024年6月,國家工信部發布的資料顯示,全國已有830萬個資料中心的標準機架,這是中國現有算力設施的總體量,是一個非常龐大的基礎設施。網際網路的應用、人工智慧的應用,以及未來的應用都基於這些基礎設施的更新迭代和升級。
沈巍善於將抽象事物形象化比較
資料中心的機架更像一個能源怪獸,以與家中雙門電冰箱尺寸一樣大小的機櫃來比較。電冰箱一天約耗1-2度電;10年前資料中心的一個機櫃一天約耗電100-200度;今天算力中心為 AI服務的算力機櫃,一天耗電1500度;要去做一個大模型的運算,最起碼要500到上千個機櫃同時去執行。GDP-4是用了三個月的時間訓練。這樣大家能較直觀地理解能源怪獸的需求。
AI正在被廣泛應用於各行各業。如果明年再開一場論壇,可能就是三個AI坐在現場給大家分享它們的超能力了。事實上,網路上已出現許多數字人帶貨,它不僅可以面向國內受眾,也能夠接待國外受眾。AI生成的數字人不僅可以運用英語、還可以熟練運用阿拉伯語、馬拉西亞語等任何小眾語言。
如何應對AI帶來的算力挑戰
北大出版社、上海市算力網路協會等主辦方承辦與嘉賓合影
AI的發展具體面臨哪些挑戰?我們有哪些應對措施?
*AI強烈依賴未知的全要素資料,三維資料是方向
劉遠輝:說到算力挑戰,繞不開AI三大核心要素的演算法、資料和算力一起協同考慮。
演算法。大模型現在已進入新一代的演算法,之前談到的AI的準確性、對算力的需求等,其實底層就是Transformer模型,是一種基於自注意力機制(Self=Attention,Mechanism)的深度學習架構。
下一代架構是什麼?以認識香蕉為例,父母告訴我們這是香蕉,我們就知道了。從技術層面來說,樣本數是十幾張甚至幾張,而大模型就需要幾千張甚至幾萬張進行訓練,有時還會出現錯誤,這是演算法的問題。大腦自帶的生物電需要多少算力才能達到一個計算機的水平?核心是什麼?可能就是大腦本身的演算法問題。
資料。超算和智算最大的區別是什麼?就是人工智慧強烈依賴一個全要素資料。什麼是全要素資料?實際上AI演算法過程中也不知道哪些資料起了作用,得把所有的要素列出來才能達成效果,這也是現在在攻堅的AI黑盒難題。
李飛飛在自傳《我看見的世界》裡暢想了空間智慧
2009年6月,被稱為“AI教母”的李飛飛釋出世界上最大的影象標記資料集ImageNet。現在她做的是空間智慧,把資料做成了一個三維的資料,並且落地使用。這個方向就是人工智慧機器人。問題是機器人如何理解場景?舉例來說,如果使用家用機器人,你的家就是一個場景,裡面由各種資料組成。如何讓機器人使用洗衣機洗衣、掃地拖地,構建場景的底層邏輯就是資料。這其中的資料量有多大,目前還無法想象。
*新算力:核聚變沉澱、生物晶片、手機算力分散式集中
算力。大模型對算力的需要有多大?商湯科技的計算中心,用電量從2022年底的不足2000p到現在大約15000p,並且還在增長。每年用電超過1億度。2023年,中國內地用電量百強城市排名中,遵義排在第100位,用電量大約230多億度。也就是說,一個計算中心可能佔1%,甚至抵得上一個小城市的用電量了。
最終要落到能源需求。上海有科研機構在從事核電研究,就是小太陽核聚變的沉澱。亞馬遜、Google等公司都在投資核電,以後的算力就會朝能源方向發展。二是生物晶片、量子晶片,這是下一代發展方向。例如,人類的大腦在這麼少一點電的情況下,如何能計算出這麼大的量?這方面極具潛力。
前兩年提出的腦機介面,對我們的生活具有一個劃時代的意義。關於腦機介面攻堅的兩個場景,一是盲人,二是假肢。此外,還有下載技術。其實大家還隨身攜帶一個算力即手機。隨著大模型的進步,新一代手機已經能實現很多功能,因此也有人在思考,如何把手機的算力都分散式集中起來。可見,大家都在探索AI的各個方面。
聽眾提問詢問攻克核聚變沉澱態勢
*如演算法成功模擬人腦邏輯推理能力,會有極大改進
王濤:我也從算力、演算法和資料三個層面談談。
關於演算法。模擬類場景其實也是人工智慧的一個方向。深度學習是實現人工智慧的一種途徑。還有一種是腦科學方案,透過計算機演算法的方式來模擬人腦的運作方式。如果我們能用計算機或演算法成功模擬人腦邏輯推理能力,那就是演算法上的極大改進,這未必是深度學習演算法,可能是其他的演算法。
所謂的資料,就如剛才認識香蕉的案列,我們給機器什麼樣的資料,他就學到了什麼樣的能力。最近的一個例子,有人問AI,3.11與3.9哪個大,很多大模型都說3.11大。因為軟體版本迭代時,3.11的版本就是比3.9版本大。人工智慧是程式設計師寫的,程式設計師第一反應就是3.11的版本顯然比3.9版本大,所以人工智慧也這樣認為。可見,人工智慧沒有意識到這是一個數學比較問題。這有點類似原生家庭裡父母對子女的影響,訓練一個人工智慧的過程就是培養孩子的過程,我們提供怎樣的資料,人工智慧就給出怎樣的反饋。
3.11和3.9誰大?曾經引發網友廣泛討論,此為 GPT-4的類似回答
關於算力。受中美關係的影響,我國的算力與國外的算力相比,落後較多,尤其體現在晶片的設計製造。我們要加大自主發展。隨著模型越做越大,資料量會越來越多,需要的算力也越大,同時帶來功耗的需求,這就變成一個能源安全問題了。
*算力盡頭是能源,算力需求與能源需求幾乎同步
沈巍:學界大咖普遍承認,算力的盡頭是能源。英偉達的CEO黃仁勳(Jensen Huang)談算力時提到,未來所有算力所需的能源,需要燒掉14個地球。事實上,我們算力的需求以及我們的發展速度基本上是40%左右,可能每一兩年就要翻一番。因為我們現在的晶片工藝,實際上算力的需求翻一番,也意味著電力資源也要翻一番,兩者的增速基本上等同。
我們國家的能源增長率基本與GDP增長率一致,假設每年的GDP增長5%至6%,實際上能源的增長率也是5%至6%,那就出現了一個巨大的剪刀差。在2020年9月22日的第75屆聯合國大會上,我國宣告:中國要在2030年前碳達峰,2060年實現碳中和。這就意味著我們在能源消耗總量上不能再繼續爬升。所以,能源是整個資訊通訊產業共同面對的一個挑戰。
“東數西算”實施中亟需加強全國算力與電力一體化
國家也從戰略層面提出了“東數西算”的解決方案。事實上,過去的資料中心、算力中心,包括現在最先進的資料中心和算力中心也都建在北上廣深這些區域,而電力、能源全都依靠西電東輸,依賴長江三峽的電來維持城市的用電需求。如果今後還有大體量的算力增長,那經濟資訊和安全性等將受很大挑戰。與此同時,內蒙古、貴州、慶陽等東數西算的西部節點,一方面能夠自給自足,另一方面還能西電東輸。因此,選擇西電東輸後在本地使用,還是直接把算力設施搬到西部在當地消納,就要算一筆賬了。2021年開始啟動的全國算力一體化實施方案推進低時延、大頻寬、高可靠的新興網路技術在 “東數西算” 工程中應用,打通國家樞紐節點與非國家樞紐節點間的網路主幹道,提升算力網路的傳輸效能和響應速度,其意義在於實現全國算力資源的高效配置和協同發展,為數字經濟的蓬勃發展提供堅實支撐。
算力服務本身也有不同的場景,因為雙碳戰略,前兩年也投資建設了大量的光伏或其他綠色能源基地,但用電負荷又沒有與之完全匹配,所以有時發的電被白白捨棄,令人扼腕。國家的算力佈局與能源佈局會結合得日益緊密。
提問環節,主講李根國同臺回答
*上海建虛擬電廠、迴圈使用液冷技術的散熱能
比如上海還在建虛擬電廠。當處於夏季用電高峰時,透過一些企業,尤其是重點用人單位“削峰填谷”,在該時段發一點電,自己儘量使用自己的電來減少對電網的消耗。因為資料中心裡恰好有大量的蓄電池和柴油發電機,平時是作為後備電源考慮的。如果我們響應虛擬電廠“削峰填谷”的需求,用後備電源保障用電,就可以降低對電網的消耗。
此外,資料中心的發熱量特別高,單機櫃功耗50千瓦時需要12級颱風的風速才能冷卻。目前都選擇了液冷技術,但又會帶來另一個延伸的應用。伺服器發的熱透過風耗散到大氣,相當於浪費掉了。單個服務期看起來不多,但全國830萬臺機櫃,全球成千上萬臺機櫃加起來就是一個很大的量。我們一直在考慮如何把伺服器的熱收集起來,給需要熱的地方迴圈利用。
有些哲學家已經開始思考,AI是否可以定義為一個新的意識或一個新的生物,未來它是否會變成這個樣子?人類作為一種生物,未來與AI這種新生物該如何共存?
*積極培養融合人才,靈活使用好各種AI工具
有關算力需求和未來算力的主講已被製作成兩個短影片廣泛傳播劉遠輝:目前我們對AI的定位是什麼?鑄造新式生產力。人工智慧就是打造新質生產力的工具。計算機在IT時代也是工具,現在急缺的是什麼?是融合人才。以開發新藥為例,一般需要兩個人來做,一個人負責AI,另一人負責製藥,兩個人說的語言不同,許多事情推動起來非常慢。這就需要一個研發藥物且懂AI的人。所以,各行各業應該積極擁抱AI。
在AI領域,其實許多人都在做工具,下一代是探索如何把工具利用得更好、更進步。從AI空間的維度來說,AI不僅產生了意識,還可能從我們的思想中建造 AI新的方向。
王濤:應該把人工智慧看作一個工具。人工智慧工具特別多,未來必然會導致會用者和不會用者的生產效率差。用任務導向來看,效率高的人自然就會得到更多的自由。所以,我們將來就要學會如何使用人工智慧工具。上海在這方面比較領先,一些小學生就在資訊科技課上探索人工智慧工具的使用。人工智慧工具的使用一定是未來提高競爭力的重要方法。
未來生活一定會變得更加美好,因為人類發展科技的目的就是讓我們過得更好。
整理:李念 金夢
文:劉遠輝 王濤 沈巍圖:現場主辦方提供 其餘朱梅全整理於網路編輯:李念責任編輯:李念