原標題:中國工程院院士孫凝暉給正國級、副國級講課的萬字長稿《人工智慧與智慧計算的發展》
文章來源:中國資訊界
主講人系中國工程院院士,中國科學院計算技術研究所研究員、學術委員會主任
人工智慧領域近年來正在迎來一場由生成式人工智慧大模型引領的爆發式發展。2022年11月30日,OpenAI公司推出一款人工智慧對話聊天機器人ChatGPT,其出色的自然語言生成能力引起了全世界範圍的廣泛關注,2個月突破1億使用者,國內外隨即掀起了一場大模型浪潮,Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各種大模型如雨後春筍般湧現,2022年也被譽為大模型元年。當前資訊時代正加快進入智慧計算的發展階段,人工智慧技術上的突破層出不窮,逐漸深入地賦能千行百業,推動人工智慧與資料要素成為新質生產力的典型代表。習近平總書記指出,把新一代人工智慧作為推動科技跨越發展、產業最佳化升級、生產力整體躍升的驅動力量,努力實現高質量發展。黨的十八大以來,以習近平同志為核心的黨中央高度重視智慧經濟發展,促進人工智慧和實體經濟深度融合,為高質量發展注入強勁動力。
一、計算技術發展簡介
計算技術的發展歷史大致可分為四個階段,算盤的出現標誌著人類進入第一代——機械計算時代,第二代——電子計算的標誌是出現電子器件與電子計算機,網際網路的出現使我們進入第三代——網路計算,當前人類社會正在進入第四階段——智慧計算。
早期的計算裝置是手動輔助計算裝置和半自動計算裝置,人類計算工具的歷史是從公元1200年的中國算盤開始,隨後出現了納皮爾籌(1612年)和滾輪式加法器(1642年),到1672年第一臺自動完成四則運算的計算裝置——步進計算器誕生了。
機械計算時期已經出現了現代計算機的一些基本概念。查爾斯∙巴貝奇(Charles Babbage)提出了差分機(1822年)與分析機(1834年)的設計構想,支援自動機械計算。這一時期,程式設計與程式的概念基本形成,程式設計的概念起源於雅卡爾提花機,透過打孔卡片控制印花圖案,最終演變為透過計算指令的形式來儲存所有數學計算步驟;人類歷史的第一個程式設計師是詩人拜倫之女艾達(Ada),她為巴貝奇差分機編寫了一組求解伯努利數列的計算指令,這套指令也是人類歷史上第一套計算機演算法程式,它將硬體和軟體分離,第一次出現程式的概念。
直到在二十世紀上半葉,出現了布林代數(數學)、圖靈機(計算模型) 、馮諾依曼體系結構(架構) 、電晶體(器件)這四個現代計算技術的科學基礎。其中,布林代數用來描述程式和硬體如CPU的底層邏輯;圖靈機是一種通用的計算模型,將複雜任務轉化為自動計算、不需人工干預的自動化過程;馮諾依曼體系結構提出了構造計算機的三個基本原則:採用二進位制邏輯、程式儲存執行、以及計算機由運算器、控制器、儲存器、輸入裝置、輸出裝置這五個基本單元組成;電晶體是構成基本的邏輯電路和儲存電路的半導體器件,是建造現代計算機之塔的“磚塊”。基於以上科學基礎,計算技術得以高速發展,形成規模龐大的產業。
從1946年世界上第一臺電子計算機ENIAC誕生到二十一世紀的今天,已經形成了五類成功的平臺型計算系統。當前各領域各種型別的應用,都可以由這五類平臺型計算裝置支撐。第一類是高效能計算平臺,解決了國家核心部門的科學與工程計算問題;第二類是企業計算平臺,又稱伺服器,用於企業級的資料管理、事務處理,當前像百度、阿里和騰訊這些網際網路公司的計算平臺都屬於這一類;第三類是個人電腦平臺,以桌面應用的形式出現,人們透過桌面應用與個人電腦互動;第四類是智慧手機,主要特點是移動便攜,手機透過網路連線資料中心,以網際網路應用為主,它們分散式地部署在資料中心和手機終端;第五類是嵌入式計算機,嵌入到工業裝備和軍事裝置,透過實時的控制,保障在確定時間內完成特定任務。這五類裝置幾乎覆蓋了我們資訊社會的方方面面,長期以來人們追求的以智慧計算應用為中心的第六類平臺型計算系統尚未形成。
現代計算技術的發展大致可以劃分為三個時代。IT1.0又稱電子計算時代(1950-1970),基本特徵是以“機”為中心。計算技術的基本架構形成,隨著積體電路工藝的進步,基本計算單元的尺度快速微縮,電晶體密度、計算效能和可靠性不斷提升,計算機在科學工程計算、企業資料處理中得到了廣泛應用。
IT2.0又稱網路計算時代(1980-2020),以“人”為中心。網際網路將人使用的終端與後臺的資料中心連線,網際網路應用透過智慧終端與人進行互動。以亞馬遜等為代表的網際網路公司提出了雲計算的思想,將後臺的算力封裝成一個公共服務租借給第三方使用者,形成了雲計算與大資料產業。
IT3.0又稱智慧計算時代,始於2020年,與IT2.0相比增加了“物”的概念,即物理世界的各種端側裝置,被數字化、網路化和智慧化,實現“人-機-物”三元融合。智慧計算時代,除了網際網路以外,還有資料基礎設施,支撐各類終端透過端邊雲實現萬物互聯,終端、物端、邊緣、雲都嵌入AI,提供與ChatGPT類似的大模型智慧服務,最終實現有計算的地方就有AI智慧。智慧計算帶來了巨量的資料、人工智慧演算法的突破和對算力的爆發性需求。
二、智慧計算發展簡介
智慧計算包括人工智慧技術與它的計算載體,大致歷經了四個階段,分別為通用計算裝置、邏輯推理專家系統、深度學習計算系統、大模型計算系統。
智慧計算的起點是通用自動計算裝置(1946年)。艾倫·圖靈(Alan Turing)和馮·諾依曼(John von Neumann)等科學家,一開始都希望能夠模擬人腦處理知識的過程,發明像人腦一樣思考的機器,雖未能實現,但卻解決了計算的自動化問題。通用自動計算裝置的出現,也推動了1956年人工智慧(AI)概念的誕生,此後所有人工智慧技術的發展都是建立在新一代計算裝置與更強的計算能力之上的。
智慧計算發展的第二階段是邏輯推理專家系統(1990年)。E.A.費根鮑姆(Edward Albert Feigenbaum)等符號智慧學派的科學家以邏輯和推理能力自動化為主要目標,提出了能夠將知識符號進行邏輯推理的專家系統。人的先驗知識以知識符號的形式進入計算機,使計算機能夠在特定領域輔助人類進行一定的邏輯判斷和決策,但專家系統嚴重依賴於手工生成的知識庫或規則庫。這類專家系統的典型代表是日本的五代機和我國863計劃支援的306智慧計算機主題,日本在邏輯專家系統中採取專用計算平臺和Prolog這樣的知識推理語言完成應用級推理任務;我國採取了與日本不同的技術路線,以通用計算平臺為基礎,將智慧任務變成人工智慧演算法,將硬體和系統軟體都接入通用計算平臺,並催生了曙光、漢王、科大訊飛等一批骨幹企業。
符號計算系統的侷限性在於其爆炸的計算時空複雜度,即符號計算系統只能解決線性增長問題,對於高維複雜空間問題是無法求解的,從而限制了能夠處理問題的大小。同時因為符號計算系統是基於知識規則建立的,我們又無法對所有的常識用窮舉法來進行列舉,它的應用範圍就受到了很大的限制。隨著第二次AI寒冬的到來,第一代智慧計算機逐漸退出歷史舞臺。
直到2014年左右,智慧計算進階到第三階段——深度學習計算系統。以傑弗裡·辛頓(Geoffrey Hinton)等為代表的連線智慧學派,以學習能力自動化為目標,發明了深度學習等新AI演算法。透過深度神經元網路的自動學習,大幅提升了模型統計歸納的能力,在模式識別①等應用效果上取得了巨大突破,某些場景的識別精度甚至超越了人類。以人臉識別為例,整個神經網路的訓練過程相當於一個網路引數調整的過程,將大量的經過標註的人臉圖片資料輸入神經網路,然後進行網路間引數調整,讓神經網路輸出的結果的機率無限逼近真實結果。神經網路輸出真實情況的機率越大,引數就越大,從而將知識和規則編碼到網路引數中,這樣只要資料足夠多,就可以對各種大量的常識進行學習,通用性得到極大的提升。連線智慧的應用更加廣泛,包括語音識別、人臉識別、自動駕駛等。在計算載體方面,中國科學院計算技術研究所2013年提出了國際首個深度學習處理器架構,國際知名的硬體廠商英偉達(NVIDIA)持續釋出了多款效能領先的通用GPU晶片,都是深度學習計算系統的典型代表。
智慧計算發展的第四階段是大模型計算系統(2020年)。在人工智慧大模型技術的推動下,智慧計算邁向新的高度。2020年,AI從“小模型+判別式”轉向“大模型+生成式”,從傳統的人臉識別、目標檢測、文字分類,升級到如今的文字生成、3D數字人生成、影象生成、語音生成、影片生成。大語言模型在對話系統領域的一個典型應用是OpenAI公司的ChatGPT,它採用預訓練基座大語言模型GPT-3,引入3000億單詞的訓練語料,相當於網際網路上所有英語文字的總和。其基本原理是:透過給它一個輸入,讓它預測下一個單詞來訓練模型,透過大量訓練提升預測精確度,最終達到向它詢問一個問題,大模型產生一個答案,與人即時對話。在基座大模型的基礎上,再給它一些提示詞進行有監督的指令微調,透過人類的<指令,回覆>對逐漸讓模型學會如何與人進行多輪對話;最後,透過人為設計和自動生成的獎勵函式來進行強化學習迭代,逐步實現大模型與人類價值觀的對齊。
大模型的特點是以“大”取勝,其中有三層含義,(1)引數大,GPT-3就有1700億個引數;(2)訓練資料大,ChatGPT大約用了3000億個單詞,570GB訓練資料;(3)算力需求大,GPT-3大約用了上萬塊V100 GPU進行訓練。為滿足大模型對智慧算力爆炸式增加的需求,國內外都在大規模建設耗資巨大的新型智算中心,英偉達公司也推出了採用256個H100晶片,150TB海量GPU記憶體等構成的大模型智慧計算系統。
大模型的出現帶來了三個變革。一是技術上的規模定律(Scaling Law),即很多AI模型的精度在引數規模超過某個閾值後模型能力快速提升,其原因在科學界還不是非常清楚,有很大的爭議。AI模型的效能與模型引數規模、資料集大小、算力總量三個變數成“對數線性關係”,因此可以透過增大模型的規模來不斷提高模型的效能。目前最前沿的大模型GPT-4引數量已經達到了萬億到十萬億量級,並且仍在不斷增長中;二是產業上算力需求爆炸式增長,千億引數規模大模型的訓練通常需要在數千乃至數萬GPU卡上訓練2-3個月時間,急劇增加的算力需求帶動相關算力企業超高速發展,英偉達的市值接近兩萬億美元,對於晶片企業以前從來沒有發生過;三是社會上衝擊勞動力市場,北京大學國家發展研究院與智聯招聘聯合釋出的《AI大模型對我國勞動力市場潛在影響研究》報告指出,受影響最大的20個職業中財會、銷售、文書位於前列,需要與人打交道並提供服務的體力勞動型工作,如人力資源、行政、後勤等反而相對更安全。
人工智慧的技術前沿將朝著以下四個方向發展。第一個前沿方向為多模態大模型。從人類視角出發,人類智慧是天然多模態的,人擁有眼、耳、鼻、舌、身、嘴(語言),從AI視角出發,視覺,聽覺等也都可以建模為token②的序列,可採取與大語言模型相同的方法進行學習,並進一步與語言中的語義進行對齊,實現多模態對齊的智慧能力。
第二個前沿方向為影片生成大模型。OpenAI於2024年2月15日釋出文生影片模型SORA,將影片生成時長從幾秒鐘大幅提升到一分鐘,且在解析度、畫面真實度、時序一致性等方面都有顯著提升。SORA的最大意義是它具備了世界模型的基本特徵,即人類觀察世界並進一步預測世界的能力。世界模型是建立在理解世界的基本物理常識(如,水往低處流等)之上,然後觀察並預測下一秒將要發生什麼事件。雖然SORA要成為世界模型仍然存在很多問題,但可以認為SORA學會了畫面想象力和分鐘級未來預測能力,這是世界模型的基礎特徵。
第三個前沿方向為具身智慧。具身智慧指有身體並支援與物理世界進行互動的智慧體,如機器人、無人車等,透過多模態大模型處理多種感測資料輸入,由大模型生成運動指令對智慧體進行驅動,替代傳統基於規則或者數學公式的運動驅動方式,實現虛擬和現實的深度融合。因此,具有具身智慧的機器人,可以聚集人工智慧的三大流派:以神經網路為代表的連線主義,以知識工程為代表的符號主義和控制論相關的行為主義,三大流派可以同時作用在一個智慧體,這預期會帶來新的技術突破。
第四個前沿方向是AI4R(AI for Research)成為科學發現與技術發明的主要正規化。當前科學發現主要依賴於實驗和人腦智慧,由人類進行大膽猜想、小心求證,資訊科技無論是計算和資料,都只是起到一些輔助和驗證的作用。相較於人類,人工智慧在記憶力、高維複雜、全視野、推理深度、猜想等方面具有較大優勢,是否能以AI為主進行一些科學發現和技術發明,大幅提升人類科學發現的效率,比如主動發現物理學規律、預測蛋白質結構、設計高效能晶片、高效合成新藥等。因為人工智慧大模型具有全量資料,具備上帝視角,透過深度學習的能力,可以比人向前看更多步數,如能實現從推斷(inference)到推理(reasoning)的躍升,人工智慧模型就有潛力具備愛因斯坦一樣的想象力和科學猜想能力,極大提升人類科學發現的效率,打破人類的認知邊界。這才是真正的顛覆所在。
最後,通用人工智慧③(Artificial General Intelligence,簡稱AGI)是一個極具挑戰的話題,極具爭論性。曾經有一個哲學家和一個神經科學家打賭:25年後(即2023年)科研人員是否能夠揭示大腦如何實現意識?當時關於意識有兩個流派,一個叫整合資訊理論,一個叫全域性網路工作空間理論,前者認為意識是由大腦中特定型別神經元連線形成的“結構”,後者指出意識是當資訊透過互連網路傳播到大腦區域時產生的。2023年,人們透過六個獨立實驗室進行了對抗性實驗,結果與兩種理論均不完全匹配,哲學家贏了,神經科學家輸了。透過這一場賭約,可以看出人們總是希望人工智慧能夠了解人類的認知和大腦的奧秘。從物理學的視角看,物理學是對宏觀世界有了透徹理解後,從量子物理起步開啟了對微觀世界的理解。智慧世界與物理世界一樣,都是具有巨大複雜度的研究物件,AI大模型仍然是透過資料驅動等研究宏觀世界的方法,提高機器的智慧水平,對智慧宏觀世界理解並不夠,直接到神經系統微觀世界尋找答案是困難的。人工智慧自誕生以來,一直承載著人類關於智慧與意識的種種夢想與幻想,也激勵著人們不斷探索。
三、人工智慧的安全風險
人工智慧的發展促進了當今世界科技進步的同時,也帶來了很多安全風險,要從技術與法規兩方面加以應對。
首先是網際網路虛假資訊氾濫。這裡列舉若干場景:一是數字分身。AI Yoon是首個使用DeepFake技術合成的官方“候選人”,這個數字人以韓國國民力量黨候選人尹錫悅(Yoon Suk-yeol)為原型,藉助尹錫悅20小時的音訊和影片片段、以及其專門為研究人員錄製的3000多個句子,由當地一家DeepFake技術公司建立了虛擬形象 AI Yoon,並在網路上迅速走紅。實際上 AI Yoon 表達的內容是由競選團隊撰寫的,而不是候選人本人。
二是偽造影片,尤其是偽造領導人影片引起國際爭端,擾亂選舉秩序,或引起突發輿情事件,如偽造尼克松宣佈第一次登月失敗,偽造烏克蘭總統澤連斯基宣佈“投降”的資訊,這些行為導致新聞媒體行業的社會信任衰退。
三是偽造新聞,主要透過虛假新聞自動生成牟取非法利益,使用ChatGPT生成熱點新聞,賺取流量,截至2023年6月30日全球生成偽造新聞網站已達277個,嚴重擾亂社會秩序。
四是換臉變聲,用於詐騙。如由於AI語音模仿了企業高管的聲音,一家香港國際企業因此被騙3500萬美元。
五是生成不雅圖片,特別是針對公眾人物。如影視明星的色情影片製作,造成不良社會影響。因此,迫切需要發展網際網路虛假資訊的偽造檢測技術。
其次,AI大模型面臨嚴重可信問題。這些問題包括:(1)“一本正經胡說八道”的事實性錯誤;(2)以西方價值觀敘事,輸出政治偏見和錯誤言論;(3)易被誘導,輸出錯誤知識和有害內容;(4)資料安全問題加重,大模型成為重要敏感資料的誘捕器,ChatGPT將使用者輸入納入訓練資料庫,用於改善ChatGPT,美方能夠利用大模型獲得公開渠道覆蓋不到的中文語料,掌握我們自己都可能不掌握的“中國知識”。因此,迫切需要發展大模型安全監管技術與自己的可信大模型。
除了技術手段外,人工智慧安全保障需要相關立法工作。2021年科技部發布《新一代人工智慧倫理規範》,2022年8月,全國資訊保安標準化技術委員會發布《資訊保安技術 機器學習演算法安全評估規範》,2022-2023年,中央網信辦先後釋出《網際網路資訊服務演算法推薦管理規定》《網際網路資訊服務深度合成管理規定》《生成式人工智慧服務管理辦法》等。歐美國家也先後出臺法規,2018年5月25日,歐盟出臺《通用資料保護條例》,2022年10月4日,美國發布《人工智慧權利法案藍圖》,2024年3月13日,歐洲議會通過了歐盟《人工智慧法案》。
我國應加快推進《人工智慧法》出臺,構建人工智慧治理體系,確保人工智慧的發展和應用遵循人類共同價值觀,促進人機和諧友好;創造有利於人工智慧技術研究、開發、應用的政策環境;建立合理披露機制和審計評估機制,理解人工智慧機制原理和決策過程;明確人工智慧系統的安全責任和問責機制,可追溯責任主體並補救;推動形成公平合理、開放包容的國際人工智慧治理規則。
四、中國智慧計算發展困境
人工智慧技術與智慧計算產業處於中美科技競爭的焦點,我國在過去幾年雖然取得了很大的成績,但依然面臨諸多發展困境,特別是由美國的科技打壓政策帶來的困難。
困境一為美國在AI核心能力上長期處於領先地位,中國處於跟蹤模式。中國在AI高階人才數量、AI基礎演算法創新、AI底座大模型能力(大語言模型、文生圖模型、文生影片模型)、底座大模型訓練資料、底座大模型訓練算力等,都與美國存在一定的差距,並且這種差距還將持續很長一段時間。
困境二為高階算力產品禁售,高階晶片工藝長期被卡。A100,H100,B200等高階智算晶片對華禁售。華為、龍芯、寒武紀、曙光、海光等企業都進入實體清單,它們晶片製造的先進工藝④受限,國內可滿足規模量產的工藝節點落後國際先進水平2-3代,核心算力晶片的效能落後國際先進水平2-3代。
困境三為國內智慧計算生態孱弱,AI開發框架滲透率不足。英偉達CUDA⑤(Compute Unified Device Architecture, 通用計算裝置架構)生態完備,已形成了事實上的壟斷。國內生態孱弱,具體表現在:一是研發人員不足,英偉達CUDA生態有近2萬人開發,是國內所有智慧晶片公司人員總和的20倍;二是開發工具不足,CUDA有550個SDK(Software Development Kit, 軟體開發工具包),是國內相關企業的上百倍;三是資金投入不足,英偉達每年投入50億美元,是國內相關公司的幾十倍;四是AI開發框架TensorFlow佔據工業類市場,PyTorch佔據研究類市場,百度飛槳等國產AI開發框架的開發人員只有國外框架的1/10。更為嚴重的是國內企業之間山頭林立,無法形成合力,從智慧應用、開發框架、系統軟體、智慧晶片,雖然每層都有相關產品,但各層之間沒有深度適配,無法形成一個有競爭力的技術體系。
困境四為AI應用於行業時成本、門檻居高不下。當前我國AI應用主要集中在網際網路行業和一些國防領域。AI技術推廣應用於各行各業時,特別是從網際網路行業遷移到非網際網路行業,需要進行大量的定製工作,遷移難度大,單次使用成本高。最後,我國在AI領域的人才數量與實際需求相比也明顯不足。
五、中國如何發展智慧計算的道路選擇
人工智慧發展的道路選擇對我國至關重要,關係到發展的可持續性與最終的國際競爭格局。當前人工智慧的使用成本十分高昂,微軟Copilot套件要支付每月10美元的使用費用,ChatGPT每天消耗50萬千瓦時的電力,英偉達B200芯片價格高達3萬美元以上。總體來說,我國應發展用得起、安全可信的人工智慧技術,消除我國資訊貧困人口、並造福“一帶一路”國家;低門檻地賦能各行各業,讓我國的優勢產業保持競爭力,讓相對落後的產業能夠大幅地縮小差距。
選擇一:統一技術體系走閉源封閉,還是開源開放的道路?
支撐智慧計算產業的是一個相互緊耦合的技術體系,即由一系列技術標準和智慧財產權將材料、器件、工藝、晶片、整機、系統軟體、應用軟體等密切聯絡在一起的技術整體。我國發展智慧計算技術體系存在三條道路:
一是追趕相容美國主導的A體系。我國大多數網際網路企業走的是GPGPU/CUDA相容道路,很多晶片領域的創業企業在生態構建上也是儘量與CUDA相容,這條道路較為現實。由於在算力方面美國對我國工藝和晶片頻寬的限制,在演算法方面國內生態林立很難形成統一,生態成熟度嚴重受限,在資料方面中文高質量資料匱乏,這些因素會使得追趕者與領先者的差距很難縮小,一些時候還會進一步拉大。
二是構建專用封閉的B體系。在軍事、氣象、司法等專用領域構建企業封閉生態,基於國產成熟工藝生產晶片,相對於底座大模型更加關注特定領域垂直類大模型,訓練大模型更多采用領域專有高質量資料等。這條道路易於形成完整可控的技術體系與生態,我國一些大型骨幹企業走的是這條道路,它的缺點是封閉,無法凝聚國內大多數力量,也很難實現全球化。
三是全球共建開源開放的C體系。用開源打破生態壟斷,降低企業擁有核心技術的門檻,讓每個企業都能低成本地做自己的晶片,形成智慧晶片的汪洋大海,滿足無處不在的智慧需求。用開放形成統一的技術體系,我國企業與全球化力量聯合起來共建基於國際標準的統一智慧計算軟體棧。形成企業競爭前共享機制,共享高質量資料庫,共享開源通用底座大模型。對於全球開源生態,我國企業在網際網路時代收益良多,我國更多的是使用者,是參與者,在智慧時代我國企業在RISC-V⑥+AI開源技術體系上應更多地成為主力貢獻者,成為全球化開放共享的主導力量。
選擇二:拼演算法模型,還是拼新型基礎設施?
人工智慧技術要賦能各行各業,具有典型的長尾效應⑦。我國80%的中小微企業,需要的是低門檻、低價格的智慧服務。因此,我國智慧計算產業必須建立在新的資料空間基礎設施之上,其中關鍵是我國應率先實現智慧要素即資料、算力、演算法的全面基礎設施化。這項工作可比肩二十世紀初美國資訊高速公路計劃(即資訊基礎設施建設)對網際網路產業的歷史作用。
資訊社會最核心的生產力是網路空間(Cyberspace)。網路空間的演進過程是:從機器一元連線構成的計算空間,演進到人機資訊二元連線構成的資訊空間,再演進到人機物資料三元連線構成的資料空間。從資料空間看,人工智慧的本質是資料的百鍊成鋼,大模型就是對網際網路全量資料進行深度加工後的產物。在數字化時代,在網際網路上傳輸的是資訊流,是算力對資料進行粗加工後的結構化抽象;在智慧時代,在網際網路上傳輸的是智慧流,是算力對資料進行深度加工與精煉後的模型化抽象。智慧計算的一個核心特徵就是用數值計算、資料分析、人工智慧等演算法,在算力池中加工海量資料件,得到智慧模型,再嵌入到資訊世界、物理世界的各個過程中。
我國政府已經前瞻性地提前佈局了新型基礎設施,在世界各國競爭中搶佔了先機。首先,資料已成為國家戰略資訊資源。資料具有資源要素與價值加工兩重屬性,資料的資源要素屬性包括生產、獲取、傳輸、匯聚、流通、交易、權屬、資產、安全等各個環節,我國應繼續加大力度建設國家資料樞紐與資料流通基礎設施。
其次,AI大模型就是資料空間的一類演算法基礎設施。以通用大模型為基座,構建大模型研發與應用的基礎設施,支撐廣大企業研發領域專用大模型,服務於機器人、無人駕駛、可穿戴裝置、智慧家庭、智慧安防等行業,覆蓋長尾應用。
最後,全國一體化算力網建設在推動算力的基礎設施化上發揮了先導作用。算力基礎設施化的中國方案,應在大幅度降低算力使用成本和使用門檻的同時,為最廣範圍覆蓋人群提供高通量、高品質的智慧服務。算力基礎設施的中國方案需要具備“兩低一高”,即在供給側,大幅度降低算力器件、算力裝置、網路連線、資料獲取、演算法模型呼叫、電力消耗、運營維護、開發部署的總成本,讓廣大中小企業都消費得起高品質的算力服務,有積極性開發算力網應用;在消費側,大幅度降低廣大使用者的算力使用門檻,面向大眾的公共服務必須做到易獲取、易使用,像水電一樣即開即用,像編寫網頁一樣輕鬆定製算力服務,開發算力網應用。在服務效率側,中國的算力服務要實現低熵高通量,其中高通量是指在實現高併發⑧度服務的同時,端到端服務的響應時間可滿足率高;低熵是指在高併發負載中出現資源無序競爭的情況下,保障系統通量不急劇下降。保障“算得多”對中國尤其重要。
選擇三:AI+著重賦能虛擬經濟,還是發力實體經濟?
“AI+”的成效是人工智慧價值的試金石。次貸危機後,美國製造業增加值佔GDP的比重從1950年的28%降低為2021年的11%,美國製造業在全行業就業人數佔比從1979年的35%降低為2022年的8%,可見美國更傾向於回報率更高的虛擬經濟,輕視投資成本高且經濟回報率低的實體經濟。中國傾向於實體經濟與虛擬經濟同步發展,更加重視發展裝備製造、新能源汽車、光伏發電、鋰電池、高鐵、5G等實體經濟。
相應地美國AI主要應用於虛擬經濟和IT基礎工具,AI技術也是“脫實向虛”,自2007年以來矽谷不斷炒作虛擬實境(Virtual Reality,VR)、元宇宙、區塊鏈、Web3.0、深度學習、AI大模型等,是這個趨勢的反映。
我國的優勢在實體經濟,製造業全球產業門類最齊全,體系最完整,特點是場景多、私有資料多。我國應精選若干行業加大投入,形成可低門檻全行業推廣的正規化,如選擇裝備製造業作為延續優勢代表性行業,選擇醫藥業作為快速縮短差距的代表性行業。賦能實體經濟的技術難點是AI演算法與物理機理的融合。
人工智慧技術成功的關鍵是能否讓一個行業或一個產品的成本大幅下降,從而將使用者數與產業規模擴大10倍,產生類似於蒸汽機對於紡織業,智慧手機對於網際網路業的變革效果。
我國應走出適合自己的人工智慧賦能實體經濟的高質量發展道路。