本文來源:時代財經 作者:謝斯臨 實習生盧倩瑩
算力晶片的火,從2023年一直燃燒到2024年。
開年不久,CEO黃仁勳時隔四年到訪中國大陸,還穿上了東北大花襖與國內員工共舞,氣氛無比熱絡,似乎是在對自家晶片遇冷的傳言進行某種回應。
2023年,英偉達的AI晶片成了科技界的硬通貨,一度一片難求,英偉達業績也水漲船高,其2024財年第三季度財報顯示,期內英偉達錄得營收181.2億美元,比去年同期增長206%,遠高於市場預期的162億美元,創紀錄新高。
但近期,情況似乎發生了變化。據參考訊息網,自去年11月以來,中國網際網路大廠就開始在測試英偉達“中國特供版”AI晶片樣品,結果並不理想——由於算力不足,相關公司已暗示英偉達,今年訂購的英偉達晶片數量將遠少於原計劃。
因此,黃仁勳在這個特殊時間節點突然到訪,引發了市場諸多猜測與遐想。有業內人士認為,在國內廠商不願購買效能縮水的英偉達特供版晶片的情況下,黃仁勳來到中國大陸,很有可能是為了穩住國內團隊和頭部客戶,並瞭解市場對英偉達產品的需求和反饋,以便進行相應的產品和策略調整。
對此,英偉達方面也回應媒體稱,黃仁勳的到訪並未涉及與政府官員的會面,也沒有重大的商業釋出,最主要的目的是與中國員工“歡度美好時光”。
“這反映出我國相關產業在國際競爭中的地位逐漸上升。”深度科技研究院院長張孝榮向時代財經記者分析表示,在政策端的支援以及國內企業的不斷努力下,國內外晶片算力的差距已在不斷縮小,這給予了國內頭部大模型廠商轉投國產晶片的底氣,也為英偉達敲響了警鐘。
H20“遇冷”真相
2023年10月,為了繞過限制並滿足中國大陸市場需求,英偉達著手推出三款基於其AI晶片H100的“降級版”晶片:H20、L20和L2,並計劃在今年二季度量產。
然而這一針對中國市場研發的特供晶片未獲市場認可。效能上的不足,被普遍認為是英偉達晶片遇冷的主要原因。
官方資料對比顯示,H20為三款晶片中效能最佳的一款,更適用於垂類模型的訓練、推理。H20的記憶體高達96GB,整數精度(INT8)算力為296TOPS;L20則配有48 GB記憶體,整數精度(INT8)算力為239TFLOP;L2配置為24GB記憶體以及算力為193TFLOP。
然而即便是三款晶片中最強大的是H20晶片,其運算能力與H100相比還是大幅縮水。
半導體研究機構Semianalysis調研報告曾顯示,理論上H20整體算力比英偉達H100下降80%左右,但在大語言模型(LLM)推理方面的效能比H100快20%,同時配置的HBM3視訊記憶體和NVLink互聯模組增加了不小成本。
此外,多位業內人士向時代財經記者分析表示,效能表現不及預期,並非H20在華遇冷的唯一原因。
華芯金通半導體產業研究院院長吳全向時代財經記者指出,從2023年大模型爆火以來,國內一眾雲計算、大模型廠商就已經開始積極囤貨,大批次購買A800、H800等英偉達晶片,目前已部署的伺服器總量尚能支撐市場需求,故而對“減量不減價”的H20興致缺缺。
而前人工智慧NLP企業首席科學家、千芯科技董事長陳巍進一步向時代財經記者透露,國內交易市場中還囤積有大量英偉達GPU晶片等待消化。這也給予國內大模型廠商一定的選擇餘地。
“估計還有20%的存貨沒有出清。”陳巍表示。
時代財經記者透過詢問小紅書、閒魚APP等線上渠道,以及線下走訪華強北晶片交易市場後發現,相比半年前囤貨惜售的場景,現在經銷商手中英偉達存貨普遍較多,側面印證了陳巍的說法。
多位賣家向時代財經記者透露,其目前擁有A100晶片現貨在50個以上,配置不同報價略有波動,單個售價集中在12萬到18萬元區間內,相較去年下半年價格維持穩定。也有賣家要求50-100個起售,交貨週期為1個月,可在中國香港、日本、新加坡進行交易。
此外,陳巍強調,當下市場的觀望態度也與英偉達自身的動作息息相關。
除H20外,2023年底,英偉達中國又在官網釋出了定製的GeForce RTX 4090 D。隨後,又於今年1月初,推出了全新消費級顯示卡GeForce RTX 40 SUPER系列,包括RTX 4080 SUPER、RTX 4070 Ti SUPER 和 RTX 4070 SUPER三款GPU,均具備強勁的生成式AI效能。英偉達副總裁Justin Walker在釋出會上強調,英偉達釋出的新顯示卡符合出口要求,可以提供給中國大陸消費者。
陳巍認為,考慮到多數國內大模型廠商的發展趨勢是針對垂直領域開發數十億引數量級或百億引數量級的中小模型,而不是開發類似GPT-3.5 175B這樣的千億級大模型。因此對於雲計算和IDC廠商來說,4090D等消費級顯示卡在雲部署與推理計算上更具備價效比,H20的吸引力進一步下降。
國產自研AI晶片加速
在爆出H20等“降級版”晶片在華遇冷的同時,參考訊息網的相關報道稱,“短期來看,英偉達降級版晶片與中國本土晶片在效能上的差距不斷縮小,增強了中國自產晶片的吸引力。據知情人士稱,阿里巴巴和騰訊正將一部分高效能AI晶片的訂單轉給本土企業,並更多地依賴內部自研晶片。中國另外兩大晶片買家位元組跳動和百度也是如此。”
時代財經記者透過採訪以及公開資料梳理發現,目前國產AI晶片主要可以分為三類:其一是大型科技企業自研的AI晶片,二是海光資訊這類國資背景的科技公司,三是壁仞科技、天數智芯、摩爾執行緒、燧原科技、寒武紀等創業型晶片公司。
據晚點統計,上述晶片峰值算力大多相當於英偉達A100的41%到82%。
從實際落地情況來看,絕大部分廠商仍處在商業化應用的早期階段,仍停留在具體場景下的應用。
目前,國內已有科技企業具備全棧AI軟硬產品,能夠真正大規模量產並投入業務使用。其研發的核心產品被普遍認為是效能表現最接近英偉達的國產AI晶片。科大訊飛副總裁江濤曾在一次業績說明會上透露,該晶片的能力已經基本做到可對標英偉達A100。
而據時代財經不完全統計,科大訊飛、百度、360、雲從科技、智譜AI等多家科技企業已在使用該晶片。
事實上,AI晶片的算力比拼只是第一步,對於國產廠商而言,接下來的生態構建又是新的挑戰。多位從業人士、分析師也一致認為,從配套生態、供應鏈等多個角度看,大模型廠商依舊難以徹底擺脫對英偉達GPU的依賴。
這不是一家國內廠商的難題。一位AI晶片設計相關的從業者向時代財經記者表示,英偉達於2006年釋出的CUDA平臺早已成為應用最為廣泛的AI開發生態系統,這導致開發者難以脫離英偉達晶片,進行生成式AI的研發以及訓練。
“從這個維度看,幾乎沒有晶片公司可以撼動英偉達的統治地位。”上述從業者說。
還有上市AI企業高管向時代財經記者透露,目前,國產芯片價格基本與英偉達產品一致,且產能出貨也難達預期。“只有成為生態合作伙伴,才能勉強保證供應。”
“只要漸進就是一個好的趨勢”
對國內大模型廠商而言,增加國產AI晶片比重仍是必然之舉。
“保供已經成為一項關鍵的問題。一方面,美國很有可能會採取各種手段保證自身在人工智慧領域的優勢;另一方面,全球局勢也可能會影響供應鏈的穩定。基於這樣的預期,市場需要儘早尋得新的方案,這將成為國產AI晶片發展的機會。”陳巍認為。
為抓住這一機會,一眾國產AI晶片廠商都在重點發力,拓展市場。據寒武紀向時代財經記者提供的資料,旗下思元晶片近期接連宣佈與百川智慧、智象未來等廠商旗下大模型完成全面適配。
“生態構建是目標,晶片只是基礎,更重要的是在晶片之上構建函括架構平臺、軟體工具、作業系統和應用場景等一系列生態體系。英偉達起步早,國產廠商需要快速追趕。”吳全向時代財經記者分析道。
國際資料公司(IDC)披露資料顯示,2023年上半年,中國加速晶片的市場規模超過50萬張。在陳巍看來,這是一個能夠讓那個國產市場份額拉昇的機會。“只要漸進就是一個好的趨勢。AI晶片要在實際應用中才能夠發現問題、加快迭代。我們一般認為,市場份額佔比超過15%之後,生態建設才能真正跑起來。”
吳全形象地將國產AI晶片的發展比喻為樹木的成長,“目前我們只是種下了一顆小小的樹苗,完成了最基本的培育工作。國內企業仍需在技術創新、人才培養、產業鏈完善等方面付出更多努力。”