需求似乎是無限的,但的代工廠臺積電產能有限,除了大廠之間的爭奪,美國對中國的晶片封鎖也讓國內的大廠更難買到A100這樣的高階晶片。包括A800、H100、H800,A100和它的“繼承者們”,遭到各方的哄搶,價格水漲船高,最瘋狂的時候,在短短一週裡,一臺由8張A800組成的伺服器,可以從230萬漲價到330萬。有段時間,孫文博感到疑惑:怎麼好像在炒?
文 |徐晴
編輯 |趙磊
運營 |圈圈
一個賭局
一個賭局在伺服器銷售的圈子裡悄悄傳開:香港新到的300臺8卡A100伺服器,總貨值近8個億,到底會花落誰手?
關於這個賭局,有層層的迷霧——買家都有誰?不清楚,但有訊息說,貨是2023年10月的第三個週五進的香港,來自拼多多和金山的採購團隊為了這個訊息,連夜抵達,嚴陣以待;貨從哪裡來的?不知道,據說是一家手段高明的公司,透過英偉達的非授權渠道拿到;具體定價多少?沒有準確數字,追蹤著這個訊息的伺服器廠商高管孫文博說:“話語權在賣方,肯定會為這批貨篩選到價格最高、現金最多、交易條件最好、未來有望繼續合作的買方。”
A100,一個頗具科幻氣息的名字,容易讓人到《終結者》中的機器人代號。實際上,這是一種GPU晶片,採用7nm製程,製造它的光刻機,需要在大約萬分之一根頭髮絲細的空間裡進行精細的雕刻。在大約826平方毫米——不到一張3cm*3cm便籤紙大的面積裡,容納了足足540億個電晶體。它的設計公司英偉達,用科學家的名字來命名產品,A來自電磁學科學家安培(Ampere),而A100的前代產品V100,來自電池的發明者伏特(Volta)。
與每臺電腦中都有的中央處理器(CPU)不同,GPU似乎離普通人有點遠,它在電腦中的另一個名字是顯示卡,負責影象處理、影片渲染,熱衷打遊戲的年輕人,會為一塊高效能顯示卡省吃儉用,而GPU的另一個主要場景是“挖礦”,單枚價值數萬美元的比特幣,就是GPU晝夜不停運作的產物。
如果說CPU是一個數學系畢業的高材生,能計算各種艱深複雜的問題,GPU就像是彙集了一萬個只會1+1=2的小學生,能以最快的速度處理海量簡單重複的問題,而這正是訓練人工智慧最需要的能力,透過對龐大資料的學習、分析、推理,讓機器像人類那樣解決問題。學習的資料越多,機器越聰明,但處理海量資料需要強大的晶片,A100正是為此而生,它靠著超強算力,被譽為“GPU中的王者” “一片頂六片”。
▲黃仁勳從烤箱拎出了一套將8塊A100晶片組合在一起的智慧算力伺服器。圖/英偉達官網截圖
在美國科技公司OpenAI推出的大語言模型ChatGPT驚豔了全世界之後,國內的網際網路公司、大模型創業公司都大步快跑,衝進這個最有前景的賽道,百度、阿里、科大訊飛、360等網際網路大廠,和不少初創企業,都抓緊推出自家的大模型,轟轟烈烈的“百模大戰”徹底打響。
大模型之爭的關鍵在於算力和資料,理論上說,只要GPU數量足夠多(例如有10000臺伺服器),一家公司甚至可以在極短的時間之內訓練出一個不遜色於ChatGPT 4的大模型,而A100就是挖掘大模型金礦時最鋒利的那把鏟子。除了大模型,各類人工智慧公司,包括計算機視覺、語音互動、智慧駕駛等,都需要這把鏟子。
需求似乎是無限的,但英偉達的代工廠臺積電產能有限,除了大廠之間的爭奪,美國對中國的晶片封鎖也讓國內的大廠更難買到A100這樣的高階晶片。包括A800、H100、H800,A100和它的“繼承者們”,遭到各方的哄搶,價格水漲船高,最瘋狂的時候,在短短一週裡,一臺由8張A800組成的伺服器,可以從230萬漲價到330萬。有段時間,孫文博感到疑惑:怎麼好像在炒比特幣?
在無限的需求、有限的供給和時間當中,流轉著鉅額的錢和掘金者們的冀望,考驗著大廠和創業公司們的嗅覺、財力、戰略和決策效率。全新的排位賽中,有個體的命運沉浮,也有企業的野心、慾望和爭奪。
就像那個賭局,儘管還不知道結果,但行內人都估量,拼多多做電商的,業務跟大模型無關,也沒有傳出做大模型的訊息,但AI時代,先下注總比錯過好。就算不做大模型,轉售出去,或是做算力租賃,也是穩賺不賠的好生意。至於金山,雖然自家的WPS AI也需要算力晶片,但估計吃不下這麼大的單子,財力也稍遜一籌。
曖昧不明的交易,以及謠言、猜測、賭局,都成了大模型和A100瘋狂的註腳。
燒錢遊戲
王子鵬第一次感到風暴襲來,是在2023年的5月。
來自美團的高管帶著採購團隊,把他供職的伺服器廠商——寶德資訊科技有限公司庫存裡僅剩的數百臺8卡A100伺服器,像買白菜一樣全部掃走。儘管一臺機器的價格要大幾十萬,總訂單額過億,美團的人絲毫沒有猶豫,下單、籤合同、打預付款、提貨……流程飛快。
事實上,在專業的領域裡,A100從來不是什麼稀罕事物。大模型的風颳起來之前,A100等算力晶片的購買者大多是國內大型的實驗室,例如鵬程實驗室、智源實驗室、之江實驗室、中科院的計算所,曾經購買過上百臺伺服器。除此之外,還有一些人工智慧相關業務的公司,比如抖音瘋狂增長的那幾年,為了訓練AI進行內容稽核,也曾找寶德訂購了不少V100伺服器,“一年買兩個多億”。
作為曾經的伺服器銷冠、如今的高管,王子鵬自稱是“戰場最前端戰壕裡的瞭望員”,行業裡每個細微的變化,都是銷售們最先知道。但那一次,他和同事都看走了眼,以“相當低的價格”出售,“就是平進平出走個量,掙一個點、兩個點”。這讓公司的高層日後都懊悔不已,覺得做了“賠本生意”。
2023年3月14日,OpenAI釋出GPT-4,以此為時間點,大模型賽道突然湧進來大量的錢、公司、採購團隊,曾經並不緊俏的A100,突然成了搶手貨。而就在2022年的10月,美國商務部對高效能晶片作出額外出口限制,禁止美國公司向中國實體出售高階晶片,A100正在其中。政策是政策,生意是生意,英偉達轉而推出了A100的中國特供版——A800,王子鵬打了個比方,與A100相比,A800“就像是把汽車的輸油管改細了一點,發動機和輪胎還是原來的東西”。
▲圖 / 視覺中國
最初,所有人都追逐最好的東西——市場裡有限的A100。需求暴漲,2022年10月之前,“就是一個正常的市場”,到了2023年的5月,“至少得是以前50倍以上的需求量”。美團掃貨之後的短短几個月,A100和8卡A100伺服器的價格水漲船高,漲到了13-16萬/張和135-160萬/臺左右,這意味著,以前5個億能買下來的東西,現在要10個億。
昂貴的價格讓這場晶片爭奪戰變成了燒錢戰。價格就是這麼漲上去的:在賣方市場裡,一批貨沒有準確的買家,誰出的錢多,就歸誰。還有一種情況,廠商簽下了訂單,寧可付違約金,只交付50%,也要把剩下的貨用更高的價格賣出去。
眾多買家裡,位元組是業內公認投入最多的那個。有知情人士透露,位元組內部採購了大約13600張A100,按照一張卡7萬元的最低價格計算,光這些晶片就價值9.52億。
一家大廠在內部資料中估算,目前位元組擁有20多萬張算力晶片,其中約10萬張是A100/A800/H800等高算力晶片。這些晶片當中,有一小部分對外出租,未被出租的高算力晶片則被用於位元組大模型的訓練和推理,還有一些其他型號被用於支援公司內部業務推理場景,比如興趣電商、抖音搜尋、抖音廣告排序等。
等市面上僅剩的A100被哄搶得差不多了,對A800的需求逐漸成了主流。此時,更多的大廠和創業公司入局了,比如拼多多,在2023年的下半年組建了大模型團隊,招兵買馬,開出了百萬年薪挖角人才。對算力的需求就像一個越吹越大的氣球,A800的價格達到了比A100更高的高度——在2023年10月,一臺8卡A800伺服器的價格達到了220-230萬左右。
雙重考驗
A100和A800的瘋狂,是市場需求和政策禁令雙重疊加,催生出的極致供需矛盾的體現。而在漲價和禁令的夾縫之中,大廠和創業公司們也面臨著雙重考驗。
第一重考驗是嗅覺和戰略決策能力。
本身就探索人工智慧前沿技術的阿里達摩院、科大訊飛、百度和商湯科技等公司,長期跟算力晶片打交道,是最早佈局、嗅覺也最敏銳的公司。王子鵬和孫文博都曾得到過訊息,位元組和阿里是最先向英偉達下單的,“都下了近一萬張卡的訂單”。百度後來之所以最早推出文心一言,也是因為提前採購了算力晶片。
由於涉及大量的錢,事關公司未來發展,大模型專案以及採購算力晶片等事項,大多是公司最高層來決策。一位阿里雲人士透露,阿里雲內部有一個供應鏈團隊,其中有幾十人負責晶片採購,直接聽命於CTO。而在阿里雲前CEO張勇卸任之前,通義千問等人工智慧專案由他親自盯進度。
據《晚點》報道,在百度開始文心一言內測前,百度創始人兼CEO李彥宏每晚和專案團隊開會,他們為籌備產品,一度睡在公司裡;而即便已經卸任CEO,張一鳴也在看人工智慧論文,經常跟一些位元組人士分享論文學習心得和對 ChatGPT的思考。一把手們的重視,讓這些公司在這場比賽中佔了先機,省下了數以億計的成本。
▲百度公司董事長兼執行長李彥宏在“文心一言”釋出會上發言。圖 / 視覺中國
而“A100們”設下的第二層考驗,是公司內部的溝通和執行能力。
正如一個“打地鼠遊戲”,2022年英偉達推出了A100的特供版A800,但2023年10月23日,這款晶片也被列入了禁售列表。跟它一起被禁售的,還有H100的特供版H800,只給中國公司留下了30天的應對時間。
王子鵬記得,在2023年的10月,A800、H100等產品的訂單都已經排到了一年後,有英偉達的銷售告訴他,公司會斷掉一些老產品、低效能產品的供應,把產能都集中到高效能算力晶片上,但即便如此,產能還是不夠。這意味著,從英偉達拿貨已經不太現實。
市場變化得極快,產品、價格、貨期隨時變化,那些決策不夠快的大廠,會在此時暴露出問題。
孫文博與京東的採購打過交道。京東供應鏈體系有上千人,專門採購算力晶片的團隊有近20人,負責人直接向VP彙報。他們不關心配置、技術,認準了產品型號直接談價格,這是他們最關心的三個問題之一,另外兩個是交貨期和具體的交貨條件,比如預付款佔比、違約條款等。
孫文博還記得京東採購團隊的猶豫,“他們一直在追著市場走”。10月上旬,A800還有貨,價格在220-230萬左右,採購團隊向高層彙報後,始終沒有得到具體的答覆,沒有“是”,也沒有“否”。直到需求漲起來了,才提出以250萬的價格購入1000臺伺服器,但這時,市場上的價格已經高達320萬。
猶豫和觀望是有成本的,可能是幾千萬,也可能是幾個億。孫文博覺得無奈,“勸他們買的時候他們不買,要等價格下跌,結果等到的是上漲”。
後來,孫文博觀察到,隨著A100、A800價格的高漲,京東的決策週期在變快,從前把情況報給高層沒有反饋,“知道了,但很久不決策”,如今,“兩三天基本上會給你一個結果,因為超過兩天沒有決策,基本上這批貨就沒了”。
賣鏟子和水的人
2024年,曾經風光的大廠們,年會要麼取消,要麼低調舉辦。沉默的網際網路世界,只有英偉達還熱鬧著。CEO黃仁勳首次參加英偉達中國區的年會,他穿著一身東北大花馬甲,笑容燦爛,跟員工一起扭起了秧歌。那股熱鬧喜慶,也是英偉達這一年的寫照。
▲圖 / 抖音截圖
大模型狂奔、算力晶片被爭奪,英偉達成了最大的贏家。假如說大模型創業公司和網際網路大廠們在人工智慧的世界裡掘金,那英偉達就是賣水和鏟子的人,市值在一年多時間裡暴漲6倍,前幾日甚至超過了亞馬遜和谷歌,以1.83萬億美元的市值位居全球第四。
在國內,有兩種方式可以購買英偉達的產品,一種是透過英偉達的合作伙伴網路內的代理商單獨購買GPU卡,例如英邁,神碼、麗臺;另一種是找到英偉達的OEM整機合作伙伴,直接購買含有英偉達GPU的伺服器整機,例如浪潮資訊、寶德資訊。
假如是前一種方式,根據36Kr的報道,2023年上半年,高算力晶片要像愛馬仕一樣,配貨才能購買,阿里、位元組這樣財力雄厚、訂單量大的大廠,可能會優先供貨。
假如是後者,王子鵬說,英偉達對於渠道管理非常嚴格,根據銷售額給渠道劃分級別,連續兩年達標才可以申請升級,否則就會下降。不同級別拿到的產品價格又是不一樣的,級別越高,作為中間商的利潤空間就越大。
巨頭之下,有不少人在跟著吃肉喝湯,在大模型真正賺到錢之前,這些賣鏟子的分銷人和中間商早已賺得盆滿缽滿。
王子鵬曾經跟浪潮的高層交流,“浪潮60%的業績是網際網路一個行業撐起來的”。有一次,王子鵬接到一個浪潮轉過來的訂單,對方銷售稱,某運營商有30臺8卡A100需求,公司沒有貨,“要不轉給你們做?”王子鵬一臉疑惑:“你們公司怎麼可能沒有貨,全中國囤貨最多,銷量最大,怎麼連運營商都敢得罪。”結果對方說,浪潮的貨都優先供給網際網路公司了。
▲圖 / 視覺中國
儘管不是最大的伺服器廠商,寶德也在風口中賺了一筆。直到今天,王子鵬依然覺得不可思議,原來一年才賣十幾二十臺,碰見大專案可能走個三五十臺,現在大量的詢價、訂單流向自己,一張口就是20臺、30臺,“我們當時都驚呆了,20臺、30臺這個訂單就是2000萬、3000萬”,這樣的單子,每天都有好幾個。
當A100們被幾家大廠瓜分,大廠也搖身一變,成為算力租賃商,爭做大模型掘金熱潮中的賣水人。最典型的是阿里和位元組。
前阿里雲員工楊簫透露,阿里的戰略特殊,不靠大模型賺錢,靠的是生態。已經發布並開源的通義千問就像一個樣板間,誰都可以使用阿里的程式碼,讓自己的大模型跑起來,然後來阿里租賃算力。“阿里的大模型是一個帶動性的東西,真正賺錢的是賣‘水’。”
在阿里,一臺8卡的伺服器算力一個月的租賃價格在15萬-20萬左右,至少4臺起賣,這意味著,一臺機器只要租出去8個月就可以收回成本。
位元組的火山雲也像阿里雲一樣在賣算力,楊簫說:“區別在於,位元組純賣水,阿里在賣水的基礎上,還賣服務,一整套解決方案賣給你。”正因如此,阿里的算力價格比位元組更貴。
現在,阿里和位元組在這門生意上已經成了對頭,雙方互相探聽對方算力晶片的數量、價格。在阿里雲,可能只有CEO吳泳銘、CTO周靖人這樣級別的高管才知道自己公司一共囤了多少張晶片,但大家都聽說過位元組囤了多少張。價格戰也打響了。位元組的火山雲銷售會詢問客戶,“阿里跟你們要多少錢?我們六折”。
創業大模型公司作為融資最多、現金流豐裕的客戶,是雙方爭搶的關鍵。李開復的零一萬物和王慧文退出的光年之外,選擇了阿里;而在海外名聲更大的Minimax,行業內看好的智譜AI,主要使用位元組火山雲的算力。
2023年也是智慧駕駛競爭激烈、開城落地的關鍵之年,對算力晶片也有龐大的需求。智駕公司元戎啟行,曾是阿里雲智算業務的客戶。新勢力中的蔚小理,紛紛成立了智算中心,蔚來的在合肥,小鵬在烏蘭察布,都跟阿里合作,理想的在山西,跟火山引擎合作。不過,到了買算力的檔口,還是要看哪家價效比更高、更適合自己。一位阿里雲人士透露,蔚來曾經在阿里“跑過一個小叢集和demo”,但最終還是選了更便宜的位元組。
當算力的儲備遠遠供不上需求,阿里雲智算業務也像英偉達和浪潮一樣,調整了客戶策略。“內部有一個客戶評級體系,起碼到6-7級以上,也就是訂單金額在千萬以上,才有成為阿里雲智算業務客戶的機會。”
風口裡的人
2022年8月底,美國的晶片禁令下來,A100、H100名列其中。那個月,王子鵬手裡剛好有一個專案,機器預計在禁售的前一天抵達香港海關。但到了第二天,那臺機器沒能進來,英偉達給公司退了款——也就是那臺機器的訂購價格,近百萬。沒多久,這臺機器的價格就漲到了他不敢相信的數字。
市場裡的漲幅,是以十萬、百萬為單位的。孫文博記得,在10月25號左右,一臺H800伺服器在國內現貨市場的成交價格是220萬-230萬一臺,一週後,11月2日,美國出了最新的政策,伺服器的價格從220萬直接漲了100萬,達到了320萬。到了11月,價格還在漲,最高報到了385萬。
市場瘋狂的上漲讓一夜暴富的故事批次上演。
有人看準了時機,在伺服器90萬的時候囤貨,等漲到110萬再賣出去,也有人膽子夠大,可以等到120萬甚至220萬的時候再賣。王子鵬總結,“風浪越大,魚越貴”。孫文博說:“最瘋的時候有多少瘋?比如你手裡有個三五臺,因為各種原因沒有賣掉,放在那,10天時間,資產就漲了50%。”
據36Kr報道,2023年底,英偉達中國區的銷售都聯絡不上,因為這一年太賺錢,紛紛出國度假了。一家叫聲智科技的公司,本來是做電動牙刷和智慧家電的,不知道為什麼囤了一大批A100,算力租賃做得風生水起。
也有很多唏噓和感慨。在80臺8卡A100伺服器以很低的價格被美團掃貨之後,寶德的高層領導幡然醒悟,王子鵬記得,“一直在罵銷售,說你把我這個東西賤賣,讓公司少賺了大幾百萬純利潤”。
每隔一段時間,這件事就要被老闆重新提起來一次,成為督促銷售們“看準時機”的反面案例,“說為什麼這波這大模型沒有抓住,為什麼沒有賺到錢”。或者是,“你這個事情給我幹好,要不然又像大模型一樣錯失機會”。
▲圖 / 視覺中國
騙局、貪腐也出現了。有人在小紅書上倒賣A100、A800等晶片。一位自稱手裡有A100現貨的中間商聲稱,從2023年的3月開始,陸續有人找到他詢問有沒有貨,半年時間,他賣出去大約十幾片。
王子鵬認為,在社交平臺上聲稱自己有貨源的,很可能是假貨源,也有可能是40g的庫存貨,因為記憶體不夠大,這些A100通常被當做作訓練大模型的第二或者第三梯隊用卡,大家哄搶的是80g記憶體的算力晶片。還有一種可能,是網際網路大廠中隱秘的貪腐:“網際網路可能有很多個數據中心,拆出來賣掉也是有可能的,那麼多的卡,回頭跟公司報修一下,就說是壞了,也能糊弄過去。”
熱情、失落、疲憊、震撼,這個行業以一種前所未有的姿態衝擊著人們。孫文博說,作為銷售,他承擔著所有的情緒——伺服器漲價,客戶的氣撒在他身上;貨供不上,老闆的焦慮也傳遞到他這裡來,他的神經高度緊繃著,2023年一整年,他的電話24小時待機,不管是誰打來電話,他都會在第一時間接聽。
經歷了良多,王子鵬依然覺得,這是時代給他的機會。2020年時,他向客戶介紹A100,需要把它的歷史淵源、效能優勢從頭到尾講個清楚,而整個公司,一年才賣十幾臺伺服器。到了2023年下半年,每次他開口給客戶介紹產品,對方會給他一個“我懂”的眼神,談話直接進入下一階段,“沒想到三年以後,我這套專業的說辭變成人盡皆知”。他意識到,那個鼓點,他踩中了。
風口還是風險?
晶片是一個典型的全球化產品。一塊晶片,可能由英偉達設計,使用荷蘭阿斯麥公司(ASML)的光刻機生產,在臺灣的臺積電封裝,而每一個環節又涉及到更多的國家、企業。
因此,晶片行業與其他行業最大的不同在於,美元匯率、國際形勢甚至自然災害,都會影響到一塊晶片的成本、價格和供需關係,而這其中蘊藏著巨大的風險。
一位浪潮的中層銷售王初告訴每日人物,在美國發布新規、繼續加碼,英偉達A100、A800、H100、H800都被禁售的10月底,公司亂成了一鍋粥。“我們按照訂單金額20%收定金,光定金就收了30個億,倒推回去,150個億的單子,供不上。”
缺卡態勢嚴重,王初的一位同事,一個單子8個億,只供了40多臺機器,還有7億多供不上。公司一到貨一批貨,就會被哄搶,不知道該分給哪些部門、哪些客戶。有的客戶已經不願意再排隊等待,撤單的訊息一個個傳過來。
王初長嘆了一聲,“浪潮今年好不容易有個新的增長點,是英偉達最大的合作伙伴,所以我們拿到的卡是最多的,拿到的訂單是最多的,但現在卡一禁售,對我們影響也非常大”。
處於危機中的還有一些算力租賃公司。他們簽下了大量訂單,卻無力供給,孫文博說:“有個公司董事長說自己,現在在外面已經簽了10個億的合同,結果1個億的貨都沒有,每天早上一醒來一屁股的債。”
最大的贏家英偉達,也吃了苦頭。黃仁勳曾透露,中國市場佔英偉達銷售額的大約20%,而美國阻止英偉達向中國銷售最先進晶片,如同將“雙手綁在背後”。
▲圖 / 視覺中國
在國內,國產晶片已經瞄準了這塊新空出來的市場,比如華為推出了Atlas 800 AI訓練伺服器,其中包含8片昇騰處理器。古希臘神話裡,Atlas是擎天之神,因為反抗宙斯失敗,被罰在世界最西處,用頭和手撐住天空。這個名字寄託了華為的願望,也暗示著華為的處境。
但有業內人士評價:“華為的生態比英偉達差一些,生態的切換是一個龐大且複雜的工程,大家用英偉達的卡和生態太久了,切換起來很困難。”
對算力的信仰,建立在對人工智慧的篤定之上,但現在,大模型的亂戰,帶來的不只有金錢、慾望和爭鬥,還有一些迷茫。
某211高校資訊工程學院副教授趙佳有一種被擠壓的感覺:“所有大廠都在做大模型,不知道自己該做什麼。”在這場風颳起來之前,他做的是一些“小模型”,藉助少量的算力去實現一些現實中的工程目標,比如在南方沒有人煙的地方,不再需要工人去一個個檢查電線是否完好,而是換成載著人工智慧程式的無人機去“巡線”,判斷電線上有沒有冰,絕緣子有沒有裂縫,精準定位後再報修。但因為算力伺服器價格的暴漲,他的專案預算不夠了,只停留在了“小模型”的階段,沒辦法進一步深入。
他對當下數量龐大的大模型感到不理解,“有這麼多大語言模型,然後呢?”在他看來,許多大模型產品更多是一種噱頭,沒有實際的用處,花掉那麼多的錢、資源、算力,幾乎是浪費。
在幾年前一次人工智慧相關的學術會議中,剛入行的王子鵬偶遇一位北大藥學院的老教授,他有點疑惑,藥學教授怎麼來參加人工智慧會議?對方回答,人工智慧可以在很多領域裡帶來革命性的改變,包括製藥。那是一種關於可能性的戰爭,找到符合標準的化合物並不容易,可能在各個環節遭遇失敗,一款新藥上市可能需要花掉10年、10億美元。但人工智慧可以在各個流程上替人類計算、預測、篩選,最大程度地縮短時間、節省成本。
王子鵬“被重新整理了認知”,原來,AI真的可以改變世界。但幾年過去了,他發覺,目前被改變的好像只有商業的世界,那個錢和慾望流動的地方。而對大模型的狂熱和對算力的追捧,到底能走到哪一步,誰也沒有答案。
(文中受訪者均為化名)
文章為每日人物原創,侵權必究。