DeepSeek憑藉極具價效比的技術路線聲名鵲起,外界開始懷疑AI算力高額投資是否明智。但北美四大雲服務提供商並未就此緩步,今年花在AI基礎設施上的支出預計超過3000億美元。
資本開支急劇擴張
美國時間2月6日,在財報電話上披露,2024年第四季度,公司的資本支出達到263億美元,遠高於分析師預期的223億美元。公司預估2025年的資本支出總額為1000億美元,同比增長約26%。
亞馬遜總裁兼執行長安迪·賈西(Andy Jassy)介紹,絕大部分資本支出用在了亞馬遜雲(AWS)的AI基礎設施建設,包括資料中心、硬體、晶片和網路裝置。
“除非看到明顯的需求訊號,否則我們不會採購。”賈西將AI視為一個“千載難逢的商業機會”。
此前2月4日,母公司Alphabet釋出當季財報時也給出了資本支出指引:今年資本支出將達到750億美元,同比攀升高達43%。
Alphabet首席財務官阿納特·阿什肯納齊(Anat Ashkenazi)在財報電話會上說,資本支出這一數字主要反映了公司對技術基礎設施的投資,其中,伺服器是最大的開支領域,其次是資料中心,“用以支援谷歌服務、谷歌雲和DeepMind的業務增長”。
1月24日,Meta執行長馬克·扎克伯格(Mark Zuckerberg)在其個人社交賬號上透露,到今年年底時,Meta將擁有超過130萬塊GPU,資本支出預計為600億至650億美元。相比2024年的392億美元,資本開支的擴張幅度最高達到66%。
Meta首席財務官蘇珊·李(Susan Li)於1月29日的財報電話會上進一步稱,伺服器仍然是整體資本支出中最大的部分;今年的資料中心支出,將用於大型訓練叢集的建設以及進入核心建設階段的高功率密度資料中心。
微軟則在今年1月初一篇部落格文章中預測,在截至今年6月的2025財年,將為AI資料中心建設斥資800億美元。另據資料分析平臺Visible Alpha的預測,微軟和Meta今年都將把超過30%的收入用於資本支出,其中,2025年(自然年)微軟的資本支出總額將超過900億美元。
綜合官方資料及第三方機構預測,亞馬遜、微軟、谷歌和Meta這四家雲廠商今年的資本開支超3000億美元。
推理算力需求長期看漲
自從DeepSeek用較低的成本訓練出媲美GPT-4o尖端AI模型,一種質疑開始浮現:是否有必要大規模投資建設高算力基礎設施?
相比同屬開源陣營的的Meta Llama 3系列模型,DeepSeek-V3的訓練成本僅有前者的7%。去年12月底釋出的DeepSeek-V3,僅需278.8萬H800 GPU小時(使用H800 GPU 進行訓練,累計起來的時間總量為278.8萬小時),而Llama 3系列模型則多達3930萬H100 GPU小時。
“DeepSeek的模式對傳統上高投資、高算力的模式帶來挑戰。”市場諮詢機構Omdia首席分析師王珅向南都記者表示,DeepSeek代表大模型一種輕量化的發展方向,但美國雲廠商不太可能由於一種新興技術路線的出現,就完全改變原本的發展模式和方向,因此延續了高算力的支出軌跡。
華泰證券科技與電子行業首席分析師黃樂平撰文分析,DeepSeek對算力需求的影響呈現出短期抑制、長期增長的複雜趨勢。短期內,DeepSeek的低成本高效訓練方法可能導致訓練需求下降。然而,從長遠來看,隨著模型的普及和應用場景的擴充套件,推理需求將顯著增長。這種趨勢類似於“蒸汽機降低煤耗但提升煤炭總用量”的歷史現象。
被問及DeepSeek給資本支出帶來的影響時,扎克伯格在1月29日的財報電話會上回應稱,這並不意味著所需的算力越來越少。“目前我們看到的新趨勢之一,是在推理計算時投入更多算力,以生成更高水平的智慧算力和更高質量的服務。”扎克伯格提到,Meta為數十億人提供AI服務,“這和模型預訓練是兩回事”。
DeepSeek面向市場的過程中,也遭遇算力瓶頸。“AI產品榜”2月5日釋出的資料顯示,DeepSeek上線20天日活超2000萬,達到ChatGPT的四成。伴隨現象級“出圈”而來的,是DeepSeek官網和App服務的頻繁宕機。受算力吃緊影響,DeepSeek還在2月6日暫停了API服務充值。
採寫:南都記者 楊柳