《科創板日報》2月9日訊(編輯 宋子喬) DeepSeek的熱度跨越春節,而A股投資者對DeepSeek概念股的追逐,逐漸從股權投資方、應用端,擴充套件到這一“賣水人”環節。
春節後的A股三個交易日裡,作為第三方雲端計算廠商的優刻得和青雲科技連收三個一字板。同期北交所並行科技收穫兩個30CM漲停,首都線上收穫兩個20CM漲停。
港股上市的金山雲先行一步,其股價自2024年10月低點至今漲幅達5倍,近10個交易日漲幅超70%。
雲端計算產業如何受益於DeepSeek?
如果說DeepSeek證明了演算法最佳化下低成本復現尖端大模型的可能性,李飛飛團隊則以不到50美元的雲端計算費用,以知識蒸餾和小樣本微調的方法,用26分鐘成功訓練出有推理能力的s1模型,進一步凸顯了模型開源、演算法創新、高質量資料、算力租用對中小企業高效率打造優質模型的意義。
對於這兩個“高價效比”模型的訓練和普及,雲服務尤為重要。s1模型的訓練基於通義千問(Qwen)模型進行微調,僅用了1000個樣本資料和16塊H100GPU;DeepSeek的開源模型允許中小企業在雲上進行微調,降低了構造模型的算力門檻。
無論技術如何進步,模型在訓練和使用過程中都需要算力支撐,雲端計算商不僅為中小企業提供了訓練和部署AI模型的基礎設施,還透過彈性擴容(如MaS、API服務)滿足了不斷增長的推理需求。
模型開源策略加速雲端計算普及
DeepSeek的核心創新在於演算法效率顯著提升和成本大幅下降,這為中小型企業切入AI提供了新思路:按需租用算力便可在雲端訓練自己的模型,無需像大廠那樣投入鉅額資金構建大規模的GPU叢集。
雲廠商在中間扮演“賣水人”角色——把DeepSeek等大模型的的API底座能力開放給更多C端使用者,或作為底座模型去開發出更多垂直類應用。
DeepSeek在釋出多款模型後,多個雲平臺宣佈部署DeepSeek旗下模型。阿里雲、百度智慧雲、華為雲、騰訊雲、京東雲、火山引擎、天翼雲均已接入了DeepSeek模型。海外的亞馬遜AWS、微軟Azure等雲巨頭同樣官宣支援。此外,國家超算網際網路平臺已正式上線DeepSeek-R1模型的1.5B、7B、8B、14B版本,並將於近期陸續更新32B、70B等版本。
處於開源模型的生態中,中小企業依靠雲服務完成AI化而非自建算力,第三方中立雲企業憑藉中立性和強大的雲端計算服務能力,為各類企業提供支援,滿足AI訓練和推理的需求,有望脫穎而出。
針對雲平臺與大模型如DeepSeek的合作部署,天使投資人、資深人工智慧專家郭濤表示,雲平臺會提供必要的計算資源、儲存資源和網路頻寬,以支援大模型的執行和資料處理。在合作過程中,雙方還會共同最佳化模型效能,提升使用者體驗。此外,雲平臺還負責大模型的運維管理,確保其穩定執行並及時更新迭代。透過這種模式,雲平臺能夠提供高效、便捷的大模型服務,也促進了自身業務發展。
雲端推理算力需求或大幅增加
DeepSeek API定價僅為GPT-4的1%(每百萬token 0.014美元),吸引百萬級使用者呼叫。雖然DeepSeek實現了低成本高效能,但春節期間由於訪問量劇增導致經常宕機,推理算力不足的問題已經顯露。
未來,模型訓練成本的進一步下降有望推動應用普及,而應用爆發將進一步倒逼推理算力需求。東吳證券便表示,未來的AI投入不再盲目“大力出奇跡”,逐漸將重心從預訓練轉向推理。
不同於訓練對算力的“集中式消耗”,推理需求呈現碎片化、實時化、長尾化特徵。而云計算提供了一種按需租用的業務模式,其特點便是高可用性和擴充套件性,雲的規模可以動態伸縮,以滿足應用和使用者對算力的動態需求。
比如,面對海量且波動的推理請求,雲平臺可透過彈性擴容(如AWS的自動伸縮例項)和模型即服務(MaaS)模式,動態分配算力資源,避免硬體閒置。
天風證券最新研報表示,DeepSeek受到廣泛關注或意味著AI應用的加速落地,這將導致市場整體對於雲端推理算力需求大幅增加。國內頭部雲端計算公司陸續接入DeepSeek,或將推動雲服務商算力租賃及AI服務收入快速增長,同時DeepSeek開源模型低成本技術的創新,有望加速應用側的繁榮,雲端計算算力需求將進一步上升。
民生證券進一步認為,隨著國產模型持續迭代,下游應用場景有望不斷擴充套件,高企的互動推理需求勢必會帶來硬體側的新興需求。DeepSeek作為國內AI龍頭,有望引發產業鏈側的升級。該機構關注網宿科技、潤澤科技、光環新網,產業鏈相關標的包括順網科技、阿里巴巴、騰訊控股、優刻得、金山雲、青雲科技。