(圖片來源:鈦媒體AGI編輯林志佳拍攝)
鈦媒體AGI 2月7日訊息,市場傳聞DeepSeek考慮以估值100億美元進行新一輪融資,阿里有計劃投資10億美元認購DeepSeek股權,目前雙方團隊正在溝通具體執行細節,阿里雲將作為第一推理算力選擇。
受訊息影響,阿里美股(NYSE: BABA)大漲6%以上。
截至發稿前,阿里、DeepSeek雙方均未對傳聞做出回應,而兩家企業都位於杭州。
鈦媒體AGI從訊息人士處進一步瞭解到,其實DeepSeek公司估值目前只在數十億美金左右。訊息最初是在投資圈和量化群裡進行傳播,有多家投資機構人士對此非常感興趣。
據騰訊科技,金沙江創投主管合夥人早前表示,一旦DeepSeek開放融資,他肯定會投資。“我肯定會投啊!我肯定會投!這個價格已經不太重要了,關鍵是參與在這裡面。真的見證人類AGI產生,見證人類AI意識產生,這些東西都很有意義。”
朱嘯虎強調,他認為DeepSeek還是應該開放融資的,因為再往前走是需要燒錢的,當前主要資源需求還是算力卡。
據悉,DeepSeek(深度求索,全稱杭州深度求索人工智慧基礎技術研究有限公司)成立於2023年,總部位於杭州,由中資對沖基金幻方量化創立,DeepSeek創始人、CEO為梁文鋒。
2023年10月28日,DeepSeek發表深度求索的第一個大模型DeepSeek-Coder,11月29日釋出DeepSeek-LLM。到2024年12月13日,DeepSeek釋出用於高階多模態理解的專家混合視覺語言模型——DeepSeek-VL2。同月26日,DeepSeek釋出並開源了DeepSeek-V3,引發關注。
DeepSeek表示,該大模型的訓練系基於2048塊英偉達GPU叢集上執行55天完成,訓練耗資557.6萬美元,而DeepSeek-V3的評測成績超越LLaMA 3.1-405B(Meta自研大模型)等開源模型,能與GPT-4o等閉源模型相抗衡。
2025年1月20日, DeepSeek釋出並開源了推理模型DeepSeek-R1模型,成本低於預期,但該模型在數學、程式碼、自然語言推理等任務上,效能與OpenAI o1正式版相當。到今年1月27日,DeepSeek智慧助手在美區蘋果App Store下載榜上超越ChatGPT,並登頂App Store免費應用榜榜首。
據報道,DeepSeek的員工規模不到140人。梁文鋒曾表示,留住年輕人才的方法主要是“高薪”和“算力管夠”兩條路。
“我們看到的是中國 AI 不可能永遠處在跟隨的位置。我們經常說中國 AI 和美國有一兩年差距,但真實的 gap 是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。”梁文鋒稱。
(本文首發於鈦媒體App,作者|林志佳)