一夜爆紅後,新使用者蜂擁而至,DeepSeek可能算力吃緊了。
2月6日週四,DeepSeek突然暫停其API服務充值,按鈕顯示灰色不可用狀態。
隨後,DeepSeek對此發表宣告稱,“當前伺服器資源緊張,為避免對您造成業務影響,我們已暫停API服務充值。存量充值金額可繼續呼叫,敬請諒解!”
截至發稿,DeepSeek的API服務充值仍處於暫停狀態。這不禁引發外界猜測:難道是DeepSeek算力不夠了?
春節期間,DeepSeek由於產品更新“光速出圈”,其使用者量在短時間內飆增。
據媒體援引國內AI產品榜統計資料,DeepSeek應用上線20天,日活已經突破2000萬,DeepSeek應用(不包含網站資料)上線5天內,日活已超ChatGPT上線同期日活,成為全球增速最快的AI應用。
根據分析師舒迪、李奇的測算,假設DeepSeek的日均訪問量為1億次、每次提問10次,每次提問的回覆用到1000個token,1000個token大概對應750個英文字母,則DeepSeek每秒的推理算力需求為1.6*1019TOPs。
在這種普通推理情境下, 假設DeepSeek採用的是FP8精度的H100卡做推理,利用率50%,那麼推理端H100卡的需求為16177張,A100卡的需求為51282張。
國泰君安進一步表示,在以DeepSeek為首的低成本推理模型的逐漸普及下,推理成本及價格大幅削減勢必會帶來應用測的繁榮,這反過來還會拉動成倍數的總算力需求提升。
有分析指出,隨著使用者量持續增長,DeepSeek可能難以滿足日益增長的需求。如果這種情況持續下去,DeepSeek可能別無選擇,只能借鑑OpenAI的做法,加大對基礎設施的投資。
目前,DeepSeek的部分API服務還處於優惠時間段內。
官方價目表顯示,deepseek-chat模型優惠期至北京時間2025年2月8日24:00,優惠結束後將按每百萬輸入tokens 2元,每百萬輸出tokens 8元計費。deepseek-reasoner模型上線即按每百萬輸入tokens 4元,每百萬輸出tokens 16元計費。