IT之家 2 月 7 日訊息,今日發文宣佈,旗下長江計算近日聯合昇騰、華為雲團隊成功助力某國有大行完成 DeepSeek-V3 大模型的本地化推理服務部署。
本次部署使用長江計算 G440K V2 伺服器,基於 MindIE 推理引擎,在雲 AI 開發平臺 ModelArts 上完成。
據介紹,G440K V2 伺服器由長江計算自主研發,已實現 DeepSeek 系列模型的推理適配和最佳化,其採用 8 模組高效推理方式,可提供 AI 推理能力,滿足 DeepSeek 大模型算力需求。
IT之家從烽火通訊獲悉,該伺服器宣稱在記憶體頻寬和互聯能力方面具有優勢,在 DeepSeek 系列模型部署中,可提高模型推理速度、響應效率和資料處理能力,滿足多機組網推理的需求。當前已應用於智慧客服、文案生成、知識沉澱等大模型推理場景中,同時確保部署應用中的資料安全與自主可控。