三大運營商接入DeepSeek，自研大模型“不香了”？

DeepSeek正在成為國產AI大模型領域的新寵。

2月5日，中國移動旗下的移動雲宣佈接入DeepSeek大模型，繼此前中國電信、中國聯通分別在2月1日、2月3日相繼官宣，至此，三大運營商已全部接入DeepSeek。這也意味著DeepSeek成為國內首個獲三大電信巨頭支援的國產AI大模型。

在蛇年春節期間橫空出世後，DeepSeek目前已推出多個大模型，涵蓋、程式碼生成等多個領域。其中，DeepSeek-R1在數學、程式碼、自然語言推理等任務上，測評效能與GPT-o1模型正式版接近。

此次合作中，三大運營商各自推出了不同的接入方式。中國電信透過“息壤”智算平臺，提供DeepSeek-R1模型的推理、訓練及微調支援，並在GPU雲主機、科研助手、AI雲電腦等業務場景中部署應用。

中國聯通則藉助“星羅”平臺，實現DeepSeek-R1在程式設計助手、雲桌面等產品中的整合，並在全國270多個骨幹雲池預部署，以最佳化推理效率和資料安全能力。

中國移動的接入範圍相對更廣泛，宣佈支援DeepSeek全版本、全尺寸模型，並透過智算中心、平臺進行深度適配，同時結合自研的COCA算力平臺，實現更靈活的模型呼叫與部署。

三大運營商自研的大模型相比DeepSeek顯得十分遜色，或許是三大運營商主動選擇擁抱DeepSeek的原因之一。過去兩年，三大運營商曾相繼推出自研大模型——中國移動的“九天”、中國聯通的“聯智”、中國電信的“星辰”，並嘗試在智慧客服、雲端計算、政企市場等領域進行落地，但未在市場激起較大水花。

2023年，中國移動釋出的“九天”大模型，主打智慧語音助手、智慧政務等場景；中國聯通推出“聯智”大模型，強調5G+AI的融合應用；中國電信的“星辰”大模型則依託天翼雲，聚焦安全及企業級AI服務。然而，相較於百度、阿里等網際網路公司推出的AI大模型，三大運營商的自研產品在市場認知度、技術成熟度及行業拓展方面仍有較大差距。

此次三大運營商接入DeepSeek，被視為對其自研AI能力的一次補充。在運營商的智慧算力平臺上，DeepSeek的加入將進一步豐富其AI產品矩陣，提升大模型在雲端計算、智慧客服、辦公自動化等場景中的應用能力。

同時，三大運營商仍保留自研模型，並在特定行業及定製化服務中繼續推進落地。如何在DeepSeek的通用能力與自研模型的行業適配性之間形成互補，成為三大運營商下一步需要探索的方向。

此外，除了三大運營商，華為雲，騰訊雲、阿里雲等國內主流雲平臺也相繼接入DeepSeek，英偉達、微軟、亞馬遜在內的多家海外公司也在加速接入DeepSeek-R1。1月31日，英偉達宣佈NVIDIA NIM已經可以使用DeepSeek-R1模型。當天，亞馬遜也表示DeepSeek-R1模型可以在Amazon Web Services上使用。微軟也在同一天宣佈，已將DeepSeek-R1正式納入Azure AI Foundry，成為該企業級AI服務平臺的一部分。

採寫：南都灣財社記者嚴兆鑫