DeepSeek正在成為國產AI大模型領域的新寵。
2月5日,中國移動旗下的移動雲宣佈接入DeepSeek大模型,繼此前中國電信、中國聯通分別在2月1日、2月3日相繼官宣,至此,三大運營商已全部接入DeepSeek。這也意味著DeepSeek成為國內首個獲三大電信巨頭支援的國產AI大模型。
在蛇年春節期間橫空出世後,DeepSeek目前已推出多個大模型,涵蓋、程式碼生成等多個領域。其中,DeepSeek-R1在數學、程式碼、自然語言推理等任務上,測評效能與GPT-o1模型正式版接近。
此次合作中,三大運營商各自推出了不同的接入方式。中國電信透過“息壤”智算平臺,提供DeepSeek-R1模型的推理、訓練及微調支援,並在GPU雲主機、科研助手、AI雲電腦等業務場景中部署應用。
中國聯通則藉助“星羅”平臺,實現DeepSeek-R1在程式設計助手、雲桌面等產品中的整合,並在全國270多個骨幹雲池預部署,以最佳化推理效率和資料安全能力。
中國移動的接入範圍相對更廣泛,宣佈支援DeepSeek全版本、全尺寸模型,並透過智算中心、平臺進行深度適配,同時結合自研的COCA算力平臺,實現更靈活的模型呼叫與部署。
三大運營商自研的大模型相比DeepSeek顯得十分遜色,或許是三大運營商主動選擇擁抱DeepSeek的原因之一。過去兩年,三大運營商曾相繼推出自研大模型——中國移動的“九天”、中國聯通的“聯智”、中國電信的“星辰”,並嘗試在智慧客服、雲端計算、政企市場等領域進行落地,但未在市場激起較大水花。
2023年,中國移動釋出的“九天”大模型,主打智慧語音助手、智慧政務等場景;中國聯通推出“聯智”大模型,強調5G+AI的融合應用;中國電信的“星辰”大模型則依託天翼雲,聚焦安全及企業級AI服務。然而,相較於百度、阿里等網際網路公司推出的AI大模型,三大運營商的自研產品在市場認知度、技術成熟度及行業拓展方面仍有較大差距。
此次三大運營商接入DeepSeek,被視為對其自研AI能力的一次補充。在運營商的智慧算力平臺上,DeepSeek的加入將進一步豐富其AI產品矩陣,提升大模型在雲端計算、智慧客服、辦公自動化等場景中的應用能力。
同時,三大運營商仍保留自研模型,並在特定行業及定製化服務中繼續推進落地。如何在DeepSeek的通用能力與自研模型的行業適配性之間形成互補,成為三大運營商下一步需要探索的方向。
此外,除了三大運營商,華為雲,騰訊雲、阿里雲等國內主流雲平臺也相繼接入DeepSeek,英偉達、微軟、亞馬遜在內的多家海外公司也在加速接入DeepSeek-R1。1月31日,英偉達宣佈NVIDIA NIM已經可以使用DeepSeek-R1模型。當天,亞馬遜也表示DeepSeek-R1模型可以在Amazon Web Services上使用。微軟也在同一天宣佈,已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業級AI服務平臺的一部分。
採寫:南都灣財社記者 嚴兆鑫