時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

開工首日,國產晶片萬卡叢集和DeepSeek相關訊息來了

2025-02-08 07:50:16

文|數智前線 趙豔秋 周享玥

2月5日開工第一天,業界傳來大訊息,智慧雲成功點亮自研崑崙芯三代萬卡叢集,這也是國內首個正式點亮的自研萬卡叢集。除了解決自身算力供應問題之外,有望進一步降低大模型成本。

此前,DeepSeek推出V3和R1模型,以可媲美OpenAI領先模型的效果和極大的成本降低,在春節期間引爆全球市場。

在陸續取得突破的背後,AI大模型競爭也進入新時期——不再侷限於技術,而是成本、使用者體驗、生態體系的綜合較量。"每天一杯奶茶錢就能養AI"不再是夢,AI加速走向普惠化。

DeepSeek之後,國產自研萬卡叢集亮相

實際上,在DeepSeek新模型推出後,最近幾天,海內外晶片行業動作頻出。海外如、AMD、英特爾,國內如華為昇騰、沐曦、天數智芯、摩爾執行緒、海光等,紛紛宣佈支援DeepSeek模型部署、推理服務。

而在2月5日新春後開工首日,百度智慧雲也宣佈,成功點亮崑崙芯三代萬卡叢集,萬卡叢集的建成,將進一步推動模型降本。

此前,海外的、亞馬遜AWS和特斯拉都自研部分晶片,來降低成本,提升價效比。在中國,過去一年,算力緊張是大模型成本居高不下的重要因素之一。透過自研晶片和大規模叢集的建設,不僅解決了自身算力供應問題,也有望進一步降低大模型成本。

崑崙芯是百度自研的AI晶片,初代於2018年推出。

最近兩年,崑崙芯對外鮮有報道。但在點亮萬卡叢集之前,業界已經聽到了一些風聲。外界推測,崑崙三代晶片於2024年量產。也有行業內企業告訴數智前線,2024年下半年,他們曾評估購買基於崑崙三代晶片的伺服器。

百度董事長李彥宏曾在一些場合強調,崑崙芯是百度AI技術棧的"基石",自研能力保障了在生成式AI時代的技術主權。

在2024年的一些對外介紹中,百度稱崑崙芯,與飛槳深度學習框架、文心大模型深度協同,形成"晶片-框架-模型-應用"的端到端最佳化,提升整體效能。

數智前線獲悉,此前兩代崑崙晶片,主要用於AI的部署和推理服務。崑崙芯三代則更進一步,是為大模型和訓練最佳化的AI雲端晶片。

這次點亮的萬卡叢集,可將千億引數模型的訓練週期大幅降低,同時能支援更大模型與複雜任務和多模態資料,支撐Sora類應用的開發。此外,萬卡叢集能支援多工併發能力,透過動態資源切分,單叢集可同時訓練多個輕量化模型,透過通訊最佳化與容錯機制減少算力浪費,實現訓練成本指數級下降。

值得關注的是,今年推理市場也將是重頭戲。數智前線獲悉,國內外晶片企業,都在鉚足勁拼搶英偉達的市場份額。一位AI算力資深人士告訴數智前線,推理追求的是"能效比",比拼每瓦的計算效能。

預計百度崑崙芯叢集也將加入這一市場的爭奪。而針對推理市場,業界的策略是圍繞主流模型,做好適配服務。毫無疑問,除了自身的文心一言,崑崙芯也適配了DeepSeek等一眾模型。

在百度官宣中也提及,隨著國產大模型的興起,萬卡叢集逐漸從"單任務算力消耗"到"叢集效能最大化"過渡,"將訓練、微調、推理任務混合部署",從而提升叢集綜合利用率,降低單位算力成本。

接下來,海內外大廠面臨如何突破英偉達的CUDA護城河。在過去10多年,英偉達利用CUDA生態,既把持訓練市場,又圍獵推理市場。CUDA的厲害之處,是面向生命科學、量化、自動駕駛等場景持續開發應用庫。"你要完成一個藥物分子、自動駕駛的應用,CUDA上可能已寫了10萬行程式碼,你可能再寫幾百行,就解決問題了。"上述人士說。

目前,不少國家如英國、法國、加拿大和中國企業在AI晶片生態上表現出倔強和韌性,開展基礎生態建設。另外,全球一些國家的高校實驗室和科研機構,在政府的支援下,也持續在做基礎工作。

"每天一杯奶茶錢就能養AI"

在最新的晶片進展之外,DeepSeek掀起的大模型風暴也在繼續,而各大雲端計算大廠已紛紛宣佈支援DeepSeek模型呼叫或部署,並捲起價格戰,爭奪市場。

大廠的積極性,與DeepSeek模型在全球掀起的巨大流量相關。這個春節假期,"神秘的東方力量"、"AI界拼多多"、"每天一杯奶茶錢就能養的AI"……國產大模型DeepSeek,不管是在國內,還是國外,都賺足了關注度。

2月4日,AI產品榜公佈,根據最新統計資料,上線20天,DeepSeek應用(不包含網站資料)日活已破2000萬,上線5天時日活就已超過ChatGPT上線同期日活,成為全球增速最快的AI應用。

在微博,2月4日,"DeepSeek回答如何過好這一生"一度登上熱搜第一位。在小紅書,DeepSeek相關筆記已迅速超49萬,各類教程、測評帖密集湧現,甚至有人玩起了"AI算命"。

"免費使用+更好的效果"是吸引普通使用者嚐鮮的關鍵。

更為關鍵的是,Deepseek給了OpenAI價格體系一記重擊。多項資料測算,如果以平均使用情況計算,DeepSeek-R1 的整體成本,約為OpenAI o1模型的1/30,讓人們可以用極低的成本應用AI。

隨著 DeepSeek 的爆火,科技大廠之間的大模型價格戰愈發激烈。海外的微軟 Azure、AWS和英偉達NIM服務,接入DeepSeek模型,試圖透過更具吸引力的價效比來搶奪市場份額。國內的運營商、阿里雲、百度智慧雲、火山引擎等也不甘示弱,以各種形式接入DeepSeek模型後,展開了價格博弈。

一些雲端計算企業的價格與Deepseek官方刊例價一致,或在此基礎上有一定優惠或免費額度。

其中,2月3日,百度智慧雲打出的價格最低,百度智慧雲R1呼叫價格,是Deepseek官方刊例價的5折,V3呼叫價格是官方刊例價的3折,並限時免費兩週。

大模型呼叫價格的大幅下降,降低了高質量模型的使用門檻,企業決策阻力驟減,也快速引爆了開發者的熱情。

在全球各個技術論壇上,"DeepSeek"是最燃的話題。在開發者社群CSDN上,全站綜合熱榜前十名中,有四條都與DeepSeek有關,相關應用迅速湧現。有網友用DeepSeek將老照片修復成彩色的,期間沒寫一行程式碼。

在金融行業,江蘇銀行將DeepSeek引入到自身服務平臺"智慧小蘇"中,並將DeepSeek-VL2多模態模型、輕量DeepSeek-R1推理模型,分別運用到了智慧合同質檢和自動化估值對賬場景中。

某跨國藥企基於DeepSeek-R1模型構建藥物副作用預測系統,結合患者歷史資料與實時監測,降低臨床試驗風險。

上海交通大學已開始用DeepSeek-V3生成合成資料,開發垂類大模型。

事實上,OpenAI為了應對DeepSeek的競爭,已迅速推出新模型o3-mini,其定價也被打下來了。

儘管這一價格仍高於DeepSeek的定價,但這是一個顯著的降價趨勢。

實際上,DeepSeek這輪大火,也標誌著AI大模型競爭不再侷限於技術,而是成本、使用者體驗、生態體系的綜合較量。

"每天一杯奶茶錢就能養AI"不再是夢。業界這一輪動作,以極具競爭力的價格優勢,不僅改變了普通使用者對 AI 的使用習慣,更在行業內掀起了一股變革的浪潮,推動著 AI行業朝著更普惠的方向發展。

大模型普及程序將加速

一旦各方科技大廠和平臺力量加入,由DeepSeek引發的大模型普惠的程序將加速。

2月3日,我們體驗了公有云的DeepSeek API呼叫,用Deepseek R1,特別體驗了兩個玩法:

玩法一:秦始皇AI軍師體驗卡

玩法二:老照片時光染色機

可以看到,即便之前沒有任何技術背景,登入百度智慧雲網站,只需要點選線上體驗,進行實名認證,在"模型廣場"就可以輕鬆呼叫DeepSeek-R1和DeepSeek-V3模型。

使用者還可在千帆提供的67個模型中,一次性選擇六個模型,讓他們同時幹一件事,直觀對比模型的效果,最終用腳投票。

這也是平臺的優勢所在,整合各種模態的開閉源模型,就好比AI界的"滴滴打車",既能比價比質,讓使用者自由選擇最高效價比模型服務,也能智慧"拼車"、多模態協同,互補模型能力,增強應用深度。

在各種配套服務上,頭部雲平臺們,在一站式開發工具鏈、全生命週期安全機制、行業解決方案等各項能力的搭建和完善上,也有著極快的反應速度。

在工具鏈上,儘管大模型爆發已兩年,但門檻依然較高,需輔以各種好用的工具。比如我們發現,在Github社群上,按Star數排序,其中最受歡迎的DeepSeek專案,一個是幫助開發者使用DeepSeek的工具集——DeepSeek-Tools,另一是幫助開發者自動選擇和最佳化DeepSeek模型超引數的DeepSeek-AutoML。

各雲大廠也都在工具鏈上進行了諸多佈局,如百度智慧雲的千帆大模型平臺,雖然沒有直接上架DeepSeek工具包,但已集中各種類似工具,如資料加工、工作流編排、模型精調、模型評估、模型量化......

當企業使用者使用DeepSeek模型開發應用,卻擔心訓練資料洩露、生成內容不符合規範以及模型在推理過程中被惡意攻擊等問題時,各雲平臺也都在安全機制上進行了保障。

根據新聞介紹,百度智慧雲在將DeepSeek接入千帆推理鏈路時,支援了百度獨家內容安全運算元,保障內容生成的安全;透過資料保險箱產品,保證模型僅可用於推理預測程式,訓練資料僅可用於模型微調程式;千帆平臺整合的BLS日誌分析和BCM告警功能,也能保障金融或醫療等對安全要求較高的使用者,構建的智慧化應用更安全可靠。

而云平臺們積累的更廣泛的行業覆蓋和行業解決方案,也能幫助開發者實現在對應行業和場景的快速複製與場景適配,讓DeepSeek快速進入這些垂直領域。

除了這些,面向企業逐漸從模型訓練、微調轉向推理的大背景,推理的支撐和最佳化成為關鍵。百度智慧雲對DeepSeek進行了專項最佳化,如透過針對DeepSeek模型MLA結構的計算進行了極致的效能最佳化;並透過計算、通訊、訪存不同資源型別運算元的有效重疊及高效的Prefill/Decode分離式推理架構等,在核心延遲指標TTFT/TPOT滿足SLA的條件下,實現吞吐量"坐火箭",推理成本"坐滑梯"。

千帆支援多種主流推理框架的,讓開發者可以根據實際場景選擇最適合的推理引擎。如,vLLM以高吞吐量和記憶體效率著稱,適合大規模模型部署;而SGLang特別是在延遲和吞吐量上優於其他主流框架。同時,允許使用者自定義匯入和部署模型,為DeepSeek開發提供了靈活性。

透過大廠和平臺企業的加入,AI普惠化將成為今年的發展主線之一。當大模型從"土豪玩具"變成"普通人的口糧",創新門檻的降低將激發更大的創造力,最終讓人類突破能力和資源的邊界——小店主用AI設計爆款包裝、中學生靠開源模型開發校園助手、鄉村醫生借多模態工具輔助診斷…這場全民參與的智慧革命,讓每個普通人都能站在AI的肩膀上,觸控曾經遙不可及的未來。

熱門資訊
  • 中國載人登月的動畫演示 | 2024-11-23 09:16:13
  • Shein、Temu越南註冊風波,東南亞多國加強跨境電商監管 | 2024-11-23 09:18:24
  • IBM大中華區董事長陳旭東:“員工舉報事件”指控並不成立 | 2024-11-23 09:18:30
  • 訊息稱英偉達 RTX 5090 顯示卡 GPU 尺寸比 RTX 4090 的大 22% | 2024-11-23 09:19:12
  • 在烏鎮的三點觀察 | 2024-11-23 09:20:24
  • 載人飛行器、物流無人機亮相網際網路大會現場 | 2024-11-23 09:20:45
  • 華擎銳炫 B580 桌面顯示卡曝光:2.8GHz GPU,雙 8-pin 電源介面 | 2024-11-23 09:30:40
  • 科學家拍到銀河系外首張恆星垂死特寫圖 | 2024-11-23 10:32:48
  • 量子糾纏的速度有多快?科學家記錄瞬時速度 | 2024-11-23 10:41:48
  • 微信或史詩級“瘦身” 記憶體有救了,在這裡開啟→ | 2024-11-23 10:56:11
  • 鍾睒睒,站在俞敏洪對面 | 2024-11-23 10:56:31
  • AMD 未來的 Ryzen SoC 可能採用新的晶片堆疊技術 | 2024-11-23 11:22:25
  • 藍色起源 New Glenn 火箭升上發射臺,預計 2024 年底首飛 | 2024-11-23 11:23:18
  • “力箭二號”運載火箭整流罩氣動平拋分離試驗取得圓滿成功 | 2024-11-23 11:23:26
  • 美國電信巨頭宣佈:關停NB-IoT網路! | 2024-11-23 11:29:58
  • 北大校友發現新型神經元,或促進司美格魯肽類藥物新發展 | 2024-11-23 11:31:37
  • 中國空間站將在軌運營10年以上,出艙維修難在哪兒? | 2024-11-23 11:54:18
  • 漫步者花再 Zero Clip 耳夾耳機開售,首發 359 元 | 2024-11-23 12:04:01
  • 華為徐直軍首談鴻蒙生態是什麼 | 2024-11-23 16:20:23
  • 陶哲軒宣佈“等式理論計劃”成功,57天完成2200萬+數學關係證明 | 2024-11-23 16:21:27
  • 歐盟要補貼成熟晶片! | 2024-11-23 16:21:32
  • 武漢大學黎威教授課題組《Small》:結合多功能奈米顆粒和活菌的雙層微針貼片用於長效治療特應性皮炎 | 2024-11-23 16:21:35
  • 華東師範大學,Nature Sustainability! | 2024-11-23 16:21:39
  • 新一代擎天柱!米家空調Pro新品官宣:更大 更廣 更遠 | 2024-11-23 16:23:33
  • 史上最高階外觀:REDMI Watch 5搭載2.07英寸高刷屏 超窄四等邊 | 2024-11-23 16:23:37
  • REDMI Watch 5超大屏驚豔亮相 網友直呼小米手環9買早了 | 2024-11-23 16:24:52
  • 臺積電宣佈N2P和N2X IP已準備就緒,客戶可設計效能增強的2nm晶片 | 2024-11-23 16:35:38
  • 數量與質量齊發展,中國學者2023年在Cell出版社發表論文創新高! | 2024-11-23 16:35:41
  • 外國機構評價中國晶片,製造裝置落後西方6年,但技術實現了反超 | 2024-11-23 16:38:13
  • 中國移動:30 億機頂盒專案比選開啟 | 2024-11-23 16:43:05
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們