時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

開工首日,國產晶片萬卡叢集和DeepSeek相關訊息來了

2025-02-08 07:50:16

文|數智前線 趙豔秋 周享玥

2月5日開工第一天,業界傳來大訊息,智慧雲成功點亮自研崑崙芯三代萬卡叢集,這也是國內首個正式點亮的自研萬卡叢集。除了解決自身算力供應問題之外,有望進一步降低大模型成本。

此前,DeepSeek推出V3和R1模型,以可媲美OpenAI領先模型的效果和極大的成本降低,在春節期間引爆全球市場。

在陸續取得突破的背後,AI大模型競爭也進入新時期——不再侷限於技術,而是成本、使用者體驗、生態體系的綜合較量。"每天一杯奶茶錢就能養AI"不再是夢,AI加速走向普惠化。

DeepSeek之後,國產自研萬卡叢集亮相

實際上,在DeepSeek新模型推出後,最近幾天,海內外晶片行業動作頻出。海外如、AMD、英特爾,國內如華為昇騰、沐曦、天數智芯、摩爾執行緒、海光等,紛紛宣佈支援DeepSeek模型部署、推理服務。

而在2月5日新春後開工首日,百度智慧雲也宣佈,成功點亮崑崙芯三代萬卡叢集,萬卡叢集的建成,將進一步推動模型降本。

此前,海外的、亞馬遜AWS和特斯拉都自研部分晶片,來降低成本,提升價效比。在中國,過去一年,算力緊張是大模型成本居高不下的重要因素之一。透過自研晶片和大規模叢集的建設,不僅解決了自身算力供應問題,也有望進一步降低大模型成本。

崑崙芯是百度自研的AI晶片,初代於2018年推出。

最近兩年,崑崙芯對外鮮有報道。但在點亮萬卡叢集之前,業界已經聽到了一些風聲。外界推測,崑崙三代晶片於2024年量產。也有行業內企業告訴數智前線,2024年下半年,他們曾評估購買基於崑崙三代晶片的伺服器。

百度董事長李彥宏曾在一些場合強調,崑崙芯是百度AI技術棧的"基石",自研能力保障了在生成式AI時代的技術主權。

在2024年的一些對外介紹中,百度稱崑崙芯,與飛槳深度學習框架、文心大模型深度協同,形成"晶片-框架-模型-應用"的端到端最佳化,提升整體效能。

數智前線獲悉,此前兩代崑崙晶片,主要用於AI的部署和推理服務。崑崙芯三代則更進一步,是為大模型和訓練最佳化的AI雲端晶片。

這次點亮的萬卡叢集,可將千億引數模型的訓練週期大幅降低,同時能支援更大模型與複雜任務和多模態資料,支撐Sora類應用的開發。此外,萬卡叢集能支援多工併發能力,透過動態資源切分,單叢集可同時訓練多個輕量化模型,透過通訊最佳化與容錯機制減少算力浪費,實現訓練成本指數級下降。

值得關注的是,今年推理市場也將是重頭戲。數智前線獲悉,國內外晶片企業,都在鉚足勁拼搶英偉達的市場份額。一位AI算力資深人士告訴數智前線,推理追求的是"能效比",比拼每瓦的計算效能。

預計百度崑崙芯叢集也將加入這一市場的爭奪。而針對推理市場,業界的策略是圍繞主流模型,做好適配服務。毫無疑問,除了自身的文心一言,崑崙芯也適配了DeepSeek等一眾模型。

在百度官宣中也提及,隨著國產大模型的興起,萬卡叢集逐漸從"單任務算力消耗"到"叢集效能最大化"過渡,"將訓練、微調、推理任務混合部署",從而提升叢集綜合利用率,降低單位算力成本。

接下來,海內外大廠面臨如何突破英偉達的CUDA護城河。在過去10多年,英偉達利用CUDA生態,既把持訓練市場,又圍獵推理市場。CUDA的厲害之處,是面向生命科學、量化、自動駕駛等場景持續開發應用庫。"你要完成一個藥物分子、自動駕駛的應用,CUDA上可能已寫了10萬行程式碼,你可能再寫幾百行,就解決問題了。"上述人士說。

目前,不少國家如英國、法國、加拿大和中國企業在AI晶片生態上表現出倔強和韌性,開展基礎生態建設。另外,全球一些國家的高校實驗室和科研機構,在政府的支援下,也持續在做基礎工作。

"每天一杯奶茶錢就能養AI"

在最新的晶片進展之外,DeepSeek掀起的大模型風暴也在繼續,而各大雲端計算大廠已紛紛宣佈支援DeepSeek模型呼叫或部署,並捲起價格戰,爭奪市場。

大廠的積極性,與DeepSeek模型在全球掀起的巨大流量相關。這個春節假期,"神秘的東方力量"、"AI界拼多多"、"每天一杯奶茶錢就能養的AI"……國產大模型DeepSeek,不管是在國內,還是國外,都賺足了關注度。

2月4日,AI產品榜公佈,根據最新統計資料,上線20天,DeepSeek應用(不包含網站資料)日活已破2000萬,上線5天時日活就已超過ChatGPT上線同期日活,成為全球增速最快的AI應用。

在微博,2月4日,"DeepSeek回答如何過好這一生"一度登上熱搜第一位。在小紅書,DeepSeek相關筆記已迅速超49萬,各類教程、測評帖密集湧現,甚至有人玩起了"AI算命"。

"免費使用+更好的效果"是吸引普通使用者嚐鮮的關鍵。

更為關鍵的是,Deepseek給了OpenAI價格體系一記重擊。多項資料測算,如果以平均使用情況計算,DeepSeek-R1 的整體成本,約為OpenAI o1模型的1/30,讓人們可以用極低的成本應用AI。

隨著 DeepSeek 的爆火,科技大廠之間的大模型價格戰愈發激烈。海外的微軟 Azure、AWS和英偉達NIM服務,接入DeepSeek模型,試圖透過更具吸引力的價效比來搶奪市場份額。國內的運營商、阿里雲、百度智慧雲、火山引擎等也不甘示弱,以各種形式接入DeepSeek模型後,展開了價格博弈。

一些雲端計算企業的價格與Deepseek官方刊例價一致,或在此基礎上有一定優惠或免費額度。

其中,2月3日,百度智慧雲打出的價格最低,百度智慧雲R1呼叫價格,是Deepseek官方刊例價的5折,V3呼叫價格是官方刊例價的3折,並限時免費兩週。

大模型呼叫價格的大幅下降,降低了高質量模型的使用門檻,企業決策阻力驟減,也快速引爆了開發者的熱情。

在全球各個技術論壇上,"DeepSeek"是最燃的話題。在開發者社群CSDN上,全站綜合熱榜前十名中,有四條都與DeepSeek有關,相關應用迅速湧現。有網友用DeepSeek將老照片修復成彩色的,期間沒寫一行程式碼。

在金融行業,江蘇銀行將DeepSeek引入到自身服務平臺"智慧小蘇"中,並將DeepSeek-VL2多模態模型、輕量DeepSeek-R1推理模型,分別運用到了智慧合同質檢和自動化估值對賬場景中。

某跨國藥企基於DeepSeek-R1模型構建藥物副作用預測系統,結合患者歷史資料與實時監測,降低臨床試驗風險。

上海交通大學已開始用DeepSeek-V3生成合成資料,開發垂類大模型。

事實上,OpenAI為了應對DeepSeek的競爭,已迅速推出新模型o3-mini,其定價也被打下來了。

儘管這一價格仍高於DeepSeek的定價,但這是一個顯著的降價趨勢。

實際上,DeepSeek這輪大火,也標誌著AI大模型競爭不再侷限於技術,而是成本、使用者體驗、生態體系的綜合較量。

"每天一杯奶茶錢就能養AI"不再是夢。業界這一輪動作,以極具競爭力的價格優勢,不僅改變了普通使用者對 AI 的使用習慣,更在行業內掀起了一股變革的浪潮,推動著 AI行業朝著更普惠的方向發展。

大模型普及程序將加速

一旦各方科技大廠和平臺力量加入,由DeepSeek引發的大模型普惠的程序將加速。

2月3日,我們體驗了公有云的DeepSeek API呼叫,用Deepseek R1,特別體驗了兩個玩法:

玩法一:秦始皇AI軍師體驗卡

玩法二:老照片時光染色機

可以看到,即便之前沒有任何技術背景,登入百度智慧雲網站,只需要點選線上體驗,進行實名認證,在"模型廣場"就可以輕鬆呼叫DeepSeek-R1和DeepSeek-V3模型。

使用者還可在千帆提供的67個模型中,一次性選擇六個模型,讓他們同時幹一件事,直觀對比模型的效果,最終用腳投票。

這也是平臺的優勢所在,整合各種模態的開閉源模型,就好比AI界的"滴滴打車",既能比價比質,讓使用者自由選擇最高效價比模型服務,也能智慧"拼車"、多模態協同,互補模型能力,增強應用深度。

在各種配套服務上,頭部雲平臺們,在一站式開發工具鏈、全生命週期安全機制、行業解決方案等各項能力的搭建和完善上,也有著極快的反應速度。

在工具鏈上,儘管大模型爆發已兩年,但門檻依然較高,需輔以各種好用的工具。比如我們發現,在Github社群上,按Star數排序,其中最受歡迎的DeepSeek專案,一個是幫助開發者使用DeepSeek的工具集——DeepSeek-Tools,另一是幫助開發者自動選擇和最佳化DeepSeek模型超引數的DeepSeek-AutoML。

各雲大廠也都在工具鏈上進行了諸多佈局,如百度智慧雲的千帆大模型平臺,雖然沒有直接上架DeepSeek工具包,但已集中各種類似工具,如資料加工、工作流編排、模型精調、模型評估、模型量化......

當企業使用者使用DeepSeek模型開發應用,卻擔心訓練資料洩露、生成內容不符合規範以及模型在推理過程中被惡意攻擊等問題時,各雲平臺也都在安全機制上進行了保障。

根據新聞介紹,百度智慧雲在將DeepSeek接入千帆推理鏈路時,支援了百度獨家內容安全運算元,保障內容生成的安全;透過資料保險箱產品,保證模型僅可用於推理預測程式,訓練資料僅可用於模型微調程式;千帆平臺整合的BLS日誌分析和BCM告警功能,也能保障金融或醫療等對安全要求較高的使用者,構建的智慧化應用更安全可靠。

而云平臺們積累的更廣泛的行業覆蓋和行業解決方案,也能幫助開發者實現在對應行業和場景的快速複製與場景適配,讓DeepSeek快速進入這些垂直領域。

除了這些,面向企業逐漸從模型訓練、微調轉向推理的大背景,推理的支撐和最佳化成為關鍵。百度智慧雲對DeepSeek進行了專項最佳化,如透過針對DeepSeek模型MLA結構的計算進行了極致的效能最佳化;並透過計算、通訊、訪存不同資源型別運算元的有效重疊及高效的Prefill/Decode分離式推理架構等,在核心延遲指標TTFT/TPOT滿足SLA的條件下,實現吞吐量"坐火箭",推理成本"坐滑梯"。

千帆支援多種主流推理框架的,讓開發者可以根據實際場景選擇最適合的推理引擎。如,vLLM以高吞吐量和記憶體效率著稱,適合大規模模型部署;而SGLang特別是在延遲和吞吐量上優於其他主流框架。同時,允許使用者自定義匯入和部署模型,為DeepSeek開發提供了靈活性。

透過大廠和平臺企業的加入,AI普惠化將成為今年的發展主線之一。當大模型從"土豪玩具"變成"普通人的口糧",創新門檻的降低將激發更大的創造力,最終讓人類突破能力和資源的邊界——小店主用AI設計爆款包裝、中學生靠開源模型開發校園助手、鄉村醫生借多模態工具輔助診斷…這場全民參與的智慧革命,讓每個普通人都能站在AI的肩膀上,觸控曾經遙不可及的未來。

熱門資訊
  • Nature | 阿爾茨海默症具有“可傳播性(transmissible)”? | 2024-01-31 02:31:45
  • 英偉達特供晶片賣不動了?黃仁勳穿上東北花襖“示好”,中國大廠難掩AI野心 | 2024-01-31 02:46:49
  • 聯想拯救者 Y7000P 遊戲本 RTX 4070 版本開售,售價 8999 元 | 2024-01-31 03:48:17
  • 蘋果 Apple Vision 頭顯媒體評測解禁:驚豔的科技,迷茫的未來 | 2024-01-31 04:04:11
  • 獨家對話CEO,解密華強北Vision Pro,最難“山寨”的蘋果產品! | 2024-01-31 04:11:16
  • 前蘋果設計主管曾希望將MacBook Pro和MacBook Air變成一款產品 | 2024-01-31 04:11:28
  • 機械革命15.3英寸翼龍15Pro遊戲本曝光:AMD R7 8845H + RTX 4060 | 2024-01-31 04:24:10
  • 谷歌有望開放 Ultra HDR 格式,允許第三方應用拍攝高動態照片 | 2024-01-31 04:27:33
  • 安卓影像之王!小米14 Ultra下個月釋出,一英寸主攝+可變光圈! | 2024-01-31 06:10:20
  • 小米王騰:Redmi K70系列銷量已突破200萬臺 | 2024-01-31 06:10:30
  • “有人嫌棄有人愛”,不同航司對MAX 10飛機態度不一 | 2024-01-31 06:26:04
  • 郭明錤:蘋果最快明年推出新設計機型,iPhone今年出貨將顯著衰退 | 2024-01-31 06:55:59
  • AR 野心遭遇 VR 現實:蘋果Vision Pro頭顯影片透視功能並非完美 | 2024-01-31 06:56:08
  • 138億年前面的時間是什麼?465億光年外面的空間又是什麼? | 2024-01-31 06:56:16
  • 麒麟晶片加持!新款Pocket 2將至,華為能否一雪前恥? | 2024-01-31 07:10:56
  • 讓NAS使用體驗更上一層樓!西部資料紅盤Plus/ProNAS硬碟評測 | 2024-01-31 07:11:04
  • 長續航與輕薄也可兼得,榮耀Magic6 Pro 續航評測 | 2024-01-31 07:11:40
  • 訊息稱三星 Galaxy Z Flip 6 手機將配備更大電池,容量達4000mAh | 2024-01-31 07:20:32
  • 工業設計之美!努比亞Z60 Ultra上手(外觀篇) | 2024-01-31 07:33:48
  • 4000億天價薪酬被判無效,馬斯克怒了 | 2024-01-31 07:44:23
  • 梁汝波批位元組組織平庸化:離職員工1個月能幹位元組半年的活 | 2024-01-31 07:44:30
  • AM: 可耐2000 °C!具有超高強度和高熱絕緣效能的多孔高熵陶瓷 | 2024-01-31 07:44:42
  • 郭明錤預期蘋果或是“今年衰退最大主流手機廠商” | 2024-01-31 08:17:15
  • 谷歌母公司Q4營收863.1億美元,淨利206.9億 | 2024-01-31 08:17:18
  • 德國警方調查盜版電影網站 意外收穫5萬個“十年陳”比特幣 | 2024-01-31 08:17:21
  • 馬斯克:人類首次植入腦機介面晶片,用意念操作裝置 |【經緯低調分享】 | 2024-01-31 08:17:25
  • AI大考當前標普納指回落,財報後谷歌、AMD大跌 | 2024-01-31 08:17:29
  • 我國首款巢狀式霍爾推力器成功點火執行:50千瓦級雙環動力 | 2024-01-31 08:17:33
  • 馬斯克聲稱Neuralink已完成首例人類腦機介面晶片植入 | 2024-01-31 08:19:49
  • AMD四季度營收62億美元 淨利6.67億暴漲30倍,但盤後暴跌 | 2024-01-31 08:37:23
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們