時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

別被誤導 | 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型??

2025-02-07 16:30:33

作者:張發恩 創新奇智CTO

轉載自公眾號:後向傳播

最近一篇新聞標題《李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型》吸引了不少眼球,似乎預示著AI技術即將迎來一場“廉價革命”。 不少人可能會驚呼:“什麼?不到50美元就能訓練出媲美DeepSeek Rl的AI模型?這AI也太便宜了吧!”

但,事實真的如此嗎? 作為一名AI從業者,看到這個標題,我感覺事情並不簡單。仔細研讀新聞和相關論文後,我發現這篇新聞的解讀存在不少誇大和誤導之處。 我詳細讀了原論文,儘可能還原事實,避免大家被不實資訊所誤導。

“標題黨”嫌疑:事實可能並非如此“美好”

1. “媲美DeepSeek R1”?實際效果可能與你的期待有差距

DeepSeek R1是DeepSeek公司推出的 閉源 大模型,而新聞中提到的 s1模型 , 實際上是與 OpenAI的o1-preview模型 以及 DeepSeek-R1 800K資料蒸餾出的32B模型 做對比。注:DeepSeek R1是670B的大模型,與DeepSeek-R1 800K資料蒸餾出的32B模型是完全不同的兩個模型。

論文中的實驗結果表明,s1模型在 部分 推理任務上(例如AIME24競賽數學題)超過了o1-preview , 但這並不代表s1模型就 全面媲美 甚至 超越 了DeepSeek R1。更重要的是, s1的效果離DeepSeek-R1 800K資料蒸餾出的32B模型 還有不小的差距 。新聞標題用 “媲美DeepSeek Rl” 這樣的字眼, 容易給讀者造成 s1模型已經可以和DeepSeek的頂尖模型相提並論 的 錯誤印象 。下圖是s1論文披露的實驗資料(https://arxiv.org/pdf/2501.19393)

2. “不到50美元”?請注意限定語和實際成本

新聞中 “用不到50美元的雲端計算費用” 的說法, 容易讓人誤以為訓練一個高效能AI推理模型只需要區區幾十美元 。但實際上,這50美元僅僅是 指論文中s1模型在16張H100 GPU上訓練26分鐘的雲端計算費用 。

這 “不到50美元” 的成本, 僅僅是模型微調階段的計算成本 ,並不包括 :

前期資料收集和清洗成本為了構建高質量的1K訓練資料集s1K,研究團隊需要從59K原始資料集中進行篩選和標註,這其中投入的人力成本和時間成本遠不止50美元 。預訓練模型的成本s1模型是基於 Qwen2.5-32B-Instruct 這個 已經預訓練好的大模型 進行微調的。 預訓練大模型的成本是極其高昂的 ,動輒數百萬美元甚至更高。新聞有意忽略了預訓練階段的巨大投入,只強調微調的低成本,有“避重就輕”之嫌 。

3. “訓練出媲美...的AI推理模型”?資料篩選的功勞不可忽視

新聞標題容易讓人覺得, 是李飛飛團隊提出了一種 革命性的模型訓練方法 ,才能用 “不到50美元” 訓練出高效能模型。 但深入分析論文後, 我們發現 資料篩選 在 s1模型的成功中扮演了至關重要的角色。

s1模型的核心創新之一, 在於其構建的 高質量小樣本資料集 s1K 。 研究團隊並非隨機使用1K資料進行訓練, 而是從59K 資料集中 精心篩選 出1K 高質量樣本。 篩選過程主要包括:

質量篩選去除低質量、存在格式錯誤或 API 錯誤的資料。難度篩選去除 Qwen2.5-7B-Instruct 或 Qwen2.5-32B-Instruct 等模型能夠輕鬆解答的簡單問題。多樣性篩選根據 MSC 分類系統對問題進行領域分類, 確保資料集涵蓋不同領域的知識。

實驗結果表明,使用精心篩選的1K 資料訓練的模型,效能甚至可以媲美使用全量59K 資料訓練的模型 ,遠超 隨機選擇資料或僅考慮資料長度、多樣性的方法。這說明,在資料驅動的AI領域,資料質量往往比資料數量更重要 。 s1模型的成功, 很大程度上歸功於其高質量的資料篩選策略,而非僅僅是 “低成本” 訓練 。

論文的創新之處:小樣本高效微調 + 推理預算強制

當然, 這篇論文並非一無是處。 s1論文在以下方面還是有其創新性和貢獻的 :

1. 驗證了小樣本高效微調的可行性

s1論文再次印證了 高質量小樣本資料在模型微調中的巨大潛力 。 在算力成本高昂、 資料獲取困難的背景下, 如何利用少量資料訓練出高效能模型 一直是 AI 領域的研究熱點。 s1論文提供了一個 利用資料篩選策略實現小樣本高效微調 的成功案例, 為後續研究提供了有益的參考。 尤其值得肯定的是, 論文開源了高質量的 s1K 資料集 , 這將有助於推動小樣本學習和推理相關領域的研究進展。

2. 提出 “推理預算強制” 方法, 探索推理過程干預

s1論文提出的 “推理預算強制 (Budget Forcing)” 方法,也為 模型推理過程的干預和調控 提供了一種新的思路。 透過 強制結束或延長模型的思考時間 , s1模型能夠在推理過程中進行自我調整和最佳化 ,從而在一定程度上提升推理效能。 這種 在推理階段對模型行為進行干預 的思想,具有一定的啟發意義 ,未來或可應用於更多推理最佳化方法的研究中。

理性看待技術進步,“標題黨”新聞對行業有害

總的來說,“李飛飛團隊50美元AI模型” 這篇新聞標題存在誇大和誤導之處 , 容易讓讀者對 AI 技術的現狀產生不切實際的幻想。 s1模型 的成功, 是資料質量、 巧妙技術和現有預訓練模型共同作用的結果, 並非 “廉價” 和 “速成” 的代名詞 。

我們肯定 s1論文在小樣本學習和推理干預方面 的探索和貢獻 ,讚賞研究團隊開源高質量資料集的舉動 。但同時,我們必須保持清醒的認識 :

AI 技術的發展仍然面臨諸多挑戰 “廉價” 和 “通用” 的 AI 模型離我們還很遙遠 。資料質量是 AI 模型效能的關鍵 “煉丹” 並非易事,需要精細的調參和最佳化 。“標題黨” 式新聞 為了博取眼球, 不惜誇大事實甚至歪曲真相 容易誤導公眾,甚至對行業發展產生負面影響 。

作為AI從業者和愛好者,我們應該保持理性思考,客觀看待技術進步,警惕 “標題黨” 式新聞的危害,共同營造一個健康、理性的 AI 發展環境 。 腳踏實地,一步一個腳印,才是 AI 技術走向成熟的正確道路 。

熱門資訊
  • 一加 13:冬日小確幸,處處小驚喜 | 2024-11-27 14:01:15
  • 臺媒:臺積電前董事長稱臺積電最先進技術在美生產,可能賠上百億美元 | 2024-11-27 14:16:00
  • ProGrade Digital 在日推出 USB4 pSSD,最高順序讀寫 2500MB/s | 2024-11-27 14:16:26
  • 長二丙發射兩顆四維高景衛星!進一步提升國內領先的光SAR一體服務能力 | 2024-11-27 14:25:49
  • 華為鴻蒙智家全新亮相:這是智慧與人居關係的一次大升階 | 2024-11-27 14:27:43
  • TCL 海外推出首款便攜投影 Projector A1:1080p、360 流明 | 2024-11-27 14:40:24
  • 再次挑戰 小米自研移動晶片預計2025年量產 | 2024-11-27 14:46:16
  • 小巧與便攜的極致:DJI Mic Mini如何重新定義創作者需求? | 2024-11-27 14:46:42
  • AMD RDNA 4 顯示卡即將登場,RX 8000 系列有望明年 1 月釋出 | 2024-11-27 14:58:27
  • 疑似榮耀平板V9入網 主打輕薄和AI 配天璣8350晶片 | 2024-11-27 15:08:09
  • 【IT之家評測室】陸地大疆?螢石 TAMO 看護攝像機體驗 | 2024-11-27 15:15:52
  • 蘋果公佈2024年度最佳App入圍名單:45款入圍App及遊戲 | 2024-11-27 15:44:29
  • Valve 新一代 VR 控制器“Roy”模型曝光,採用無環設計 | 2024-11-27 15:44:33
  • 介面比微軟漂亮!訊息稱華為明年上半年釋出鴻蒙PC:打生態鏈閉環 | 2024-11-27 15:50:06
  • 華為旗艦鴻蒙平板將於12月12日開售 PC級專業生產力 | 2024-11-27 15:57:01
  • 5499 元,小米米家空調巨省電 Pro 立式 3 匹(超一級能效)釋出 | 2024-11-27 15:57:03
  • LG UltraGear OLED 45GX950A 顯示器曝光:5120 x 2160 解析度 | 2024-11-27 15:57:05
  • REDMI預熱Buds6 Pro電競版耳機 首發無線麥功能 | 2024-11-27 16:11:09
  • REDMI Watch5 eSIM版即將釋出 支援網路和藍芽雙模式對講 | 2024-11-27 16:11:11
  • OneGx 2 掌上游戲本結構確認:虛擬鍵盤 + 可拆卸實體鍵盤組合 | 2024-11-27 16:13:21
  • 一圖看懂華為M.2固態硬碟:疾速7400MB/s 壽命顯著領先同行 | 2024-11-27 16:20:36
  • 華為Mate 70系列業界首發衛星尋呼功能 持續領跑終端衛星通訊領域 | 2024-11-27 16:29:27
  • 風向突變,這些大品牌表示“不再抵制”馬斯克的X平臺 | 2024-11-27 16:40:51
  • 英偉達被曝將在華推出閹割版5090顯示卡 | 2024-11-27 16:41:27
  • 膝上型電腦極速大屏化:16英寸+已成第一大尺寸 | 2024-11-27 16:49:23
  • SpaceX 獲准繼續發射星艦,環保組織訴訟被駁回 | 2024-11-27 16:57:42
  • DJI Mic Mini:輕盈登場,解鎖音訊創作無限想象 | 2024-11-27 16:58:25
  • 國風水墨設計!七彩虹全新iGame影系列記憶體圖賞 | 2024-11-27 17:21:26
  • SK海力士正在NAND快閃記憶體領域獲得技術優勢 覬覦三星的主導地位 | 2024-11-27 17:21:27
  • Intel二代銳炫B580核心、視訊記憶體位寬“縮水”!效能卻更好 | 2024-11-27 17:21:29
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們