時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

OpenAI怒斥Scaling撞牆論!o1已產生推理直覺潛力巨大

2024-11-25 13:58:03

新智元報道

編輯:Aeneas

【新智元導讀】Scaling Law撞牆了嗎?OpenAI高階研究副總裁Mark Chen正式駁斥了這一觀點。他表示,OpenAI已經有o系列和GPT系列兩個模型,來讓模型繼續保持Scaling。

最近,OpenAI高階研究副總裁Mark Chen在爐邊談話中,正式否認「Scaling Law撞牆論」。

他表示,並沒有看到Scaling Law撞牆,甚至OpenAI還有兩個範例——o系列和GPT系列,來保持這種Scaling。

用他的話說,「我們準確地掌握了需要解決的技術挑戰」。

o1不僅是能力提升,也是安全改進

從經濟角度看,OpenAI已經是最有價值的科技公司之一,因為他們為真實使用者提供了數十億美元的價值。

兩年前,AI最前沿的任務還是小學數學題;而今天,它們已經可以做最難的博士生題目。

因此,我們正處於這樣一個階段:AI模型能夠解決人類有史以來最困難的考試。

一旦這些模型解決了博士級別的問題,下一步,即使為世界提供實用性和價值。

當所有基準測試飽和之後,需要考慮的就是是否為終端使用者提供了價值。

雖然今天AI通過了基準測試,但它並沒有完全捕捉到AGI應該做的事。

好在,在過去一年裡,OpenAI內部發生了最令人興奮的進展——o1誕生了。

這不僅是一種能力上的提升,從根本上來說也是一種安全改進。

為什麼這麼說?

想象我們試圖對一個模型進行越獄,舊的GPT系統必須立即做出回應,所以可能更容易被觸發。

但當我們有一個推理器時,模型卻會反思:這個問題是不是試圖讓我做一些與我要做的不一致的事?

此時,它獲得的額外思考和反思的時間,會讓它在很多安全問題上更穩健。

這也符合OpenAI研究者最初的預期。

當我們談到推理時,這是一個廣泛的概念,不僅僅用於數學或程式設計。

在程式設計中使用的推理方法,可能也適用於談判,或者玩一個很難的遊戲。

而說到基準測試,在安全性上也有同樣的挑戰。

安全性有點類似於這種對抗性攻擊框架。在這種情況下,攻擊是非常強烈的,因此我們在這方面還有很長的路要走。

如何到達五級AGI

AGI從一級到五級,關鍵推動因素是什麼呢?

OpenAI提出的框架中,定義了AGI的不同級別,具體來說,就是從基本推理者發展到更智慧的系統,再到能在現實世界裡採取行動的模型,最終到達更自主、完全自主的系統。

在這個過程中,穩健性和推理能力是關鍵。

今天我們還不能依賴很多智慧體系統,原因是它們還不夠可靠。這就是OpenAI押注推理能力的原因。

OpenAI之所以大量投資,就是對此極有信心:推理能力將推動可靠性和穩健性。

所以,我們目前正處於哪一階段呢?

OpenAI研究者認為,目前我們正從第一階段向第二階段過渡,朝著更智慧系統的方向發展。

雖然目前,許多智慧體系統仍然需要人類監督,但它們已經變得越來越自主。模型可以自行原作,我們對於AI系統的信任也在逐漸增加。

合成數據的力量

合成數據,就是不由人類直接產生的資料,而是模型生成的資料。

有沒有什麼好的方法,來生成用於訓練模型的合成數據呢?

我們在資料稀缺或資料質量較低的資料集中,可以看到合成數據的力量。

比如,在訓練像DALL-E這樣的模型時,就利用了合成數據。

訓練影象生成模型的一個核心問題是,當我們去看網際網路上帶標題的圖片時,標題和它所描述的圖片之間通常關聯性很低。

你可能會看到一張熱氣球的照片,而標題並不是描述氣球本身,而是「我度過最好的假期」之類的。

在OpenAI研究者看來,在這種情況下,就可以真正利用合成數據,訓練一個能為圖片生成高保真標題的模型。

然後,就可以為整個資料集重新生成捕獲了,OpenAI已經證明,這種方法非常有效。

資料集中某方面較差的其他領域,也可以採用這個辦法。

Scaling Law沒有撞牆

最近很火熱的一個觀點是,Scaling Law已經撞牆了,許多大型基礎實驗室都遇到了預訓練的瓶頸。

果真如此嗎?

Mark Chen的觀點是,雖然的確在預訓練方面遇到一些瓶頸,但OpenAI內部的觀點是,已經有了兩種非常活躍的正規化,讓人生成無限希望。

他們探索了一系列模型的測試時Scaling正規化,發現它們真的在迅速發展!

在推理模型的Scaling上,也沒有同樣的障礙。

其實,從早期入職OpenAI後,研究者就一直遇到多個技術挑戰。現在這些挑戰已經非常具體,在Mark Chen看來,沒有什麼是完全無法應對的。

在OpenAI內部,大家經常說推理正規化已經達到了一定的成熟度。有些產品已經有了與市場的契合點,雖然進展仍然非常緩慢。

過去幾周內,最令人驚訝的使用場景,莫過於和o1進行頭腦風暴了。

o1和GPT-4的對比,讓人感受到了全新的深度:人類彷彿終於有了一個真正能互動的陪練夥伴,而非僅僅對自己的想法進行評論。

它彷彿一個真正的實體,非常有參與感。

o1的推理直覺,是如何產生的

OpenAI的研究者,是如何想到o1中的推理直覺的呢?

這是一個集體努力的結果,不過他們也進行了很長時間的工作,進行了一些探索性的重點嘗試。

在兩年前,他們就覺得,AI雖然非常聰明,但在某些方面是不足的。不知為什麼,總是感覺不太像AGI。

當時他們假設,原因在於,這是因為AI被要求立即做出回應。

就算我們要求一個人類立即做出回應,ta也未必能給出最好的答案。

一個人可能會說,我需要思考一會,或者我需要做一些研究,明天再答覆你。

就在這裡,OpenAI研究者發現了亮點!

其實這裡缺少的,是連線系統一和系統二之間的鴻溝。

快速思考有,知識也有,但卻沒有慢速思考,核心假設就在這裡。

研究者做了許多不同嘗試,來解決這個挑戰。

一群非常具有探索精神的研究者,獲得了一些生命跡象。

圍繞這些跡象,他們組建了研究團隊,擴大的專案規模,投入了大量的資料生成工作。

從快速進展中獲取預測結果,是整個案例中最難的部分。

開始時,就像登月計劃一樣,會遭遇很多失敗。

有三四個月,他們完全沒取得多少有意義的進展。

好在最終,總會有人獲得重大突破。這也就給了他們足夠的動力來投入更多資源,往前推動一點。

從o1推出幾個月後,OpenAI和許多外部合作伙伴進行了交流。

最酷的一件事就是,他們發現它比使用微調方法要好得多——它已經不太容易被問題難倒了。

很多應用已經超出了研究者之前關注的數學和科學領域。當看到AI的推理能力能泛化到這些領域,真的令人驚喜。

比如在醫學領域,模型在醫學症狀的判斷上,涉及形成假設、驗證,隨後再形成新的假設。

即使在研究者沒有特別關注的領域,模型也進展得很快,比如醫學、法律推理。

而他們也確信,在未來還會有其他還未測試過的領域,AI會有重大進展。

OpenAI仍然注重安全

Mark Chen肯定地說,目前OpenAI仍然像早期那樣,致力於研究和安全。

為此, 他 管理著一個非常龐大的研究專案組合。並且 一直在思考著應該分配多少資源和力量來進行探索性研究,而不是短期的即時專案。

不過,在這方面,OpenAI和很多大型基礎實驗室不同。

這些大實驗室有很多優秀的研究者,可以沒有方向地進行研究,自由地去做任何事。

但對OpenAI來說,他們比這些實驗室的規模都要小,因此需要更有方向性。

他們選擇了一些非常有信心的探索性專案,在這些領域內,給了研究者很大的自由度。

也就是說,OpenAI並不會進行毫無目標的探索,而且充分利用了自己規模小的優勢。

現在是AI創業的好時機

OpenAI的研究者也認為,現在是基於AI創立初創公司的好時機。

基礎模型的玩家專注的是通用性。

但像OpenAI這樣的公司,不可能涉足每一個垂直領域。

在特定領域定製一個模型,有很多空間和可能性。

現在,我們已經可以看到一個豐富的初創企業生態系統,這些企業在OpenAI的基礎上構建了各種型別的應用。

通常情況下,初創企業之所以能夠成功,是因為他們知道並堅信某個秘密,而市場上的其他人並不知道這個秘密。

在AI領域,實際上就是在一個不斷變化的技術棧上進行構建,我們無法預測下一個模型會何時出現。

表現最好的初創企業,就是那些有直覺,在剛剛開發發揮作用的邊緣技術上進行構建的企業,它們有一種生命力。

當我們擁有AGI,就是相當強大的形式,真正釋放了全部潛力。

想象一個人在一週內,就能建立一個帶來巨大價值的大型初創公司。

一個人在幾天內產生巨大影響的想法,已經不僅限於商業領域。

這種懷舊的感覺就像17世紀,科學家們在探討物理學一樣。

我們能否回到那種氛圍,一個人能做出醫學、物理學或計算機科學領域的重大發現?

而這些,都是因為AI。

參考資料:

https://x.com/tsarnick/status/1860458274195386658

熱門資訊
  • 英特爾 Arrow Lake 處理器0x114微碼更新號稱可帶來3-8%效能提升 | 2024-12-20 20:55:54
  • 俄自研EUV光刻機曝光:11.2nm光源,每小時可處理60片12吋晶圓 | 2024-12-20 21:25:03
  • 中國工程物理研究院《AFM》:在含能材料中透過有機染料修飾實現準均相催化 | 2024-12-20 21:44:22
  • 國產大飛機新訊息!C939飛機正在預研 | 2024-12-20 22:16:21
  • 中國青年學者一作,登上Science封面!四年連發4篇Nature、Science 正刊! | 2024-12-20 22:36:44
  • 我國 AR-500 無人直升機首次在城市內開展示範應用 | 2024-12-20 22:43:45
  • REDMI首發天璣8400 王騰:REDMI與聯發科聯合打造 | 2024-12-20 22:44:57
  • 日本三和推出插頭可 360° 旋轉的 USB-C 資料線 | 2024-12-20 22:47:18
  • 電腦品類唯一!機械革命斬獲2024京東金榜新品金獎 | 2024-12-20 23:00:34
  • 測試發現:英特爾酷睿 Ultra 9 285K 在Linux上比在Win11上快6~8% | 2024-12-20 23:18:25
  • 英偉達調查晶片如何流入中國 | 2024-12-20 23:24:39
  • 滯留太空的兩名NASA宇航員返程日期再推遲,不早於2025年3月 | 2024-12-20 23:25:00
  • 美國ITC應韓企要求對無線通訊裝置啟動337調查 戴爾、聯想為列名被告 | 2024-12-21 00:10:36
  • Mol Cell | circRNA調控mRNA穩定性 | 2024-12-21 00:15:08
  • 技嘉 B850 AORUS ELITE 主機板曝光,預計 CES 2025 亮相 | 2024-12-21 00:23:57
  • Cell推出“全球科學50人”,鮑哲南/李飛飛/季維智/胡海嵐/胡小玉/徐瑞華/程功/吳晨等14位華人科學家 | 2024-12-21 00:27:59
  • 新事丨GLP-2新藥被FDA拒批 | 2024-12-21 00:28:06
  • 140家晶片企業被列入“實體清單”,國產晶片如何突圍? | 2024-12-21 00:45:52
  • 晶片不賣中國,美芯無處可賣,終於認清中國市場無可替代 | 2024-12-21 00:59:46
  • 影片監控龍頭,簽約中國電信!梁寶俊出席! | 2024-12-21 01:46:17
  • 一鍵生成萬字專利!中科院釋出多智慧體框架AutoPatent,含1933個「草稿-專利」資料對 | 2024-12-21 02:45:26
  • 切斷後仍可恢復初始亮度的98.6%:科學家研發電致發光纖維,可用於互動式顯示和抗損傷導航 | 2024-12-21 04:26:15
  • 1000公里/小時,比民航飛機還要快,中國“超級高鐵”呼之欲出 | 2024-12-21 05:08:49
  • 科學家利用“大資料+人工智慧”首次繪製出地球早期生命演化史 | 2024-12-21 05:12:41
  • 花幾個億建智算中心,八成的GPU租不出去丨焦點分析 | 2024-12-21 05:51:03
  • Nature|靶向SARS-CoV-2 NSP14 RNA加帽甲基轉移酶的新型小分子抑制劑 | 2024-12-21 05:57:23
  • JCB | 陳宇課題組揭示SARS-CoV-2 N蛋白透過抑制NF-κB啟用調控病毒特異性適應的致病機制 | 2024-12-21 05:58:01
  • OpenAI最強推理模型o3釋出!但明年才能用 | 2024-12-21 06:24:16
  • 2024半導體市場,儲存一枝獨秀 | 2024-12-21 06:24:18
  • 西部(重慶)科學城科學會堂即將正式投用 | 2024-12-21 06:25:15
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們