時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

速度放緩!OpenAI新旗艦模型進步幅度沒那麼大

2024-11-11 15:24:10

11月11日訊息,儘管使用聊天機器人ChatGPT等人工智慧產品的人數在激增,但支撐這些技術的底層模組的改進速度似乎正在放緩。為此,ChatGPT的開發者OpenAI正在開發新技術,以增強大語言模型等核心模組,從而應對這一挑戰。

OpenAI即將推出的旗艦模型“獵戶座”(Orion)所面臨的挑戰突顯了公司當前遇到的難題。今年5月,OpenAI執行長薩姆·奧特曼(Sam Altman)在內部透露,他預計正在訓練中的獵戶座將顯著優於一年前釋出的上一代旗艦模型。據知情人士稱,儘管獵戶座的訓練進度僅完成20%,但其智慧和任務完成能力已與GPT-4不相上下。

不過,一些使用或測試過獵戶座的OpenAI員工表示,儘管其效能確實超越了前代模型,但提升幅度遠不及從GPT-3到GPT-4的躍升。一些研究人員指出,獵戶座在處理特定任務時未必穩定優於前代模型。一位員工表示,獵戶座在語言任務上表現出色,但在編碼等任務中可能不如之前的模型。這種情況可能會帶來問題,因為與OpenAI近期釋出的其他模型相比,獵戶座在資料中心的執行成本更高。

獵戶座的表現正在考驗人工智慧領域的核心假設——縮放定律,即只要資料量和計算能力持續增加,大語言模型就能不斷改進。面對GPT改進速度放緩帶來的挑戰,業界似乎正將重點轉向初始訓練後的模型最佳化,這可能會產生一種新的縮放定律。

Facebook母公司Meta執行長馬克·扎克伯格(Mark Zuckerberg)在內的一些科技領袖認為,即使在技術未能進一步突破的最壞情況下,基於當前技術仍然有很大的開發空間來建立面向消費者和企業的產品。

OpenAI正在應對競爭對手Anthropic的威脅,將更多的程式碼編寫功能嵌入其模型中,並開發能夠模擬人類操作計算機的軟體,以完成涉及瀏覽器和應用程式操作的白領任務,如點選、游標移動和文字輸入等。

這些產品屬於能夠執行多步驟任務的AI代理範疇,其革命性可能與ChatGPT的首次釋出相當。

扎克伯格、奧特曼及其他人工智慧開發者的高管表示,他們尚未觸及傳統縮放定律的極限。也因此,包括OpenAI在內的公司依舊投資數十億美元建設資料中心,以儘可能提高預訓練模型的效能。

然而,OpenAI研究員諾姆·布朗(Noam Brown)在上月的TEDAI大會上提出警告,認為開發更先進的模型可能在經濟上變得不可持續。他表示:“我們真的會投入數千億甚至萬億美元來訓練模型嗎?縮放模式在某個時刻會失效。”

在公開發布獵戶座之前,OpenAI仍需完成複雜的安全測試。據員工透露,獵戶座可能會在明年初發布,並可能放棄傳統的“GPT”命名方式,以突顯大語言模型改進的新特性。對此,OpenAI發言人未予置評。

資料匱乏成為模型訓練的瓶頸

OpenAI的員工和研究人員指出,GPT進步放緩的原因之一在於高質量文字和其他資料的供應日益減少。大語言模型在預訓練階段需要這些資料來理解世界和不同概念之間的關係,以解決如撰寫博文或修復編碼錯誤等問題。

近年來,大語言模型主要依賴於網站、書籍等來源的公開文字資料進行預訓練,但開發者已幾乎耗盡了這類資料的潛力。為此,OpenAI組建了由曾負責預訓練的尼克·賴德(Nick Ryder)領導的基礎團隊,致力於研究如何應對資料短缺問題,並探索縮放定律的持續適用性。

據OpenAI員工透露,獵戶座部分使用了由其他OpenAI模型(如GPT-4和最近釋出的推理模型)生成的AI資料進行訓練。然而,這種合成數據也帶來了新問題,可能導致獵戶座在某些方面與前代模型過於相似。

OpenAI的研究人員正在利用其他工具,透過改進特定任務的處理方式來最佳化模型後期的表現。他們採用一種稱為強化學習的方法,讓模型從大量已正確解決的問題中學習,如數學和編碼問題。

此外,研究人員還邀請人類評估員在編碼或問題解決任務上測試預訓練模型,並對其答案進行評分,這有助於研究人員調整模型,使其在寫作和編碼等請求上的表現更佳。這一過程稱為帶有人類反饋的強化學習,也曾幫助過早期的AI模型改進。

OpenAI及其他AI開發商通常依賴初創公司,如Scale AI和Turing,來管理成千上萬名承包商,以處理這些評估工作。

OpenAI還開發了一種名為o1的推理模型,該模型在回答前會花費更多時間“思考”訓練資料,這一過程稱為測試時間計算。這意味著,即使不改變底層模型,給o1分配更多計算資源,也可以持續提高其響應質量。據知情人士透露,即使底層模型改進速度較慢,若OpenAI能保持持續改進,仍然可以實現更好的推理效果。

“這為模型擴充套件開闢了新維度,”布朗在TED大會上說。他補充道,研究人員可以透過“每次查詢成本從1美分提高到10美分”來提升模型響應質量。

奧特曼也強調了推理模型的重要性,認為它可與大語言模型結合使用。“我希望推理能力能夠解鎖我們多年未能實現的突破,比如讓模型在科學研究和複雜程式碼編寫中做出貢獻,”奧特曼在一場應用開發者活動中表示。

在最近接受Y Combinator執行長陳嘉興(Garry Tan)採訪時,奧特曼透露:“我們基本上知道如何實現通用人工智慧——一種能達到人類能力的技術,其中一部分是創造性地運用現有模型。”

數學家和科學家們表示,o1對他們的研究工作有幫助,能作為合作伙伴提供反饋和啟發。然而,據兩位知情員工透露,由於o1的價格是非推理模型的六倍,因此其客戶基礎尚未普及。

突破瓶頸,提升推理能力

一些對AI開發商投資數千萬美元的投資者疑慮大語言模型的改進速度是否開始趨於平穩。

風險投資家本·霍洛維茨(Ben Horowitz)在YouTube一段影片中表示:“我們正以相同的速度增加訓練AI的圖形處理單元,但在智慧提升方面未見顯著改善。”霍洛維茨的風投公司不僅是OpenAI的股東,還投資了Mistral和Safe Superintelligence等競爭對手。

霍洛維茨的同事馬克·安德森(Marc Andreessen)在同一影片中指出:“許多聰明人在致力於突破瓶頸,探索如何提升推理能力。”

企業軟體公司Databricks聯合創始人兼主席伊翁·斯托伊卡(Ion Stoica)表示,大語言模型在某些方面可能已趨於穩定,但在其他領域仍有改進空間。他還開發了一個網站,供應用開發者評估不同的大語言模型。

斯托伊卡稱,儘管AI在編碼和解決複雜問題上不斷進步,但在執行通用任務(如分析文字情感或描述醫療症狀)時,進展似乎放緩。

“在常識性問題上,我們似乎看到大語言模型的表現趨於平穩。為實現進一步突破,我們需要更多的事實性資料,而合成數據幫助有限。”(小小)

熱門資訊
  • 24GB+1TB突降500元,2K旗艦屏+驍龍8Gen3,幸福來得太突然 | 2024-02-11 18:52:42
  • 小米推出27寸Mini LED顯示器 | 2024-02-11 18:52:48
  • 供不應求兩個月終於現貨,驍龍8Gen3+120倍變焦,僅售3399元 | 2024-02-11 18:52:53
  • 蘋果確認Apple Watch Series 9與Ultra 2部分裝置存在觸控異常,正全力調查 | 2024-02-11 18:52:56
  • 外星金屬製造?科學家發現一外星金屬製造的寶藏 | 2024-02-11 18:52:58
  • 黑色版諾基亞N70!搭配無限流量套餐,當年是追劇神器 | 2024-02-11 18:53:00
  • 好評榜第一名的手機,驍龍8Gen3+5400mAh+100W,僅3399元起 | 2024-02-11 18:57:15
  • LG 27GS95QE遊戲顯示器上市:2K@240Hz,OLED面板,首發5999元 | 2024-02-11 18:57:22
  • 爆虧5萬當冤種 這些吃灰產品我勸你別買 | 2024-02-11 18:57:29
  • 擊敗iQOO和敗家之眼,衝上手機效能榜第一名,12GB+256GB僅3999元 | 2024-02-11 18:57:31
  • 榮耀“用力太猛”,釋出僅四個月跌至1109元,20GB+256GB+6000mAh | 2024-02-11 18:57:33
  • 75寸電視都不到 3000 元,為什麼年輕人還是不看電視? | 2024-02-11 18:57:37
  • 2024 年,旗艦手機買標準版就夠了 | 2024-02-11 19:18:29
  • iOS 18將引入全新生成式AI功能,或“今年晚些時候”釋出 | 2024-02-11 19:18:32
  • 比蘋果 Vision Pro便宜,華為正在開發一款 Vision 頭顯 | 2024-02-11 19:18:38
  • 專訪朱松純:三十功名逐一統,八萬里路懷家國 | 2024-02-11 19:18:42
  • 蘋果將推出史上最大iPad Air | 2024-02-11 19:18:46
  • 華為Mate60 RS 非凡大師:玄武鋼化崑崙玻璃可靠性的完美結合 | 2024-02-11 19:18:49
  • 華為火力全開:兩款新機將至,支援5G+麒麟晶片,蘋果害怕嗎? | 2024-02-11 19:19:33
  • 「迷走反射 . 品」凱聲 黑鈴卍 平頭耳機 | 2024-02-11 19:19:38
  • 喜馬拉雅山: 稀有金屬礦產“巨龍” | 2024-02-11 19:29:58
  • 外媒爆料:蘋果正在研發 2 款可摺疊 iPhone 手機 | 2024-02-11 19:30:08
  • 獨立顯示卡和整合顯示卡大PK:效能、價格、功耗全面對比! | 2024-02-11 19:30:14
  • vivo S系列經典設計盤點 從顏如玉到花似錦打造東方美學設計 | 2024-02-11 19:30:19
  • i7-14790F/i5-14490F效能評估:體質超凡的特供版處理器平臺 | 2024-02-11 19:36:19
  • 為何酷比魔方選擇從系統層面提升平板電腦體驗? | 2024-02-11 19:36:28
  • 航天科技集團一院將建設國家計量資料建設應用基地 | 2024-02-11 19:48:16
  • 科學家開發出具有突破性的手持式芬太尼檢測裝置 準確率達98% | 2024-02-11 19:49:42
  • 美媒:美政府砸巨資推進高階晶片研發 | 2024-02-11 19:49:44
  • 戴森吹風機終換代!全新造型 Supersonic r 釋出,減重235克 | 2024-02-11 20:27:21
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們