雷遞網 樂天 2月1日
AI企業OpenAI今日宣佈將釋出OpenAI o3-mini,稱這是OpenAI推理系列中最新、最具成本效益的模型,目前可在ChatGPT和API中使用。
OpenAI o3-mini模型於2024年12月進行預覽,其提供STEM功能(尤其擅長科學、數學和編碼),同時保持OpenAI o1-mini的低成本和低延遲。
CEO承認DeepSeek削弱其地位
為了結束一天的產品釋出,OpenAI 的研究人員、工程師和高管,包括OpenAI執行長Sam Altman進行了一些交流。
OpenAI發現自己處境有點危險。它正在與這樣一種看法作鬥爭:它在人工智慧競賽中向DeepSeek等中國公司讓出了地盤,OpenAI聲稱這些公司可能竊取了它的智慧財產權。
Altman(奧特曼)承認DeepSeek削弱了OpenAI在人工智慧領域的領先地位,他認為OpenAI在開源技術方面“站在了歷史的錯誤一邊”。雖然OpenAI過去曾開源過模型,但該公司通常傾向於專有的閉源開發方法。
“[我個人認為我們需要] 找出一種不同的開源策略,”Altman說, “OpenAI並非所有人都認同這一觀點,這也不是我們目前的最高優先事項……我們將在未來生產出更好的模型,但領先優勢將比前幾年有所減弱。”
(i personally think we have been on the wrong side of history here and need to figure out a different open source strategy; not everyone at openai shares this view, and its also not our current highest priority.)
OpenAI首席產品官Kevin Weil說,OpenAI正在考慮開源不再是最先進的舊模型。“我們肯定會考慮做更多這樣的事情。”
除了促使 OpenAI 重新考慮其釋出理念外,Altman 還表示,DeepSeek 已推動該公司更多地披露其所謂的推理模型(如今天釋出的 o3-mini 模型)如何展示其“思維過程”。目前,OpenAI的模型隱藏了它們的推理,這一策略旨在防止競爭對手為自己的模型抓取訓練資料。相比之下,DeepSeek的推理模型R1展示了其完整的思路。
Altman和Weil試圖消除 ChatGPT(OpenAI 透過其推出許多模型的聊天機器人平臺)未來價格會上漲的謠言。Altman說,如果可行的話,他希望隨著時間的推移讓ChatGPT“更便宜”。
當被問及這些強大的模型可能實現的遞迴自我改進時,Altman 表示,他認為“快速起飛”比他曾經認為的更合理。遞迴自我改進是一個過程,其中人工智慧系統可以在沒有人類輸入的情況下提高自身的智慧和能力。
當然,Altman因過度承諾而臭名昭著。
在趕走了OpenAI首席科學家、CTO等核心高管後,Altman的聲譽受到很大影響,尤其將OpenAI變成商業公司的舉動,更是讓其大失人心。不久前,他還降低了OpenAI對AGI的標準。
與o1在數學、編碼和科學方面的表現相當
OpenAI稱,OpenAI o3-mini是其的第一個小型推理模型,它支援開發人員高度要求的功能,包括函式呼叫(在新視窗中開啟)、結構化輸出(在新視窗中開啟)和開發人員訊息(在新視窗中開啟),使其可以立即投入生產。與OpenAI o1-mini和OpenAI o1-preview一樣,o3-mini 將支援流媒體(在新視窗中開啟)。
此外,開發人員可以在三種推理工作量(在新視窗中開啟) 選項(低、中、高)之間進行選擇,以針對其特定用例進行最佳化。
這種靈活性使o3-mini在應對複雜挑戰時能夠“更加認真地思考”,或者在延遲成為問題時優先考慮速度。o3-mini不支援視覺功能,因此開發人員應繼續使用OpenAI o1進行視覺推理任務。
o3-mini從今天開始在 Chat Completions API、Assistant API 和 Batch API 中推出,以選擇 API 使用層 3-5(在新視窗中開啟) 中的開發人員。
ChatGPT Plus、Team 和Pro使用者可以從今天開始訪問 OpenAI o3-mini,企業訪問許可權將於2月推出。
o3-mini 將在模型選擇器中取代 OpenAI o1-mini,提供更高的速率限制和更低的延遲,使其成為編碼、STEM 和邏輯問題解決任務的有力選擇。作為此次升級的一部分,OpenAI將 Plus 和 Team 使用者的傳送頻率限制從 o1-mini 的每天 50 條訊息增加到 o3-mini 的每天150條訊息。
此外,o3-mini 現在可與搜尋配合使用,以查詢帶有相關網路資源連結的最新答案。
這是一個早期原型,OpenAI稱,正在努力將搜尋整合到其推理模型中。從今天開始,免費計劃使用者還可以透過在訊息編輯器中選擇“原因”或重新生成響應來嘗試OpenAI o3-mini。這標誌著ChatGPT中首次向免費使用者提供推理模型。
“雖然OpenAI o1 仍然是我們更廣泛的常識推理模型,但OpenAI o3-mini為需要精度和速度的技術領域提供了一種專門的替代方案。
在ChatGPT 中,o3-mini 使用中等推理工作來提供速度和準確性之間的平衡。所有付費使用者還可以選擇模型選擇器中的 o3-mini-high,以獲得更高智慧的版本,該版本需要更長的時間來生成響應。專業使用者可以無限制地訪問o3-mini 和 o3-mini-high。”
與其前身OpenAI o1類似,OpenAI o3-mini已針對 STEM 推理進行了最佳化。中等推理努力的o3-mini 與o1在數學、編碼和科學方面的表現相當,同時提供更快的響應。
專家測試人員的評估表明,與OpenAI o1-mini 相比,o3-mini 提供的答案更準確、更清晰,推理能力更強。測試人員在56%的時間裡更喜歡 o3-mini 的響應,並且觀察到在困難的現實問題上重大錯誤減少了 39%。在中等推理努力下,o3-mini 在包括 AIME 和 GPQA 在內的一些最具挑戰性的推理和智慧評估中的表現與o1相當。
雷遞由媒體人雷建平創辦,若轉載請寫明來源。