12月6日訊息,美國時間週四,OpenAI正式推出其o1模型完整版,該模型已從預覽階段升級成為ChatGPT平臺的核心功能之一。這一模型在推理能力上實現了顯著提升,並新增了影象分析功能,為多領域應用帶來了重要突破。
新版o1模型支援使用者上傳圖片,AI會根據影象提供詳細反饋。例如,使用者隨手拍一張鳥舍照片後,AI就能夠提供完整的建造方案。此外,o1模型還能根據草圖幫助規劃資料中心,從設計初期就提供詳細指導。
目前,o1模型向ChatGPT Plus和Team的全球訂閱使用者開放,並預計下週向企業和教育使用者開放。這一升級標誌著推理模型能力的重大飛躍,包括在處理複雜任務、影象推理以及整體準確性方面的顯著進步。
與o1模型的釋出同步,OpenAI還推出了全新的高階訂閱服務——ChatGPT Pro。該服務月費200美元,專為需要研究級人工智慧工具的專業人士和組織設計。
ChatGPT Pro為使用者提供對OpenAI最先進功能的無限制訪問,包括o1推理模型的專屬版本、GPT-4o以及高階語音功能。這些增強功能旨在為使用者提供更強的計算能力和更高的精確性,滿足複雜應用場景的需求。
OpenAI聯合創始人兼執行長薩姆·奧特曼(Sam Altman)於12月5日透過YouTube直播宣佈了這一訊息。該釋出是“OpenAI的12天”(12 Days of OpenAI)系列更新的一部分,與年末和冬季假期的慶祝活動相呼應。
o1的突破進化
o1系列模型首次亮相於2024年9月,目標是憑藉其先進的推理、編碼和數學能力,解決現實世界中的複雜問題。
相比其預覽版,升級後的o1模型在響應速度上取得了顯著提升,同時將處理複雜問題時的錯誤率降低了34%。更值得關注的是,該模型新增了影象分析與解釋功能,這為其在醫療、工程等領域的廣泛應用打開了全新的大門。
早期基準測試顯示,o1模型在競爭中具備明顯優勢。例如,在國際數學奧林匹克資格考試中,o1預覽版成功解答了83%的題目,而GPT-4o的成功率僅為13%。此外,o1預覽版在嚴格的安全測試中得分高達84分,相較於前代模型的22分,取得了顯著提升。
OpenAI計劃進一步拓展o1模型的功能,包括支援網頁瀏覽、檔案上傳以及更豐富的API整合,從而提升其在視覺內容處理、函式呼叫和結構化輸出等領域的能力。這些改進使得o1模型成為STEM(科學、技術、工程、數學)領域使用者,以及其他行業從業者的得力助手。
OpenAI研究員諾姆·布朗(Noam Brown)在社交媒體上確認,o1正是此前內部代號為“草莓”(Strawberry)的模型。他幽默地指出:“o1的能力絕不僅限於計算‘草莓’這個詞中有多少個‘r’。”布朗還分享了一張截圖,顯示o1模型在經過45秒“思考”後,透過ChatGPT生成了一篇關於草莓的完整三段文章,且全篇未使用字母“e”。
高階訂閱的定價策略
ChatGPT Pro的推出標誌著OpenAI在滿足高階使用者需求方面邁出了重要一步。這一訂閱服務解鎖了高計算效能的o1版本,為使用者提供額外的計算能力,專為處理複雜查詢和最佳化解決方案設計。此外,使用者還可享受GPT-4o的先進自然語言生成能力以及高階語音互動功能。
相較於ChatGPT Plus(月費20美元)和ChatGPT Team(月費30美元),ChatGPT Pro以其專為複雜應用場景設計的頂尖效能彰顯了其高階定位。
為了推動AI在社會福祉領域的應用,OpenAI還宣佈了“ChatGPT Pro贈款計劃”。該計劃初期將向10位醫學研究人員提供資助,免費使用ChatGPT Pro工具,以支援醫學領域的研究與應用。
恰逢其時的釋出
在人工智慧行業競爭日益加劇的背景下,o1模型和ChatGPT Pro的推出成為OpenAI的重要戰略舉措。
包括阿里巴巴和DeepSeek在內的中國競爭對手,已分別釋出了Marco-o1和R1-Lite-Preview等推理模型。這些模型憑藉開源解決方案迅速搶佔市場,不僅對OpenAI的領先地位發起了挑戰,還在某些第三方基準測試中超越了o1預覽版的表現。
這一系列動態反映了市場對大型推理模型(LRM)的強勁需求。這類模型以其出色的複雜問題解決能力,正吸引越來越多的關注。
隨著OpenAI不斷最佳化其產品,o1模型和ChatGPT Pro的推出標誌著其在提供高效能且易於使用的人工智慧工具方面邁出的重要一步。然而,在這個日益擁擠且競爭激烈的市場中,OpenAI能否憑藉這些進步維持其領導地位,仍需時間來驗證。(小小)