關注【秋葉 AI 知識星球】
回覆關鍵詞【6】
領取 50+精選 AI 神器!
作者:子珊
編輯:若凡
大家好,這裡是秋葉編輯部,我是子珊~
前段時間,人工智慧研究公司 OpenAI 繼 ChatGPT 系列智慧聊天程式後,
又釋出了兩款最近的大語言模型 o1-preview 和 o1-mini,
也就是此前備受關注的「草莓大模型」!
千呼萬喚始出來,這個被 OpenAI 造勢已久的絕密草莓終於「熟了」!
關於「草莓大模型」為什麼沒有延續 GPT 系列的命名方法,OpenAI 對此解釋說:
「對於複雜的推理任務來說,這是一個重大的進步,代表了 AI 能力的一個新的水平。
因此,我們將計數器重置為 1,並將這個模型系列命名為 OpenAI o1。」
也就是說,o 系列與 GPT 系列是並列的,
OpenAI 公司對草莓大模型的重視程度可見一斑~
和之前的 GPT 大模型相比,o1 模型的推理能力有了顯著提升,尤其是在資料分析、數學和程式設計方面。
不過,此次釋出的 o1-preview 暫時只是一個預覽版,功能還並不完善,
o1-mini 則是一個更小、更便宜的版本,能夠適用的應用場景也相對侷限。
但儘管如此,OpenAI 稱,這仍是目前為止推理能力最好的模型!
(圖源:OpenAI 官網)
根據 OpenAI 官方公佈測試的資料:
o1 在程式設計競賽題目 (Codeforces) 中排名達到第 89 百分位,
在美國數學奧林匹克競賽 (AIME) 的資格賽中,位列全美前 500 名學生之列,
並在物理、生物和化學問題的基準測試 (GPQA) 中,首次超過了人類博士水平的準確率!
那麼,o1 的推理能力真有官方說的那麼厲害嗎?
產品釋出後,網友們迫不及待地對它開始了「測試」~
比如,透過輸入案件的證人證詞資訊,請 o1 對兇手進行推理:
(圖源:矽星人)
這種簡單的推理題目,對 o1 來說自然不在話下,
在這次測試中,它僅用 6 秒就分析出了四位證人的證詞真假與否。
新機詞挖一此莫禾多此(真相只有一個)!
兇手就是傑克!
看來,草莓大模型在推理分析類任務的處理上的確很有實力!
但它也並非在所有方面都能碾壓其他大模型,
比如,在文字生成這類文科向的任務上,GPT-4o 仍然保持優勢。
這麼來看,GPT 更像是一個文科學霸,而o1 是位理科學霸~
但這位偏科的「理科學霸」在 9 月釋出之後,沒有如預期的那樣收穫滿堂喝彩,
而是受到了大眾犀利而謹慎的審視。
原來,為了獲得更好的推理能力, o1 採用了一種名為「思維鏈」的方案~
即把一個複雜的問題拆解為若干子問題,
在作出回答響應之前,需要先在其內部進行一番複雜分析,再尋找出最合理的解決方案。
不同於 GPT 面對資訊時的「脫口而出」,
這些多出來的環節,讓 o1 模型的響應速度比其他模型慢了許多。
而對於已經習慣了「及時響應」的大部分使用者來說,
這種突然慢下來的體驗,固然顯得不那麼友好了。
但無論如何,「草莓」所代表的是一種完全不同於 GPT 背後執行邏輯的全新正規化,
不再和傳統人工智慧一樣,僅僅追求結果的正確,
而是側重於關注 AI 推理過程中的每個具體步驟,遵循更加嚴密的邏輯和循序漸進的過程。
短短 2 年,AI 都更新迭代無數次 ,現如今的 AI 大模型也百花齊放,AI 技術日新月異,
在 AI 時代,作為 AI 的操控者,我們更要好好把握時機,掌握 AI 技能不僅會成為未來的趨勢,更能成為我們人生升職躍遷的敲門磚!
別再猶豫了,現在加入《秋葉 AI 設計實戰集訓營》,讓專業實戰派導師帶你早日上手 AI 設計,提升職場競爭力!
原價 99 元
今天只需 3.3 元!
✅秋葉實戰派導師教學
✅專業助教團隨時答疑
報名還送 AI 設計工具(無需下載直接用)
報名後自動彈出班主任微信
務必掃碼新增才能解鎖課程+領取福利!
點選卡片關注【秋葉 AI 知識星球】
回覆關鍵詞【6】
領取 50+精選 AI 神器!