ChatGPT輸慘了？智力堪比博士的草莓AI大模型強到可怕！

關注【秋葉 AI 知識星球】

回覆關鍵詞【6】

領取 50+精選 AI 神器！

作者：子珊

編輯：若凡

大家好，這裡是秋葉編輯部，我是子珊~

前段時間，人工智慧研究公司 OpenAI 繼 ChatGPT 系列智慧聊天程式後，

又釋出了兩款最近的大語言模型 o1-preview 和 o1-mini，

也就是此前備受關注的「草莓大模型」！

千呼萬喚始出來，這個被 OpenAI 造勢已久的絕密草莓終於「熟了」！

關於「草莓大模型」為什麼沒有延續 GPT 系列的命名方法，OpenAI 對此解釋說：

「對於複雜的推理任務來說，這是一個重大的進步，代表了 AI 能力的一個新的水平。

因此，我們將計數器重置為 1，並將這個模型系列命名為 OpenAI o1。」

也就是說，o 系列與 GPT 系列是並列的，

OpenAI 公司對草莓大模型的重視程度可見一斑~

和之前的 GPT 大模型相比，o1 模型的推理能力有了顯著提升，尤其是在資料分析、數學和程式設計方面。

不過，此次釋出的 o1-preview 暫時只是一個預覽版，功能還並不完善，

o1-mini 則是一個更小、更便宜的版本，能夠適用的應用場景也相對侷限。

但儘管如此，OpenAI 稱，這仍是目前為止推理能力最好的模型！

（圖源：OpenAI 官網）

根據 OpenAI 官方公佈測試的資料：

o1 在程式設計競賽題目（Codeforces）中排名達到第 89 百分位，

在美國數學奧林匹克競賽（AIME）的資格賽中，位列全美前 500 名學生之列，

並在物理、生物和化學問題的基準測試（GPQA）中，首次超過了人類博士水平的準確率！

那麼，o1 的推理能力真有官方說的那麼厲害嗎？

產品釋出後，網友們迫不及待地對它開始了「測試」~

比如，透過輸入案件的證人證詞資訊，請 o1 對兇手進行推理：

（圖源：矽星人）

這種簡單的推理題目，對 o1 來說自然不在話下，

在這次測試中，它僅用 6 秒就分析出了四位證人的證詞真假與否。

新機詞挖一此莫禾多此（真相只有一個）！

兇手就是傑克！

看來，草莓大模型在推理分析類任務的處理上的確很有實力！

但它也並非在所有方面都能碾壓其他大模型，

比如，在文字生成這類文科向的任務上，GPT-4o 仍然保持優勢。

這麼來看，GPT 更像是一個文科學霸，而o1 是位理科學霸~

但這位偏科的「理科學霸」在 9 月釋出之後，沒有如預期的那樣收穫滿堂喝彩，

而是受到了大眾犀利而謹慎的審視。

原來，為了獲得更好的推理能力， o1 採用了一種名為「思維鏈」的方案~

即把一個複雜的問題拆解為若干子問題，

在作出回答響應之前，需要先在其內部進行一番複雜分析，再尋找出最合理的解決方案。

不同於 GPT 面對資訊時的「脫口而出」，

這些多出來的環節，讓 o1 模型的響應速度比其他模型慢了許多。

而對於已經習慣了「及時響應」的大部分使用者來說，

這種突然慢下來的體驗，固然顯得不那麼友好了。

但無論如何，「草莓」所代表的是一種完全不同於 GPT 背後執行邏輯的全新正規化，

不再和傳統人工智慧一樣，僅僅追求結果的正確，

而是側重於關注 AI 推理過程中的每個具體步驟，遵循更加嚴密的邏輯和循序漸進的過程。

短短 2 年，AI 都更新迭代無數次，現如今的 AI 大模型也百花齊放，AI 技術日新月異，

在 AI 時代，作為 AI 的操控者，我們更要好好把握時機，掌握 AI 技能不僅會成為未來的趨勢，更能成為我們人生升職躍遷的敲門磚！

別再猶豫了，現在加入《秋葉 AI 設計實戰集訓營》，讓專業實戰派導師帶你早日上手 AI 設計，提升職場競爭力！

原價 99 元

今天只需 3.3 元！

✅秋葉實戰派導師教學

✅專業助教團隨時答疑

報名還送 AI 設計工具（無需下載直接用）

報名後自動彈出班主任微信

務必掃碼新增才能解鎖課程+領取福利！

點選卡片關注【秋葉 AI 知識星球】

回覆關鍵詞【6】

領取 50+精選 AI 神器！