“我從來沒有這麼興奮過!”
最近發生了一件事,國內討論很少,但是國產大模型的魅力讓海外開發者紛紛直呼“真香”!
前段時間,Qwen2.532B釋出並開源的訊息在海外傳開,youtube博主ColeMedin連夜爬起來啟動電腦,下載模型,馬上測試。
測試完之後,這位海外開發者興奮得語無倫次,大喊“懷疑自己在做夢,不得不扇自己一巴掌以確保自己是清醒的,因為結果太瘋狂了!”
ColeMedin收到訊息,覺都不睡了,馬上下載了Qwen2.532B,用AutoDev(開源AI程式設計助手)、ArborlandNewfork(終極自動化程式設計工具)以及自己的一些AI代理進行測試,結果太好了!好到ColeMedin都覺得粉絲們可能會認為他誇大其詞、不可能是真的,但看過他的演示之後,海外的開發者們不得不服!
ColeMedin用Qwen2.5 32B測試的第一個東西就是AutoDev,它是目前最好的開源AI程式設計助手之一。為了展示和考驗Qwen2.5 32B的能力,ColeMedin決定先從一個非常簡單的提示開始,然後逐漸增加難度。
首先,ColeMedin建立了一個使用Tailwind的React聊天介面,可以傳送訊息並收到回覆樣本。
接下來,ColeMedin開始新增更多的要求,包括UI要求、一些使用者體驗、一些功能性的需求。當迭代完成之後,更新後的聊天介面看起來好多了,可能有一些細節可以繼續調整,但總體來說,ColeMedin得到了一個不錯的載入指示器,收到了樣本訊息,一切看起來都非常棒。
ColeMedin激動地表示,可以繼續改進樣式,甚至可以真正連線一個API,將這個應用擴充套件得很遠!
別看這樣的功能相對還比較簡單,Qwen2.5 32B在執行上表現得如此出色是非常難得的。ColeMedin甚至用了美國Meta的大語言模型Llama 34B來做對比,結果翻車得厲害!面對簡單的指令,Llama 34B可以像Qwen2.5 32B一樣完成,但當指令變得更加複雜時,Llama 34B就開始出錯了。
海外開發者們不得不承認一個技術事實:本地大語言模型在能力上確實不如像大型雲模型強大。很多時候,使用這些大型雲模型確實很有幫助。
ColeMedin興奮地感嘆:有了Qwen2.532B,實際上可以用它構建幾乎所有東西!
隨後,ColeMedin展示了自己用Lane Chaining和Lang Graph構建的一個代理。他使用不同的工具來與Asana進行任務管理和Google Drive進行檔案的上傳、下載及搜尋。而對於檢索,ColeMedin集成了Chroma作為本地的向量資料庫,這樣基本上可以把來自Google Drive的資訊新增到知識庫中,供LLM回答問題。
ColeMedin選擇了用這個代理來測試Qwen2.5 32B。根據使用者的問題,大語言模型可以從很多不同的工具中選擇。而海外的大語言模型經常出錯。
Qwen2.5 32B的表現如何呢?
ColeMedin開啟Asana,可以看到建立任務等操作。他展示了一個前端介面,支援流式輸出,同時也打開了終端。粉絲們可以看到AI代理決定呼叫哪些工具。
ColeMedin輸入了第一個問題:“我有哪些專案?”
開啟終端,可以看到它呼叫了getAsanaProjects工具,從Asana API獲取JSON結果。然後給出回答,專案包括YouTube、健身業務、個人和程式設計。這與左側列表中的專案完全一致。
讓人更加驚訝的是,ColeMedin的程式設計專案中的任務列表是空的。ColeMedin給了第二個指令:“在程式設計專案中建立一個截止日期為18號的任務。”
它需要考慮幾個不同的因素,比如程式設計專案的ID、截止日期、任務名稱等,然後用這些引數呼叫createAsanaTask。看起來不錯,最終,它確定了截止日期和任務名稱。
完成後,它告訴ColeMedin,已經在程式設計專案中建立了任務。再看ColeMedin的程式設計專案,果然,有一個截止日期為18號的任務,看起來非常棒。
最後,ColeMedin測試了一些與知識庫相關的事情,比如從Google Drive下載會議記錄並新增到知識庫中。
要做到這一點,它需要先從Google Drive搜尋並下載檔案。看起來它最初沒有找到檔案,因為ColeMedin給的指令非常具體。所以它說沒有找到檔案,但ColeMedin讓它搜尋會議記錄,給它一個更通用的指令。終於,它找到了823的會議記錄,成功下載並新增到知識庫中。
ColeMedin甚至可以回到資料資料夾,看到這個從Google Drive下載的文件檔案。這些都讓ColeMedin感到不可思議,而如果換了Meta的Llama 3 170B,可能早就失敗了。
ColeMedin認為,現在本地和開源AI的世界非常令人興奮,而Qwen2.5 32B就是最大的原因!
Qwen系列模型自開源後,下載量已經突破4000萬。Qwen的衍生模型數量超7.8萬個,已超越Llama成為全球最大的開源生成式模型群。
眾多海外開發者親手測試之後,感覺如在夢中!中國AI大模型的實力實在是太驚人了,海外開發者們懷著複雜的心情,感嘆“這簡直令人難以置信”!相信隨著國產大模型的不斷崛起,老外對國產大模型強大實力的“難以置信”會逐漸變成“習以為常”!