對於AI大模型不是很瞭解,特地去看了一些專業博主的影片,瞭解了大模型的原理,有個博主科普非常容易理解,這個博主說大模型量化就是壓縮,蒸餾就是模仿,在原有基礎上透過精簡提取,讓內容更加簡單明瞭。
之前我看很多網友都在試數值的比較,剛開始的比較有的回答正確,有的錯誤,根據我們輸入的數字有關係,比如數字後面有沒有單位,或者是0,比如1.10和1.1,出來的答案就會有差異。
剛才我讓DeepSeek和豆包回答同一個問題,看他們的回答有什麼區別?
我提出了一個問題,總結2025年春晚的口碑,哪個節目被吐槽最多,總的來說還是好的,但還是有點欠缺。
先看看豆包的回答,贏的好評的是的《棟樑》,毛不易與莫文蔚的《歲月裡的花》,王菲的《世界贈予我的》,語言類節目反響平淡,小品《借傘》和《金龜婿》吐槽最多。
馬麗演沈騰的丈母孃,沈騰裝嫩演28歲的青年,還有就是沒有結尾,很多觀眾都說跳的太快了,沒看到結果,因為是被第一個節目《借傘》佔用了時間。
豆包的回答整體也還可以,豆包的回答是根據3篇文章總結。
再來看看DeepSeek的兩個回答,一個是“聯網搜尋”,這應該就是全網相關內容上搜尋經過總結的出來的答案,而且是搜尋了19個網頁,資料比較龐大,比較負責任,比豆包檢視了更多的資料。
DeepSeek第一個回答和豆包差不多,也就是這幾個問題說明。
再來看看DeepSeek的深度思考,第二遍是沒有用聯網搜尋,只是用深度思考搜尋,出來的答案就有點勉強,而且有個別地方還非常搞笑。
我之前提過的問題DeepSeek都給提出來了,之前我提出了1.15元和1.5元的數值比較,還有搜尋模型蒸餾,接著又問了關於2025年春節晚會的總結和吐槽。
使用者提出同樣的問題,因為之前的回答沒有完全滿足需求,或者是想再次確認資訊。
我提出的著三個問題都不是同樣的問題,為什麼要這樣分析我的提問?
這也說明,大模型畢竟是大模型,大模型都是根據原創文章總結後經過量化和蒸餾的結果。
還指出現在當前時間是2023年,而不是2025年,2025年的春晚尚未發生,這些資訊可能基於預測或者假設……
真的好無語,DeepSeek為什麼會有這樣的回答,這個回答是太不正確了,這是宕機了嗎?