出品 | 科技《態度》欄目
採訪|丁廣勝
作者 | 崔玉賢
這個春節,DeepSeek爆了,從朋友圈火到了大洋彼岸。
上線三天,逆襲ChatGPT,登頂美區榜首;僅20天就達到了2000萬DAU;最新資料,DeepSeek日訪問量已經超過了的 Gemini和 Character.AI。
這股“神秘的東方力量”帶給了全球不止“億點點”的震撼,甚至有人將其影響力與瓦特蒸汽機帶來的革命性影響相媲美。
那麼,DeepSeek有哪些技術特點和產業機會?網易科技《Future Talk》邀請到了兩位專家一起探討,他們是武漢大學計算機學院教授、中國人工智慧學會心智計算專委會副主任蔡恆進教授;標普雲總裁、前副總裁楊蜀。
蔡恆進教授的核心觀點為,DeepSeek是中國式創新的代表,極大推動了AGI的程序,他做出判斷,AGI將在幾個月或一年之內實現。
楊蜀認為,2025是人類比AI聰明的最後一年,AI革命的拐點已經來臨,將對整個產業和普通人造成深遠影響。
拐點還是海嘯
DeepSeek為何影響巨大
DeepSeek的火爆程度堪比春晚,蔡恆進認為DeepSeek的到來意味著AI的海嘯要來了。這一判斷基於兩點:第一,DeepSeek展示了思考過程;第二則是成本需求降低,對算力需求至少降到10倍以上。
蔡恆進認為DeepSeek有著獨特的技術路徑優勢,它可以從底層最佳化,可以繞開英偉達CUDA生態,在其他晶片,比如華為晶片上實現高效能。可以說解決了英偉達卡中國脖子的問題。
另外,非常重要的一點是DeepSeek的專家混合系統(Mixture of Experts, MoE)表面上看只是為了節省推理資源,但如果深挖的話,可以將原來完全一鍋粥的語料與專家的內容分開了,蔡恆進認為,這點很重要,可以說是分而治之。
DeepSeek開啟了深入探索的這條路,完全逆轉了ChatGPT的那條路,造成了顛覆性的影響。
與此同時,楊蜀認為AI拐點已經到來了,首先是質量的提升,因為質量不好再便宜也沒人會用。DeepSeek回答問題的時候,會對需求做一個思維的展示,這就是技術的很大的進步。
楊蜀針對拐點將至解釋說,技術在發展過程中,它到了一個階段,開始加速發展,這是對拐點的定義。之所以認為拐點到了,首先是質量,然後是效率,再然後是成本。如果質量不好,再便宜大家也不會用,現在到了一個很好的階段,因為它超出了預期。
楊蜀還提到,拐點也有很多解釋,比如它是AI行業的拐點,中美人工智慧競爭的拐點。
機會還是挑戰
DeepSeek產業變革勢不可擋
DeepSeek的橫衝出世和爆火,讓他的朋友圈不斷擴大。國內幾大主流雲平臺、國產GPU晶片廠商、AI基礎設施廠商、應用端企業紛紛接入。國內多家GPU企業宣佈支援DeepSeek,正加速完成國產GPU與DeepSeek的適配,比如華為雲、騰訊雲、阿里雲、百度智慧雲等等。
蔡恆進認為DeepSeek的火爆對晶片公司是非常大的利好。他反覆提到的“海嘯”這個詞是指推平了很多東西,原來那些小的細節根本不重要了,只有這一件事才最重要,大家都要回到主流上來。
“看到新聞上說在兩個月內,DeepSeek的Star量(星標)已經超過了OpenAI。這非常不容易,才幾個星期就已經超過了搞了兩年的OpenAI,可以說是勢不可擋,就如海嘯一般。”蔡恆進表示。
楊蜀談到,毫無疑問,英偉達受到了很大的挑戰。他認為大廠會重新考慮對訓練卡的預算。楊蜀是看好推理卡的,因為大家都知道訓練是研發,推理是生產,楊蜀則更傾向於推理的需求會增大,這也是大家講的普惠AI的過程。楊蜀認為對國產廠商來說比如華為肯定是個利好。
AGI即將到來?
2025年是人類比AI聰明的最後一年
DeepSeek讓蔡恆進看到,AI for Science和Science for AI都有機會了。
“我認為AGI一年之內就能到來,我說的到來不是討論它真的到來還是假的到來,而是說大家對AGI基本上形成了共識。”蔡恆進表示,“國外都在談奇點,我認為奇點就是阿爾法狗問世的時候,之後就再也找不到標誌性事件了,我們說棋如人生,人生如棋,它是足夠複雜的,機器已經掌握這個了,這是絕對標誌性的。之後發生的事情,更多是一項一項的突破而已。”
楊蜀認為,DeepSeek帶來的拐點是有意義的。AI提供的是一種智力,一種疊加式的創新,所以在生產力上一定會更進一步。企業可以基於此開發出很多應用場景來做智慧體,相當於是提供智慧生產力或者數字員工,一旦到了這個拐點,能力才會真正用起來。“他已經不是實驗室的東西了。”
“我認為2025年是人類比AI聰明的最後一年。這不是危言聳聽。”楊蜀提到。
楊蜀認為,有了DeepSeek的能力加持,智慧體爆發會加速。
蔡恆進也持類似看法,他表示,之前對智慧體比較懷疑。但是GPT出來之後,他的想法實際上有了改變。當DeepSeek出來之後,可能會將智慧體引導到一個更專業的水平上。
開源還是閉源?
開源DeepSeek倒逼閉源
DeepSeek選擇開源,而OpenAI堅持閉源。開源是否真能推動技術民主化,還是可能加劇安全風險?開源這麼強,以後做閉源模型是不是還有意義?
楊蜀認為開源和閉源是個永恆話題,但它有一個關鍵點,就是誰的質量更好,如果閉源的質量是更好的,那麼開源就會一直追趕;如果開源的質量變好了,它就可能倒逼閉源的開源,就是這個邏輯。
開源和閉源它就是一個事情的兩面,什麼時候才能促進另外一面的發展?是因為這一面質量更好,成本更低,那一面就會發生變化。當然,對我們來說是非常樂見開源的,特別是高水平的開源,可以帶來真正的智慧普惠,AI的民主化,科技平權。
開源之後,以後再有比DeepSeek更厲害的大模型出來,這就是開源的意義。就是讓大家有機會站在巨人的肩膀上,得以你追我趕。
蔡恆進認為,開源還有另外一個爭論就是大家都覺得對人類有風險,有的人支援閉源,因為覺得開源的話,相當於把核彈的技術可能交給那些壞人手裡去了。“但在我看來,DeepSeek開源之後就已經回不了頭了。”
偏執狂才能改變世界?
為什麼不是大廠和六小虎
國內有很多大模型創業公司,有俗稱的大模型六小虎,比如Kimi、智譜等等,為什麼不是他們做出來?
蔡恆進認為,中美之間最大的差距在哪?不是算力不夠,也不是資料不夠好,而是真的相信能把AGI做出來,這是最大的差別。梁文峰很獨特。他本身自己有錢,透過量化賺到了錢,可以放手來做;另外,他有技術上的判斷力,兩者兼有。但其他團隊可能就沒有這個獨特性。
楊蜀表示,為什麼不是大廠呢?其實人才都是那些人才(大廠的優秀人才更多)、課題也都是那些課題,為什麼是一個小的創業公司先做出來呢?這確實是一個值得深思的問題。
“你看梁文峰的訪談,他提到了信心,他說中國的大廠並不缺錢,那麼做AGI缺的是信心。要做技術創新,因為他覺得技術創新比應用創新更重要。他相信AGI的發生,還有一點,他組織了高密度人才,組織了一幫有著同樣信念的高密度人才來完成這樣的任務。”
喬布斯有一句話,只有那些瘋狂到相信能夠改變世界的人才能真正的改變世界。我把這句話變一下,就是隻有那些真正相信AGI能實現的人,才可能實現AGI。
技術路線之爭
實現AGI走哪條路?
DeepSeek為什麼能讓OpenAI這麼緊張?蔡恆進認為,最重要的是DeepSeeek讓OpenAI原來的願景規劃失效。關於蒸餾的探討,他認為指控抄襲或者說完全是蒸餾出來的是不對的,DeepSeek技術上是有創新的,即使有蒸餾可能也是很小的一部分。
楊蜀表示,關於蒸餾的問題,有個網友說的挺有意思,蒸餾不就是把50度的二鍋頭蒸餾出70度的酒精,從低濃度提純到高濃度。Deepseek創新在於它蒸餾出了更低算力高智慧的模型,用強化學習替代了RLHF人類反饋強化學習。提升了質量,產生了更高的智慧,這確實是重要且關鍵的創新,哪怕是在原有的科技樹上。
(所謂蒸餾,是讓一個龐大且複雜的預訓練AI模型充當“教師”,來訓練一個較小的“學生模型”,後者從“教師模型”學習知識,以獲得類似效能,但計算成本更低。)
還有人問,現在這條技術路線 LLM+RL(大型語言模型與強化學習)能走到AGI麼?
楊蜀認為目前來看, LLM+RL肯定是相當不錯的,但接下來GPT5路線因為Scaling Law還能加到多少,大家還有很大疑問。“我對AGI是非常有信心的,因為強化學習已經加速了向AGI奔跑。”
蔡恆進認為,很有可能因為DeepSeek促使OpenAI儘快放出GPT5,但是GPT5會不會讓大家失望,就不好說了。