最近改版,容易找不到尹哥的文章,大家記得把尹哥設為星標⭐️ 哦~
DeepSeek最近全球大熱,一夜之間讓市值跌了近17%,創造了歷史上科技股單日的最大跌幅。川普更是連夜表態,DeepSeek的出現“給美國相關產業敲響了警鐘”。也有朋友留言,說話不要說太早,昨晚又漲回來近9%。這麼講也沒錯,但對美國AI資本市場當下故事的多空分歧已經形成。而對中國來講,這可能是個國運級別的科技成果,讓我們看到了即使在如此嚴密的封鎖下,依然還有各個維度的突破空間,這個像極了生命演化,所謂“生命總會找到出口”,當然也無需藉此將它推上神壇。
其實把DeepSeek推上風口浪尖的,還不是他們自己,而是Meta,也就是之前的Facebook。
幾天前,在美國匿名職場社群teamblind上,有Meta員工直言:DeepSeek最近的一系列動作讓Meta的生成式AI團隊陷入了恐慌,前者低成本的訓練工作,讓後者難以解釋自己超高預算的合理性。“工程師們正在瘋狂地分析DeepSeek,試圖從中複製任何可能的東西。”
Meta使用了高算力H100 GPU的Meta Llama 3系列模型,其計算量足可訓練DeepSeek V3至少15次,但是最終表現卻不及DeepSeek。因而,無怪乎Meta科學家田淵棟驚歎DeepSeek V3的訓練看上去是黑科技,“這是非常偉大的工作。”
Meta創始人兼CEO扎克伯格表示,DeepSeek非常先進,並認為中美之間的AI差距非常小。扎克伯格還表示:中國正在全力衝刺,如果將來有一個開源模型能被全世界廣泛使用,我們希望它是一個美國模型。這話講得夠酸的了。
同樣的,圖靈獎得主,Meta AI首席科學家楊立昆(Yann LeCun)在社交媒體上表示:“當人們看到 DeepSeek的表現,驚呼中國AI正在趕超美國,但這種解讀有誤。更準確的結論是,開源模型正在超越閉源系統。”
到這一刻,我們或許可以總結一下,DeepSeek贏在了哪裡?那就是接地氣!開源以及超高的價效比。
我們知道人工智慧三支柱,演算法、算力、資料。算力的背後是GPU,目前最強最多的都在美國,但DeepSeek透過模型蒸餾和開源策略,用演算法槓桿對抗了算力依賴,以超高價效比優勢倒逼技術開源平民化。
至少在這一刻,對於資本市場,是一次估值的重大重構,即把價值中心從硬體層轉向演算法和應用層。
這種四兩撥千斤的方式,像極了抗美援朝志願軍所打出的若干經典戰役,比如長津湖、上甘嶺、鐵原阻擊戰等。既然我暫時無法在先進裝備上贏了你,我就把輕步兵的優勢發揮到極致,以時間換空間或者以空間換時間,直到我具備戰略反攻能力。
所謂蒸餾法,可以理解為是一種討巧的知識遷移技術,簡單理解就是將一個複雜的大模型(教師模型)的知識傳遞給一個較小的模型(學生模型),從而減少模型的複雜性並降低計算資源的需求,同時保持較高的預測效能。
所以此刻,DeepSeek的成功,能夠說明標度率沒有意義,甚至破產麼?很遺憾,並不能。
歷史學就是未來學,我們看看汽車,比如當年的福特T型車,透過流水線和質量體系的應用,使得汽車從奢侈品變成了家用品,從而極大地提升了汽車的普及率,但僅追求極致的價效比並不能催生智慧汽車的誕生。
從我熟悉的生命演化來看,比如昆蟲已經算是無脊椎動物之王了,它們幾乎佔據了地球的所有角落,高等動物、包括人類根本無法將其消滅,想想蟑螂或者蝗蟲可能就明白了。
但這樣下去,生命就能一直延續嗎?因為地球終將被太陽吞沒,要解決這個問題就要星際移民,那麼就必須誕生智慧、誕生科學,所以物種勢必需要向上演化,尤其是中樞神經系統的演化。
所以,脊椎動物出現了,而受到脊索、脊椎保護,中樞神經系統也經過長達6億年的演化,終於膨大成智慧腦,成就了今日智人之地位,比如正在打字的我和正在看這篇文章的您,以及發明了AI和DeepSeek的團隊。
所以,人類依然還需要向上捅破天。其實0-1是最難的,在追求AGI乃至ASI的路上,我相信大模型定律依然有效,辛頓有一句話我非常贊同:人腦只是特別複雜,但並不特殊。
正如小鼠腦只有7000萬個神經元,猴腦則有60億個神經元,而人腦是860億個神經元。
如果神經元的疊加可以誕生高階智慧,那麼GPU的並聯也應異曲同工。
所以被譽為美國AI曼哈頓計劃的“星際之門”的本質,構建七十萬張乃至百萬張GPU卡超級AI計算中心的雄偉計劃,也是軟銀和OpenAI在全力下注通用人工智慧到超級人工智慧,他們希望藉此可以牢牢卡住生態位,從而形成飛輪效應的正反饋。
我們必須看到,在大語言模型(LLM)之後,目前在多模態、思維鏈、空間感知、物理孿生、科學推演等算力都呈現出幾何級數的增長。
而DeepSeek爆火之後的一度宕機,除去了駭客攻擊要素,也證明了大算力依然是AI普及、技術平等不可或缺的基礎設施要素。當然,高能耗的GPU是不是增加算力的最佳乃至唯一選擇,我會在另外一期節目中用生命現象的經濟性來解讀。
說回來,與其說DeepSeek是中美競爭的產物,倒不如說是中美合作的典範,DeepSeek開始的GPU用的是英偉達的,當然目前已經開始試用華為的產品;DeepSeek的核心架構是Transformer,這是八位谷歌員工發明的;DeepSeek的核心演算法是AI蒸餾法(Model Distillation),也是由辛頓等人在2015年發明的。
但DeepSeek的執行團隊是中國的年輕一代,甚至沒有海外背景。所以,借用韓愈師說中的一句,“是故弟子不必不如師,師不必賢於弟子,聞道有先後,術業有專攻。”教學相長,豈不美哉?
這再一次證明了,中美合作就是人類最大的成功保障。DeepSeek此刻還談不上顛覆,在預算有限的前提下,他們擺脫了算力依賴,在演算法層面給全世界提供了一種更聰明的思考方式,這會大大加快全球AI演進的程序。也讓中美之間的AI競爭態勢有了全新的格局,且一定會加速兩國間互相學習、交融和促進,更是給全球原來沒有機會發展AI的國家提供了切實可行的新選擇。
我們一起點贊這群了不起的中國年輕人!