最近改版,容易找不到尹哥的文章,大家記得把尹哥設為星標⭐️ 哦~
前天晚上DeepSeek可謂是全球大熱,對中國來講,可能是個國運級別的科技成果。其背後的原因是什麼?且看我用幾期內容,從不同角度,尤其是結合生命演化的角度來為您做下解讀。
我們先聊聊“星際之門”,2025年1月21日,特朗普上臺以後,最大的新聞就是“星際之門”正式啟動!特朗普稱這一計劃為“歷史上最大的人工智慧基礎設施專案”,並把它比作對抗中國的“殺手鐧”。
這個號稱美國AI的曼哈頓計劃,首期投入1000億美金,將在得州阿比林建設10座資料中心,而號稱更是要在4年內投資5000億美金,在全美打造20個超算,創造10萬個就業崗位。這也確實算得史上強度最大的科技基礎設施投資,堪比曼哈頓原子彈計劃或阿波羅登月計劃。
其合作陣容也堪稱豪華,初始股權投資方包括、OpenAI、甲骨文和阿布扎比的主權基金MGX。其中,軟銀和OpenAI是這項計劃的主要合作伙伴,孫正義將擔任董事長。ARM、微軟、英偉達、甲骨文和OpenAI是主要的初始技術合作夥伴。
它的目的就是達到AGI,並劍指ASI,迎接通用人工智慧乃至超級人工智慧的到來。在這個故事裡,誰最開心呢?當然是,星際之門計劃預計購買70萬塊GPU,這一數字是由英偉達CEO黃仁勳提出的,標度率(Scaling Law)的故事可以進一步上演了。
然而就在幾天後的1月27日,DeepSeek AI智慧助手就以迅雷不及掩耳盜鈴兒響叮噹之勢,同時衝上中美iOS免費應用排行榜第一,這是中國應用首次達成這一成績。
因為DeepSeek近期釋出的正式版的DeepSeek-R1,已經在效能可以對齊OpenAI的o1版本,並同步開源模型權重。它在數學、程式碼、自然語言推理等任務上與OpenAI-o1-1217基本持平,尤其在AIME 2024(美國數學邀請賽)、MATH-500、SWE-Bench Verified(軟體開發領域測試集)三項測試集上以微弱優勢取勝。
這些測試結果一經推出,就引發了美國AI屆的地震,如果說“星際之門”是曼哈頓計劃,那麼DeepSeek-R1衝頂的這一刻,就堪稱美國AI的斯普特尼克事件,也就是早在1957年,蘇聯人領先美國成功發射的第一顆人造地球衛星——斯普特尼克1號,率先進入太空,而此舉當時深深震撼了美國。
不得不說資本市場反應神速,這不前天(1月27日)美股開盤沒多久,英偉達的股價就下跌了10%,截至收盤已經跌了近17%,市值蒸發了5000億美元。相關概念股更是跌了數萬億美金。
當然這是有若干利空的疊加,但毫無疑問DeepSeek擊中了標度率(Scaling Law)的阿格流斯之踵。啥意思呢,就是美國在此之前AI估值的邏輯是大模型效能和投入的算力正相關,
而算力和購買的GPU數量和效能正相關。
好傢伙,你現在用一個成本這麼低,還是開源的模型就在應用端實現了接近於我的效果,我的故事還怎麼講?
具體來說,其核心就在於,開源的DeepSeek,其公佈的推理成本僅為美國同行,比如OpenAI的1%-3%,這就預示著對高效能AI晶片的要求,可能遠遠小於之前的預期。
更有趣的是,當美國網際網路大廠搶購英偉達H100晶片時,DeepSeek則把自家模型移植到華為昇騰910B晶片上執行(華為的910C也在路上了)。透過“動態精度調節”技術,他們在同等任務下效能損失僅5%,但成本下降70%。現在您應該理解英偉達的崩盤了吧?
美國的一個分析師表示:“中國的DeepSeek可能代表了對美國股市最大的威脅,因為該公司似乎以極低的價格建立了一個突破性的人工智慧模型,而無需依賴最先進的晶片,這引發了對數百億美元資本支出是否有用的質疑,這些資金正被投入到這個行業中。”
正講到這,又一個新訊息來了,這大年三十凌晨,DeepSeek釋出了開源模型Janus-Pro,它不僅僅是個“讀圖”或“生圖”的模型,而是“統一模型”。什麼叫“統一模型”呢?
比如之前多模態大語言模型,我講過的GPT-4o,其只能理解影象,但不能生成影象,至少到這一刻,它還沒有開放這個功能。而這次DeepSeek的模型既可以讀圖,又可以生圖。也算是有人diss Deepseek R1沒有多模態能力的一種快速反擊。
從目前公佈的結果看,其Janus-Pro-7B在GenEval和DPG-Bench基準測試中擊敗了OpenAl的DALL-E 3和 Stable Diffusion。好傢伙,這是半夜又放核彈啊!我們期待進一步的三方評測。
無論如何,美式AI的估值玩法是做不下去了,估值高達860億美元的OpenAI也將面臨估值回撥的巨大挑戰,甚至彭博社指出:DeepSeek可能成為終結美股15年繁榮的催化劑。
我們且看後續兩國AI大勢發展。也歡迎接著看我從不同角度的下一期解讀。