時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

劉潤:DeepSeek這把火,為何燒疼了矽谷?

2025-01-30 22:01:37

很多人在後臺給我留言,要我講講DeepSeek。 這大過年的。 本來想睡個懶覺。 然後看個電影。 然後再睡個懶覺。 然後再看個電影。 什麼也不想寫。 但是但是但是,DeepSeek實在是太火了。

火到什麼程度呢?

美國的一把山林大火,幾個星期燒掉了加州2500億美元。而DeepSeek橫空出世,納斯達克大跌3%,瞬間燒掉了5000多億。什麼概念?如果把這5000多億換成百元美刀,用飛機來運到焚燒廠去燒,需要87架滿載的空客380。

美國人嚇壞了。

可是,DeepSeek這把火,為何燒疼了矽谷?DeepSeek,到底厲害在什麼地方?他被高估了嗎?有人指責DeepSeek“偷竊”,是真的嗎?

今天。我們就來聊聊這件事。從哪裡開始呢?就從美國人為什麼這麼怕開始。這種怕,源於心中的一根刺。一根針不能碰,一碰就疼的針。

這根刺的名字叫:斯普特尼克時刻。

1957年10月的一天,很多美國人走出家門,驚恐地望向天空。他們聽說,(前)蘇聯人發了一顆“籃球”上天,繞著地球飛行。時速29000公里。他們試著用肉眼,尋找這顆不斷在他們頭頂上繞圈的“籃球”。

這顆“籃球”的名字,就叫斯普特尼克(sputnik)。它當然不是籃球。它是一顆人造衛星。

人類歷史上第一顆人造衛星。

人類歷史上第一顆人造衛星,“居然”不是自己發射的。美國人很難接受。你能想象嗎?這就像連續三年的全年級第一,突然發現清華唯一提前錄取的,不是自己。

斯普特尼克號衛星,就像一根刺一樣,扎痛了那一代美國人。

然後,美國正式成立了NASA(美國航天局),並舉國之力完成了登月。這才拔掉了心頭那根叫“斯普特尼克”的刺。

68年後的今天,DeepSeek讓美國人看到了另一個“斯普特尼克”時刻。

大模型屆的拼多多

你試過DeepSeek了嗎?

趕快去試試。真不錯。推理能力,直逼OpenAI的ChatGPT o1。而且,不用翻牆。不用美國信用卡。也不用擔心,因為不慎被發現是中國使用者,而被系統“歧視性”封號。太揚眉吐氣了。

但這都不是最重要的。最重要的是:DeepSeek實在是太太太便宜了。

ChatGPT o1完成一次訓練的成本,據說要上億美金。而DeepSeek,只需要不到600萬美金。

1/20。便宜到不敢相信。

這就像有人指著一臺20萬的新能源車,說1萬賣給你。便宜到難以置信。你忍不住問,這臺是不是隻會唱:爸爸的爸爸是爺爺?

美國科技界迅速對DeepSeek做了各種評測。然後,震驚了。這個“大模型屆的拼多多”,推理能力真和ChatGPT o1非常接近。

隨即,英偉達股票大跌17%。原來,訓練一個模型,並不需要像你們說的那麼多GPU啊。DeepSeek,居然做到了所有矽谷科技巨頭都沒做到的事。

那麼,DeepSeek,到底是怎麼做到的呢?

被“逼”的。被“年級第一”的“小院高牆”策略逼的。

小院高牆

2018年,美國首次提出對華科技防禦策略:小院高牆。關係到美國國家安全的“小院”(半導體和微電子,量子資訊科技,和人工智慧等等),對中國建設“高牆”(出口管制,限制簽證,和審查投資等等)。

隨後,2022年,美國開始禁止英偉達對中國出口高階GPU。這些GPU,對訓練AI大模型至關重要。

為什麼啊?好好做朋友不行嗎?不做朋友,做生意也行啊。公平競爭,共謀發展。有必要這麼藏著掖著防著嗎?

哎。你不理解“年級第一”的心態。

在一個班裡,倒數第一和倒數第二,一般都是鐵哥們。但是正數第一和正數第二,基本都是死對頭。

以前我幫你輔導作業,是因為你是後進。你進步我很高興。可是萬萬沒想到,你居然不識好歹,才幫了幾天你就想取代我的“年級第一”了。這怎麼行。橡皮是我的。GPU也是我的。以後再也不借給你了。

這就是“年級第一”的心態。

那怎麼辦呢?就這麼認輸嗎?沒有GPU,怎麼訓練AI模型呢?

創新。

資源無限的時候,不需要創新。真正的創新,都發生在匱乏的時候。

比如:混合專家系統。

混合專家系統

混合專家系統,也就是Mixure of Experts。簡稱MoE。

我們去醫院看病。醫院的50個醫生,每個都是最好的全科醫生。內科、外科、兒科、心血管科、腦科、甚至婦科。什麼都懂,什麼都能治。這當然最好。但這樣的成本實在是太高了。因為每個醫生可能都要30年才能畢業。

這就像大模型。一個模型,有50個博士學位,能回答所有問題。這當然好。但是實在是太燒GPU了。

可是,GPU都在美國的小院裡。我沒有。怎麼辦呢?

也許你可以試試,把醫院分成不同的科室。內科的只管內科,外科的只管外科。這樣,“訓練”醫生難度不就降低了嗎?

用50個便宜的專科醫生,取代一個昂貴的全科醫生。然後,再設一個導診臺,根據病情,把患者分配給不同的醫生,問題不就解決了嗎?

這就是混合專家系統。

混合專家系統,大大降低了AI的訓練成本。

強化學習

訓練大模型還有一項重要的成本,是人工打標籤。

這張照片,是隻小狗。那張照片,是隻小貓。清楚標記出來,人工智慧才不會學錯。用人工標籤,監督AI的學習過程。這就是“監督學習”(Surpervised Learning)。

“監督學習”,給很多第三世界國家,創造了大量工作崗位。所以有句開玩笑的話:

有多少“人工”,就有多少“智慧”。

那這個成本,能不能也省了呢?

孩子學習走路的時候,可沒有用什麼打標籤的照片吧。這個姿勢是正確的,那個姿勢是錯誤的。孩子,請按照片上的姿勢走。從來沒有吧。

那孩子是怎麼走路的?就是隻管走就好了。摔倒了屁股會疼。走好了媽媽會抱。孩子會根據這種懲罰和獎勵的反饋,不斷自動調整姿勢,直到終於在一個瞬間,就突然會走路了。

這就是:強化學習。Reinforcement Learning。簡稱RL。用激勵函式,而不是打標籤的資料,來學習。從而大大降低訓練成本。

MoE+RL。

真不容易。為什麼美國人沒有先做出來?

因為他們不缺GPU啊。很多創新,都是被“逼”出來的。

DeepSeek還有一個獨特之處,那就是:開源。

開源

有一個挺諷刺的事。你已經知道了吧。OpenAI,其實並不Open。

什麼,你還不知道?那聽我和你好好說說。

ChatGPT 2.0之前,OpenAI是開源的。模型的程式碼和權重,是對所有人公開的。但自從ChatGPT 3.0開始,OpenAI選擇了閉源。“OpenAI”變為了“CloseAI”。

其實,這也可以理解。訓練大模型實在是太燒錢了。逐漸大家也開始接受了:想要高質量的模型,就要選擇閉源。

直到,DeepSeek R1出現。並且開源。

可是,就算你的成本很低,只有OpenAI的1/20,也沒必要開源吧?畢竟你也要活下啊?你開源,圖什麼啊?

圖:生態。

我只有200個工程師。就算他們全是北大、清華畢業,也只有200個人。這點人手,根本無法和微軟、谷歌、OpenAI比。

那怎麼辦?團結整個開發者生態。

我把所有的研究成果,模型程式碼和權重,都免費公開給全世界。這樣,就會吸引大量開發者,來使用我的模型,測試我的模型,改進我的模型。

程式碼很重要。但是生態更重要。

用程式碼換取整個生態的幫助,可能才是對抗巨頭們的唯一方法。

明白了。可是,那你怎麼活下去呢?

別擔心。開源大模型,也能賺錢。

開源也能賺錢

開源大模型,至少有三種賺錢的辦法。

第一種,是“雙程式碼模式”。

免費公開的基礎程式碼。這對大部分人來說夠用了。但是對於一些大型企業來說,他們希望有的許可權管理,分級管理,等等各種“高階能力”,可以收費。

第二種,是“保險費模式”。

是程式碼,就會出問題。大公司對服務的穩定性、響應的及時性,要求很高。所以,大公司很可能會購買“保險”服務,確保遇到問題時,會有人會處理。

第三種,是“雲服務模式”。

而對中小企業和個人,可以像用水和用電一樣,直接呼叫DeepSeek的API,使用DeepSeek的雲端“智慧資源”,然後按“度”(百萬token)付費。

不管是開源,開始閉源。只要創造了價值,都能賺到錢。所以,不用為DeepSeek擔心。

也不用為英偉達擔心。

傑文斯悖論

DeepSeek這個“大模型屆的拼多多”橫空出世。英偉達股票當天暴跌17%。投資人擔心大家不再需要那麼多GPU了。

其實,大家不用太擔心。給你講個故事。

1776年,瓦特改良了蒸汽機。瓦特蒸汽機,比老式蒸汽機,節省2/3的煤炭。於是人們歡呼:煤炭的消耗,將從此大大減少。

但實際情況,恰恰相反。英國經濟學家傑文斯發現,蒸汽機的效率提高了10倍的同時,煤炭的消耗量不但沒有下降,反而上升了100倍。

為什麼呢?

因為蒸汽機效率提升後,原來用不起煤炭的人,覺得自己用得起了。於是紛紛辦廠。工廠數量的激增,反而引起煤炭用量的劇烈反彈。

這就是著名的“傑文斯悖論”。

英偉達的顯示卡同理。

DeepSeek大大提升了GPU的使用效率。這在短期內,可能會導致GPU的用量下降。但很快,就會有更多人因此加入模型訓練陣營,從而導致顯示卡的需求激增。

果然。懵了的納斯達克,第二天就清醒了過來。英偉達股票回漲了8%。

回過神來後,在一片讚歎聲中,也逐漸出現了各種質疑和批評。

比如:蒸餾。

蒸餾

美國白宮顧問David Sacks公開表示,有“實質性證據”證明,中國AI公司DeepSeek“蒸餾”(distill)了OpenAI模型。他把這種“蒸餾”行為,比作“偷竊”。

嗯……打不過,就誣陷嗎?“蒸餾”這個指控,很嚴重啊。

首先解釋一下,什麼是“蒸餾”?

有兩個模型。一個老師模型(teacher model),一個學生模型(student model)。學生不斷向老師提問,並把“問題-答案”記錄下來。然後用這些“問題-答案”的資料,來訓練學生,從而讓學生擁有和老師非常接近的知識和能力。這就叫:蒸餾。

這就是蒸餾啊?可是,學生向老師學習,也沒什麼問題吧?

是的。學習是沒什麼問題。但是,ChatGPT的使用者協議裡明確寫著,不允許用我的模型,來訓練新的模型,尤其是訓練用來和我競爭的模型。也就是說,禁止蒸餾。用ChatGPT,就要遵守ChatGPT的使用協議。這是誠信問題。

另外,牛頓花了30年創造了萬有引力定律。我花了3天學會了萬有引力定律。雖然結果是,我們都懂了萬有引力定律。但是,我不能用我的3天,去嘲笑牛頓的30年。

所以,David的這個“蒸餾”指控,還是挺重的。

那麼,我親愛的讀者朋友,你相信DeepSeek蒸餾了ChatGPT的模型嗎?

我確實不知道。我希望沒有。因為如果真有,那這篇文章前面所有文字,可能都白寫了。

如果真的沒有,DeepSeek,我希望你能你起訴David。請求法院罰他賠償1美元。加在小紅書上連續道歉30天。

這樣的汙衊,太欺負人了。

曼哈頓計劃 2.0

DeepSeek這把火,為何燒疼了矽谷?

用遊戲科學的創始人馮驥的話來說:因為這是一個“國運級”的機會。

為什麼?因為AI不是一項普通的技術。它是一門能改變幾乎所有其他技術的技術。

哪個國家能率先實現通用人工智慧(AGI),也許誰就能率先解決材料科學問題(武器更先進),率先解決蛋白質問題(醫療更先進),率先解決可控核聚變問題(能源更先進),以及其他很多問題。

這也是為什麼,美國人把AI稱作曼哈頓計劃 2.0。

上個世紀,美國人發誓,一定要比德國人先研發出原子彈。這項計劃,就叫做作:曼哈頓計劃。現在,他們把一定要比中國人先實現通用人工智慧。甚至不惜各種封鎖。

哎。至於嗎。一起發展不好嗎?必須對中國封鎖嗎?

我用這個問題問AI。

中國的DeepSeek給我的回答是:

否。技術競合催生共贏,封鎖反噬創新生態。

說得真好。

而ChatGPT給我的回答是:

否。但出於競爭與安全考量,美國可能選擇部分領域封鎖以維護技術優勢。

嗯。果然是美國的GPT。

這是劉潤公眾號的第2504篇原創文章

熱門資訊
  • PLOS | 新冠病毒N蛋白上R203M和D377Y位點的突變透過調控RIG-I-MAVS訊號通路促進病毒複製的分子機制 | 2025-02-01 06:21:02
  • 認證透過!英偉達批准三星8層HBM3E儲存晶片 | 2025-02-01 06:21:49
  • 日本科學家藉助二茂鐵分子設計出世界上最小的分子機器 | 2025-02-01 06:38:40
  • 訊息稱蘋果已終止建立與 Mac 連線的 AR 眼鏡的專案 | 2025-02-01 06:43:17
  • 手機直連衛星上網,天地一體不是夢 | 2025-02-01 06:45:25
  • 中芯國際申請半導體結構形成方法專利,避免晶片中低介電常數材料層破裂 | 2025-02-01 06:49:05
  • 庫克 AR 戰略受挫,古爾曼曝料稱蘋果消費級 AR 眼鏡專案擱淺 | 2025-02-01 07:03:58
  • 蘋果新專利探索 Vision Pro 極致沉浸體驗,3D 呈現紙張效果 | 2025-02-01 07:12:40
  • 中國掌握40.8%5G標準專利,華為第一,還有2家手機廠商進全球前十 | 2025-02-01 07:14:55
  • 王雙飛院士團隊AFM:Janus非對稱纖維素摩擦電材料 | 2025-02-01 07:14:56
  • 河南農業大學農學院青年教師以第一作者身份在一區Top期刊(IF=9.3)上發表研究成果 | 2025-02-01 07:47:00
  • 兩年內從地球衝到火星? NASA正在構思核動力推進解決方案 | 2025-02-01 07:47:02
  • CalDigit發售Element 5 Hub:4 個 Thunderbolt 5 介面、90W 供電 | 2025-02-01 07:55:31
  • OPPO 申請天線元件及電子裝置專利,提升了藍芽通訊的穩定性 | 2025-02-01 08:06:37
  • Science丨劉志勇團隊破解聽覺密碼:Casz1守護耳蝸內毛細胞命運與維持外毛細胞存活 | 2025-02-01 08:06:39
  • 血戰DeepSeek,OpenAI o3-mini急上線! | 2025-02-01 09:13:26
  • DeepSeek在美兩重天:五大巨頭接入,政府誠惶誠恐 | 2025-02-01 09:19:02
  • 蔚來推出5年0息限時購車活動,首付20%起 | 2025-02-01 09:19:05
  • DeepSeek驚豔全球,美國大模型兩巨頭齊發聲:並不比我們先進 | 2025-02-01 09:19:09
  • 蘋果AR眼鏡專案黃了,被爆遇技術挑戰 | 2025-02-01 09:23:13
  • 重大突破!成功研製 | 2025-02-01 10:01:14
  • 英特爾酷睿 Ultra 支援 DeepSeek 執行,可在 AI PC 上離線使用 | 2025-02-01 10:35:32
  • 大晶片,兩條路線 | 2025-02-01 11:13:18
  • 戴爾 4 月將推較低階 Alienware 外星人遊戲本 Aurora 16/16x | 2025-02-01 11:39:27
  • 小巧、便攜、效能強,趁著國補帶臺迷你主機回家爽玩遊戲吧! | 2025-02-01 12:06:22
  • 風水輪流轉?中國幹細胞門戶大開,外媒:全球抗衰者會更青睞中國 | 2025-02-01 12:45:46
  • ASML 即將發貨首臺第二代 High NA EUV 光刻機 EXE:5200 | 2025-02-01 12:47:59
  • 英偉達為 RTX 50 推出驅動級 AI 幀生成,未來將擴充套件至 40 系顯示卡 | 2025-02-01 13:01:26
  • 不騙窮人?70萬“時光機”風靡滬上富豪圈,業內:有錢人排隊搶 | 2025-02-01 13:04:06
  • 這些專家學者獲國獎,2025有望衝院士 ... | 2025-02-01 13:04:11
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們