英偉達，突發！事關DeepSeek

資料是個寶

資料寶

投資少煩惱

據英偉達官網最新訊息，為了幫助開發人員安全地試驗這些功能並構建自己的專用代理，6710億引數的DeepSeek-R1模型現已作為NVIDIA NIM預覽版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服務可以在單個NVIDIA HGX H200系統上每秒提供多達3872個令牌。開發人員可以使用應用程式程式設計介面（API）進行測試和試驗，該介面預計很快將作為可下載的NIM微服務提供，是NVIDIA AI Enterprise軟體平臺的一部分。

此外，還在官網中表示，DeepSeek-R1是一個具有最先進推理能力的開放模型。DeepSeek-R1等推理模型不會提供直接響應，而是對查詢進行多次推理，採用思路鏈、共識和搜尋方法來生成最佳答案。

來自英偉達的認可

英偉達稱，DeepSeek-R1等推理模型不會提供直接響應，而是對查詢進行多次推理，採用思路鏈、共識和搜尋方法來生成最佳答案。執行這一系列推理過程（使用推理得出最佳答案）稱為測試時間擴充套件。DeepSeek-R1是此擴充套件定律的完美示例，證明了加速計算對於代理AI推理的需求至關重要。

由於模型可以反覆“思考”問題，因此它們會建立更多輸出標記和更長的生成周期，因此模型質量會不斷提高。大量的測試時計算對於實現實時推理和來自DeepSeek-R1等推理模型的更高質量響應至關重要，這需要更大規模的推理部署。R1在需要邏輯推理、推理、數學、編碼和語言理解的任務中提供了領先的準確性，同時還提供了高推理效率。

為了幫助開發人員安全地試驗這些功能並構建自己的專用代理，6710億引數的DeepSeek-R1模型現已作為NVIDIA NIM微服務預覽版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服務可以在單個NVIDIA HGX H200系統上每秒提供多達3872個令牌。開發人員可以使用應用程式程式設計介面（API）進行測試和試驗，該介面預計很快將作為可下載的NIM微服務提供，是NVIDIA AI Enterprise軟體平臺的一部分。

DeepSeek-R1 NIM微服務透過支援行業標準API簡化了部署。企業可以透過在其首選的加速計算基礎設施上執行NIM微服務來最大限度地提高安全性和資料隱私。透過使用NVIDIA AI Foundry和NVIDIA NeMo軟體，企業還可以為專門的AI代理建立定製的DeepSeek-R1 NIM微服務。

DeepSeek-R1是一個大型混合專家(MoE)模型。它包含了令人印象深刻的6710億個引數——比許多其他流行的開源LLM多10倍——支援128000個Token的大輸入上下文長度。該模型還在每個層中使用了極多的專家。R1的每一層都有256位專家，每個Token並行路由到八個不同的專家進行評估。

為R1提供實時答案需要許多具有高計算效能的GPU，並透過高頻寬和低延遲通訊進行連線，以將提示令牌路由到所有專家進行推理。結合NVIDIA NIM微服務中提供的軟體最佳化，一臺使用NVLink和NVLink Switch連線的帶有八個H200 GPU的伺服器可以以每秒高達3872個令牌的速度執行完整的6710億引數DeepSeek-R1模型。這種吞吐量是透過在每一層使用 NVIDIA Hopper 架構的FP8 Transformer Engine實現的，並且使用900GB/s的NVLink頻寬進行MoE專家通訊。

充分利用GPU的每秒浮點運算(FLOPS)效能對於實時推理至關重要。下一代NVIDIA Blackwell架構將透過第五代Tensor Core大幅提升 DeepSeek-R1等推理模型的測試時間擴充套件，第五代Tensor Core可提供高達20 petaflops的峰值FP4計算效能，以及專門針對推理最佳化的72-GPU NVLink域。

從開源到復現

近日，加州大學伯克利分校的研究人員開發出了中國開發的 AI 語言模型DeepSeek R1-Zero的小規模語言模型複製品，成本約為30美元。語言模型TinyZero是由校園研究生Jiayi Pan和其他三名研究人員領導的專案，由校園教授Alane Suhr教授和伊利諾伊大學厄巴納-香檳分校助理教授Hao Peng指導。

DeepSeek的R1模型權重和程式碼庫採用公共MIT許可證，因此Pan和他的團隊能夠訪問基礎程式碼來訓練一個明顯小得多的模型。潘表示，TinyZero同樣是開源的，這意味著程式碼可供公眾使用。他說，TinyZero 的開源性質允許人們下載程式碼並嘗試訓練和修改模型。“小規模複製非常容易實現，而且成本非常低，即使人們將其作為實驗的副專案，”潘說。“從專案一開始，我們的目標基本上就是揭開如何訓練這些模型的神秘面紗，更好地理解它們背後的科學和設計決策。”

昨天，微軟官網顯示，DeepSeek R1現已在Azure AI Foundry和 GitHub上的模型目錄中提供，加入了1800多個模型的多樣化產品組合，包括前沿、開源、行業特定和基於任務的AI模型。作為Azure AI Foundry的一部分，DeepSeek R1可在值得信賴、可擴充套件且企業級就緒的平臺上訪問，使企業能夠無縫整合高階AI，同時滿足SLA、安全性和負責任的AI承諾——所有這些都由Microsoft的可靠性和創新支援。

黑石最新態度

本週，矽谷、華盛頓、華爾街等地的領導人因中國人工智慧公司DeepSeek的意外崛起而陷入混亂。許多分析師認為DeepSeek的成功動搖了推動美國人工智慧行業發展的核心信念。

但人工智慧科學家反駁說，許多擔憂都是誇大其詞。他們表示，儘管DeepSeek確實代表了人工智慧效率的真正進步，但美國人工智慧行業仍然具有關鍵優勢。蘭德公司人工智慧研究員倫納特·海姆表示：“這並不是人工智慧前沿能力的飛躍。我認為市場只是搞錯了。”

另外，截至目前，私募股權巨頭、全球主要人工智慧系統資料中心投資者黑石集團仍持樂觀態度。“我們仍然認為，實體基礎設施、資料中心和電力的需求十分迫切，”黑石總裁喬納森·格雷(Jonathan Gray)週四在與投資者舉行的第四季度財報電話會議上表示。“這些需求的使用方式可能會發生變化。”

格雷表示，與投資界和企業界的大多數人一樣，黑石集團的高管在過去一週花了大量時間來權衡DeepSeek的影響。近年來，黑石集團積極購買和建設資料中心，這是科技公司執行人工智慧系統所使用的物理基礎設施。2021年，黑石集團以100億美元收購了美國資料中心公司QTS，去年，黑石集團牽頭以約160億美元收購了在亞洲運營資料中心的AirTrunk。

格雷同時預計，隨著人工智慧計算能力成本的大幅下降，人工智慧將得到更廣泛的應用。換句話說，雖然人工智慧模型回答特定問題所需的能力可能會減少，但人們會提出更多問題。格雷表示，黑石集團只為簽訂長期租約的科技公司建造資料中心。“我們不會投機性地建造它們。”他指出，客戶使用這些資料中心的方式很可能會改變。

來源：券商中國

宣告：資料寶所有資訊內容不構成投資建議，股市有風險，投資需謹慎。

責編：周莎

校對：楊立林

資料寶