據報道,公司的 Blackwell NVL72 伺服器機架正面臨散熱問題,而該公司已開始向市場供應主流產品。繼架構缺陷之後,NVIDIA的Blackwell現在又面臨伺服器機架設計問題,但首批採用液冷技術的NVL72 AI伺服器機架已開始發貨。
NVIDIA的Blackwell架構儘管被寄予厚望,但從一開始就成為了開發障礙的受害者。 最初,有訊息稱Blackwell芯片面臨板載互連技術的問題,最終促使臺積電等供應鏈公司修改了生產方法。 這個問題不僅限制了 Blackwell 的供應,而且現在,根據 The Information的報道,NVIDIA 似乎再次面臨另一個障礙。
報道稱,Blackwell 的伺服器機架是一個平臺,多個 Blackwell 介面相互堆疊,組合成"GB200"AI 伺服器。 據說,問題明顯出現在更高階的 NVL72 配置的 Blackwell 伺服器上,據說從創收和客戶利益的角度來看,這對英偉達來說是更"重要"的配置。 如果問題持續存在,鑑於 NVL72 伺服器的需求量很大,我們可能會對英偉達的伺服器營收前景持看淡態度。
英偉達對此回應,公司正在與領先的雲服務提供商合作,"這是我們工程團隊和流程不可分割的一部分。 工程迭代是正常的,也是意料之中的。"
目前還沒有具體說明是哪方面的原因導致了這一問題,但據稱這一問題可能源於所使用的冷卻方法,英偉達已經敦促其供應商立即解決這一問題,因為它已經嚴重擾亂了供應鏈。
鑑於NVIDIA擁有龐大的資源和廣泛的供應鏈結構,我們懷疑這個問題不會持續太久,因為製造商很可能正在修改伺服器機架的設計。
有趣的是,英偉達公司的核心合作伙伴戴爾公司已經開始出貨 Blackwell 伺服器機架,特別是 PowerEdge XE9712 伺服器,這是業界首批企業級英偉達 GB200 NVL72 伺服器。 因此,除非伺服器機架問題得到解決,否則英偉達最有可能採取的措施就是在初期限制供應。
儘管存在暫時的障礙,英偉達的Blackwell產品線仍將成為公司歷史上"最成功"的產品,預計將創造數十億美元的收入。 隨著市場傾向於構建"人工智慧叢集",這推動了對該架構的巨大需求,並最終轉化為更高的營業額。