快科技11月18日訊息,據媒體報道,NVIDIA新一代旗艦AI晶片Blackwell被曝在高容量伺服器機架中存在嚴重的過熱問題,可能導致交付延遲。
有知情人士爆料稱,Blackwell晶片在裝有72個處理器的伺服器中使用時會產生過熱問題,這些機器預計每個機架的功耗高達120kw,過熱會限制GPU效能並有損壞元件的風險。
對此,NVIDIA發言人回應媒體稱:"我們正在與領先的雲服務提供商合作,將其作為我們工程團隊和流程中不可或缺的一部分。工程迭代是正常且符合預期的。將GB200這一迄今為止最先進的系統整合到各種資料中心環境中,需要與我們的客戶共同設計。"
雖然面臨技術問題,但NVIDIA的AI晶片需求依然強勁,全球近90%的市場仍由其控制,NVIDIA表示:"目前客戶正在搶佔GB200系統的市場先機"。
值得注意的是,這並不是Blackwell晶片首次因設計缺陷而延遲交付,NVIDIA於今年3月推出了Blackwell晶片系列,但在年中的時候,市場上開始流傳Blackwell存在架構設計隱患的訊息。
10月晚些時候,NVIDIACEO表示,在長期合作伙伴臺積電的幫助下,NVIDIABlackwell AI晶片的設計缺陷已經修復。
他當時預計,Blackwell晶片將在第四季度發貨,而如今據預計,改良後的Blackwell GPU最快要明年1月底才能出貨。