時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

“拖後腿”的晶片技術

2024-11-09 18:37:24

如果您希望可以時常見面,歡迎標星收藏哦~

本週二,Nvidia的股價再次超越,成為全球最有價值的公司,繼今年6月創下類似紀錄後,再度迎來輝煌時刻。在過去兩年中,憑藉GPU的強大算力,Nvidia在AI時代可謂風光無限,晶片效能不斷攀升,取得了巨大的市場成功。然而,不得不指出的是,儘管GPU技術飛速發展,仍有一些短板技術正在成為英偉達發展的隱性障礙,影響著其進一步的突破。

高歌猛進的GPU

近一兩年來,我們可以看到GPU的速度迭代非常快,背後很大的因素是生成式AI(大模型)的爆發式增長。IDC預測到2027年,全球生成式AI市場規模將攀升至1454億美元,中國市場的投資也將達到129億美元,IDC指出,這一發展趨勢的自技術迭代的加速、應用領域的拓寬,以及企業對 AI 創新驅動的不懈投入。

算力是生成式AI發展的物理基礎,GPU是加速計算的主要工具。要實現大模型的突破,就需要大幅提高GPU的效能。GPU目前正進入一種“自我加速”的發展模式。和AMD等廠商面臨著巨大的市場壓力,它們必須不斷在硬體設計上推陳出新,力求實現每年一個小迭代、每兩年一個大迭代,才能滿足這些需求。即使Hopper H100 GPU 平臺是“歷史上最成功的資料中心處理器”,但黃仁勳在今年的Computex主題演講中說到,Nvidia也必須繼續努力。

英偉達的GPU架構從Fermi到 Hopper再到Blackwell,每次架構升級都帶來效能和能效上的顯著提升。從“Pascal” P100 GPU一代到“Blackwell” B100 GPU 一代,八年間GPU 的效能提升了1,000多倍。雖然過去八年效能提升了1000多倍,但是GPU的價格僅上漲了7.5倍。據瞭解,Nvidia的新款基於Blackwell的GB200 GPU系統能夠以比上一代H100系統的推理速度快30倍,但與H100 首次釋出時的價格大致相同,預計每臺GB200 GPU 的售價在30,000至40,000美元之間。

從Hopper GPU開始,英偉達就一直屬於搶手貨,而新一代的Blackwell亦是如此。10月,英偉達CEO黃仁勳表示,最新的Blackwell GPU未來12個月的訂單均已經售罄,AWS、Google、Meta、Microsoft、Oracle 和CoreWeave等主要科技巨頭是大買手。

由於對資料中心GPU的需求,Nvidia的市值自2023年初以來增長了近十倍。2023年初,英偉達的市值為3600億美元。不到兩年後,其市值已超過3.4萬億美元。

Nvidia市值超越蘋果成為全球最有價值的公司

GPU規模的發展速度之快是前所未有的,就拿AMD來說,在 AMD 2024 年第三季度財報電話會議上,AMD CEO Lisa Su指出,其GPU銷量已接近CPU銷量,這點與AMD涉足AI市場大有關係。AMD的AI GPU業務才剛開始一年,營收就已經快達到CPU業務規模。在財報會上,Lisa Su還表示:“僅在資料中心,我們預計AI加速器市場規模將以每年60%以上的速度增長,到2028年將達到5000億美元。這大致相當於2023年整個半導體行業的年銷售額。”AMD將2024年GPU銷售額預測從45億美元上調至50億美元以上。

然而,GPU這樣的快速發展也帶來了新問題。隨著GPU效能的不斷提升,背後支援它們的基礎設施——尤其是互聯技術和儲存技術——卻顯得相對滯後。

跟不上的互聯技術

如今,大型語言模型(LLMs)如ChatGPT、Chinchilla 和 PALM,以及推薦系統如 DLRM 和 DHEN,都在成千上萬的 GPU 叢集上進行訓練。訓練過程包括頻繁的計算和通訊階段,互聯技術就顯得尤為關鍵。

傳統的互聯技術如PCIe(外圍元件互聯)介面的頻寬已難以支撐日益增大的資料傳輸需求,也早已經跟不上GPU的速度,PCIe標準雖然逐步演進,但它的傳輸頻寬與GPU處理能力之間的差距越來越大。特別是在多卡平行計算的場景中,PCIe顯得捉襟見肘,限制了GPU的最大效能釋放。儘管目前許多大公司嘗試採用標準PCIe交換機,並透過基於PCIe的結構擴充套件到更多加速器,但這只是權宜之計。

為了應對這一瓶頸,英偉達開發了自家的高速互聯技術——NVLink和Infiniband。NVLink 技術可用於 GPU 之間的高速點對點互連,提供高頻寬和低延遲的資料傳輸,並透過 Peer to Peer 技術完成 GPU 視訊記憶體之間的直接資料交換,進一步降低資料傳輸的複雜性。這對於分散式環境下執行的複雜 AI 模型尤為重要。更快的縱向互聯有助於伺服器叢集內每個 GPU 效能的充分釋放,從而提升整體計算效能。

來源:Nvidia

至於Infiniband技術,是一種網路連線技術。英偉達於2019年收購了Mellanox Technologies,Mellanox是全球領先的InfiniBand技術提供商之一。收購後,英偉達繼續推進InfiniBand技術的創新,並在其加速計算平臺中深度集成了InfiniBand網路。雖然乙太網(Ethernet)在很多應用中是主流的網路連線技術,但在高效能計算(HPC)和AI訓練等場景中,InfiniBand相較於乙太網,具有顯著優勢:它提供更高的頻寬、更低的延遲,且原生支援遠端直接記憶體訪問(RDMA),使得資料傳輸更加高效。

Nvidia的Quantum-X800 InfiniBand(來源:Nvidia)

而AMD則推出了自己的Infinity Fabric互聯技術,專為資料中心最佳化,旨在提升資料傳輸速度和降低延遲。不過Infinity Fabric自然也是比不過NvLink的,不然AMD也不會發起UALink聯盟。

NVLink和InfiniBand技術雖然具有明顯優勢,但它們都是英偉達的專有技術。隨著行業對互聯技術需求的不斷增長,一方面希望避免英偉達在技術上的壟斷,另一方面也面臨著互聯技術瓶頸的挑戰。因此,許多企業開始對標英偉達的互聯技術,嘗試開發替代方案。

去年7月19日,超級乙太網聯盟 (UEC)成立,來對標InfiniBand。創始成員包括AMD、Arista、Broadcom、思科、Eviden(Atos 旗下企業)、HPE、英特爾、Meta 和微軟。目前超級乙太網聯盟已經吸引了67家公司的加入。其中不乏有許多初創公司,聯盟的成立將使這些初創公司從該聯盟的舉措中受益匪淺,UEC將成為初創公司在最佳化 TCO 的同時駕馭複雜的AI和HPC網路格局的關鍵。

UEC部分會員一覽(來源:UEC官網)

今年,行業再度將錨頭瞄向於NVLink。今年10月,由AMD主導,九大行業巨頭——包括AMD、英特爾、Meta、惠普企業、亞馬遜AWS、Astera Labs、思科、谷歌和微軟——正式聯合成立了UALink(統一加速器互聯)。UALink的目標是成為AI加速器擴充套件連線的行業開放標準。其主要優勢在於,UALink為複製NVLink和NVSwitch功能並與其他公司共享開發成果提供了一條途徑,從而讓整個行業的其他參與者都有機會與NVIDIA保持步調一致。

UALink 1.0規範將於今年向會員開放。該標準將為AI pod內多達1,024個加速器實現高達每通道200Gbps的連線。假設 Nvidia HGX 風格的伺服器內部有 8 個 AI 加速器,UALink 可以在一個pod中連線多達 128 臺這樣的機器。據tomshardware的報道,不過,UALink 最有可能經常以較小的規模使用,大約8個伺服器的pod透過UALink相互通訊,進一步的升級由超級乙太網處理。聯盟成員將在今年獲得該規範的訪問許可權,並於 2025 年第一季度開始進行全面審查。

來源:UALink新聞簡報

無論是NVLink、Fabric還是UALink,這一系列舉措反映出,現有的互聯技術跟不上加速器發展速度的普遍問題,行業迫切需要新的解決方案來支援更強勁的算力需求。

儲存更吃力

與互聯技術的滯後相比,儲存技術的進步似乎顯得更加吃力。在AI、機器學習和大資料的推動下,資料量呈現出指數級的增長,儲存技術必須緊隨其後,才能確保資料處理的效率和速度。對於當前的記憶體行業來說,高頻寬記憶體(HBM)已經成為焦點,尤其是在大模型訓練所需的GPU晶片中,HBM幾乎已經成為標配。

GPU依賴於高頻寬記憶體(HBM)來滿足高速資料交換的需求。與CPU相比,GPU需要更加頻繁的記憶體訪問,且資料的訪問模式具有很高的並行性。這要求儲存系統必須能夠在毫秒級的延遲內提供極高的資料頻寬。

2013年,SK海力士推出了首款HBM晶片,直到大模型的崛起,HBM才真正迎來了應用的黃金時機。近年來,SK海力士加速推進HBM技術的更新迭代。今年9月,SK海力士成功批次生產了全球首款12層HBM3E產品,並計劃於2025年初推出首批16層HBM3E晶片樣品。原本預計在2026年量產的HBM4,SK海力士已將時間表提前,預計將在2025年下半年交付12層HBM4晶片。

儘管如此,黃仁勳仍在敦促SK海力士加快HBM4的供應,初步要求提前6個月交付。雖然HBM的需求火爆,儲存廠商依然面臨著生產能力、技術瓶頸和成本等多重挑戰。

儲存技術的滯後給高效能計算帶來了多重挑戰:

計算能力浪費:GPU的強大計算能力無法得到充分利用,儲存瓶頸導致大量的GPU計算資源處於空閒狀態,無法高效地執行任務。這種不匹配導致了系統性能的低效發揮,增加了計算時間和能源消耗。

AI訓練效率下降:在深度學習訓練過程中,大量的資料需要頻繁地在GPU與儲存之間交換。儲存的低速和高延遲直接導致AI訓練過程中的資料載入時間過長,從而延長了模型訓練的週期。這對於需要快速迭代的AI專案來說,尤其是商業應用中,可能會造成較大的成本壓力。

大規模資料處理的障礙:隨著大資料的興起,許多AI應用需要處理海量資料。當前儲存技術未能有效支援大規模資料的快速處理和儲存,特別是在多節點分散式計算的場景中,儲存瓶頸往往成為資料流動的最大障礙。

為了解決儲存跟不上GPU發展的瓶頸,業界已經提出了一些潛在的解決方案:例如存算一體以及CXL這樣的智慧儲存架構。

隨著處理在記憶體(PIM)技術的興起,計算和儲存有可能進行更緊密的整合。PIM技術允許計算任務直接在儲存裝置上進行處理,避免了資料在計算和儲存之間的傳輸瓶頸。此類技術有望大幅提升儲存系統的效能,並有效支援GPU等計算晶片的高速資料訪問需求。

智慧儲存架構:透過採用更智慧的儲存架構,如CXL(Compute Express Link)和NVMe協議,可以實現更高效的儲存擴充套件和更低延遲的資料訪問。CXL提供了計算和儲存之間的高速互聯,使得GPU能夠更快速地訪問儲存資料,解決傳統儲存架構中存在的頻寬瓶頸問題。

儲存技術滯後於計算晶片發展的現象,顯然已經成為現代計算系統中的瓶頸。儘管儲存技術已經取得了一些進展,但與GPU等計算晶片的快速發展相比,仍存在較大的差距。

總結

在當今快速演變的技術生態系統中,多技術協同升級已成為推動新興技術發展的核心動力。要實現算力的持續增長,GPU、互聯、儲存等技術必須協調發展。雖然GPU技術已取得了顯著進步,但沒有更高效的互聯技術和更快的儲存技術支撐,算力的潛力將無法完全釋放。

對於英偉達等科技巨頭而言,如何繼續推動GPU與其他關鍵技術的協同進化,解決儲存、互聯的瓶頸,將是未來幾年中的主要挑戰。

半導體精品公眾號推薦

專注半導體領域更多原創內容

關注全球半導體產業動向與趨勢

*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第3941內容,歡迎關注。

『半導體第一垂直媒體』

實時 專業 原創 深度

公眾號ID:icbank

喜歡我們的內容就點“在看”分享給小夥伴哦

熱門資訊
  • 微軟 Win10 LTSC 增加多款英特爾 CPU 官方支援,2027 年結束更新 | 2024-11-04 16:30:52
  • 369元起 鎧俠EXCERIA PLUS G2系列行動硬碟上市:小巧鋁製外殼 | 2024-11-04 16:37:11
  • 美國政府考慮Intel設計部門與AMD合併!你覺得可能嗎 | 2024-11-04 16:51:13
  • 超級電容器,我叫你一聲“電池”,你敢答應嗎! | 2024-11-04 16:57:05
  • 發表第一篇論文十年後,接近一半的科學家離開了學術界? | 2024-11-04 16:57:11
  • 高通真是沒想到!聯合美國製裁華為5年:卻要被蘋果拋棄了 | 2024-11-04 17:00:43
  • 銘凡 UM870 Slim 迷你主機開售:R7-8745H 準系統售 1959 元 | 2024-11-04 17:01:16
  • 能把每一面牆都能變成IMAX?450億市場都在為它買單 | 2024-11-04 17:17:40
  • 外媒:新款Mac Mini硬體效能可比拼PS/Xbox,但缺乏遊戲 | 2024-11-04 17:33:15
  • 項立剛:發論文是科技界毒瘤!何祚庥:一竅不通,典型科盲! | 2024-11-04 17:33:50
  • 宏碁CUDIMM DDR5覆蓋一層24K純金!風冷超頻10270MHz | 2024-11-04 17:40:05
  • 神舟十八號落地翻滾,技術差距大?新飛船直立無損著陸,世界領先 | 2024-11-04 17:43:05
  • 谷歌新款Tensor晶片曝光,臺積電最新3nm公益,超大主核! | 2024-11-04 17:43:10
  • 手機soc廠商自研架構成趨勢 | 2024-11-04 17:45:22
  • 21小時超長續航的AI超輕薄本:華碩無畏Pro14首發6999元起 | 2024-11-04 17:53:18
  • 成功從空間站分離 神舟十八號航天員乘組踏上回家路 | 2024-11-04 18:11:38
  • 不止Mate 70!華為11月新品大爆發:摺疊屏、平板、手錶都來了 | 2024-11-04 18:25:31
  • ONEXGPU 2移動顯示卡擴充套件塢上市:內建RX 7800M首發6199元 | 2024-11-04 18:25:34
  • Shuttle 推出 5L 迷你工作站 XH610G2:英特爾 LGA1700,支援獨顯 | 2024-11-04 18:38:37
  • 張朝陽現身清華大學物理系 硬核推導核磁共振的量子力學原理 | 2024-11-04 18:44:24
  • 國家重大科技基礎設施“先進阿秒鐳射設施(西安部分)”啟動建設 | 2024-11-04 19:03:49
  • 發現8個高風險漏洞 NVIDIA GeForce使用者必須更新GPU驅動程式 | 2024-11-04 19:17:13
  • 2030年僅EUV光刻機的年耗電量將超過54000吉瓦! | 2024-11-04 19:17:34
  • 索尼PS5 Pro新增2GB DDR5記憶體 處理器仍基於Zen2架構 | 2024-11-04 19:20:37
  • MacBook Pro兩年後將迎重大更新 搭載OLED螢幕設計更輕薄 | 2024-11-04 19:20:41
  • NASA的Crew-9"龍"飛船遷往另一個對接埠 空間站等待接受SpaceX的補給 | 2024-11-04 19:21:41
  • 雙十一超值電腦閉眼選:惠普星Book Pro 16/14詳細點評 | 2024-11-04 19:31:11
  • 徹底曝光!支援轉基因的66種人! | 2024-11-04 19:31:43
  • 模擬晶片,日子難過 | 2024-11-04 19:47:23
  • SpaceX 巨型登月飛船細節曝光:兩層樓高,可載 20 名宇航員 | 2024-11-04 19:47:29
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們