很長一段時間裡,人們對於CPU核顯的效能,都還停留在「能用」的階段, 不過的M系列晶片核顯卻顛覆這一認知,讓大家意識到核顯的效能其實也有很大的進步空間。
在核顯領域,強大的並不只有蘋果,在獨顯市場被打得滿地找牙的AMD,前段時間就曝光了目前最強的x86架構核顯,並將會搭載於未來發布的Radeon 8000S系列上。
圖源:推特
作為x86生態的一員,AMD的核顯在泛用性上無疑是遠遠超越蘋果的,而且從目前曝光的資訊來看,其效能更是一個大“驚喜”。
AMD核顯大戰獨顯,底氣何在?
近日曝光的AMD新核顯,其晶片代號已經基本確定,並非沿用此前的Radeon 800M/900M,而是直接更名為Radeon 8060S和Radeon 8050S。新的命名方式與AMD積極釋出的下一代RX獨立顯示卡保持一致,換言之所採用的核心與AMD的獨顯大機率是同款。
雖然此前AMD也嘗試過將獨顯核心部署到CPU裡,但是受限於工藝製程,並沒有取得很好的效果,所以後續還是單開一個序列,只是沿用了獨顯的同款GPU架構。不過,即使並非同款核心,出色架構設計帶來的效能提升也讓AMD的APU(AMD對擁有高效能核顯單元的CPU的稱呼)成為x86最強。
而在臺積電的3nm製程成熟後,加上DDR5記憶體的成熟以及CAMM2記憶體標準的正式確定,AMD也終於找到了進一步提升核顯效能的機會。從曝光的資訊來看,Radeon 8060S/8050S將分別擁有40/32個CU單元,其中Radeon 8060S的單元數與蘋果的M4 Max一致,其實際效能或將接近移動版的RTX 4070。
圖源:微博
如果曝光資訊無誤,那麼這將會是核顯效能首次能夠與高階獨立顯示卡角力,要知道上一代核顯的實際效能只是剛好超過GTX 1650的水平(英偉達在2019年釋出的入門級獨顯),而RTX 4070則是英偉達2023年釋出的高階顯示卡,如果按綜合測試的基準成績來算,RTX 4070的效能約等於GTX 1650的3.8倍。
如此大的提升是怎麼做到的?很簡單,看看CU單元數量就知道了,Radeon 890M的CU單元數量只有16個,而Radeon 8060S則是40個,是前者的2.5倍,即使其他引數不做調整,效能也將是前者的兩倍以上。
而且,搭載Radeon 8060S的銳龍AI MAX 300系列將會採用chiplet分離式設計,簡單來說將GPU晶片與CPU晶片分開封裝並彼此獨立。因此可以在CPU裡塞進超大規模的GPU核心,甚至從曝光的內部設計圖來看,GPU核心的面積要明顯大於CPU核心。
另外,chiplet分離式設計還可以讓AMD將HBM3記憶體整合到晶片內,作為GPU核心的獨立視訊記憶體使用,解決主機板記憶體頻寬和速度無法滿足GPU效能釋放的問題。正是因為有望解決了GPU核心以及視訊記憶體頻寬問題,才讓新一代核顯在效能上出現了驚人的突破。
核顯效能媲美高階獨顯,或許真的不只是說說而已了。
AI時代,核顯成晶片巨頭必爭之地
為什麼AMD要執著於將高效能的GPU塞進CPU裡?以前主要是為了押注入門娛樂PC的賽道,只需要購買一個比同規格CPU貴一點的APU,你就可以得到一個高效能CPU+入門級獨顯效能的核顯,能夠滿足網遊及部分單機遊戲的娛樂需求,而且因為不需要考慮顯示卡的安裝,可以做成盒子大小的迷你主機,便於部署和擺放。
但是隨著AI大模型的出現,APU的用途就悄然發生了變化,核顯的用途不再是影片編解碼加速和遊戲,而是成為AI算力的一部分。雖然現在的CPU大多將NPU作為主要的AI算力來源,但是GPU在平行計算和高計算量任務方面的優勢是無可替代的。
舉個例子,AI大模型中非常熱門的文生圖功能,在部分AI PC上已經實現了端側執行,但是實際效果並不好,往往只能生成構圖簡單且小尺寸的影象。這是因為NPU雖然在AI運算上非常高效,但是卻不具備GPU的超強平行計算效能,難以進行復雜的非線性操作和深層次的模型計算。
實際上,NPU和GPU在文生圖等功能上是可以互補的,利用NPU的高效推理分析和理解使用者需求,同時生成簡單的影象框架,再用GPU來執行更深層次的最佳化並豐富畫面,最大程度地利用各計算模組的優勢,就可以提供更高效的AI服務。
未來的AI功能想要在影象分析、生成、修改等方面進行更深層次的功能探索,那麼GPU就是必需的,因為其本身的效能特點是無可替代的。而且,不要覺得這些功能離你還很遙遠,就以我們常用的Adobe Photoshop來說,新版本已經支援大量AI功能,並且提供本地端側的AI功能支援。
圖源:Adobe
而在實際測試中,雖然沒有獨立顯示卡的PC也可以執行端側AI功能,但是卻有大量功能被限制,即使是可用的功能效率也大打折扣。所以,Adobe建議使用者搭配至少擁有4GB視訊記憶體的GPU,以此來保證端側AI功能的基礎功能都可以啟用。
隨著Adobe在旗下軟體中普及AI功能,輕薄本的核顯效能已經無法滿足需求,除非你只打算使用Adobe套件的基礎功能,否則一個性能過得去的GPU就是必需的,不管它是獨顯還是核顯。
Adobe只是整個AI生態的其中一部分,未來的AI PC顯然不會止步於此。
AI PC爆發,APU核顯將成為主流方案?
那麼問題來了,為什麼一定要核顯?CPU+獨顯的組合難道不行嗎?並非如此,APU和CPU+獨顯都是未來AI PC的方向,但是側重點卻有所不同。CPU+獨立顯示卡,也就是現在的高效能膝上型電腦,雖然效能強大但是因為需要應付兩個熱源,所以對散熱系統要求更高,無法做到真正的輕薄設計。
但是APU不同,因為CPU、GPU等都被封裝到一個晶片裡,可以透過均熱板等技術更好地最佳化散熱系統,在保持散熱系統輕量化的同時滿足散熱需求,更好地滿足移動辦公需求。
換言之,APU能夠滿足AI PC的移動化和隨時部署要求,雖然在效能峰值等方面肯定無法與CPU+獨顯的組合相比,但是卻可以更好地部署在小型PC、移動PC裡。當然,一個高效能的APU本身功耗肯定不會低,屆時就只能看CPU廠商如何進行取捨了。
此外,APU可以利用統一記憶體等技術,讓CPU、GPU共用高速記憶體,雖然成本會顯著上升,但是也可以提供更高的效能,並且滿足大型AI模型的執行要求。比如蘋果的Mac就利用超大統一記憶體的優勢,能夠流暢執行RTX 4090都無法流暢執行的AI模型,不管是AI開發還是AI應用,都有著更顯著的優勢。
圖源:極客灣
實際上,CPU+GPU的組合晶片已經被多個半導體巨頭盯上,除了前面提到的蘋果和AMD外,英特爾、英偉達也在探索這個市場,英特爾的Xe-LPG就採用了獨顯同等核心,只是效能與AMD還有很大差距,僅相當於780M的水平。至於英偉達,則是更激進一些,選擇直接將CPU內建到GPU裡,反其道而行之。
其實英偉達的思路也是可以理解的,既然自家的優勢在於GPU而非CPU,那麼將GPU打包為主要賣點,CPU作為附贈功能來銷售就可以更好地發揮出英偉達的技術優勢,只是對於PC市場來說這樣的組合確實很新鮮。
核顯賽道以前是英特爾獨秀,後來AMD加入戰場,現在則是進入三國爭霸的階段,英特爾、AMD、英偉達都想在這個市場上取得優勢,因為這將關係到未來的AI PC市場走向。蘋果呢?作為四大主流晶片平臺裡唯一的封閉式生態,蘋果雖然並不直接參與競爭,但是卻已經成為其餘三家無法忽視的對手。
未來,隨著蘋果逐漸完善自己的系統生態,Mac裝置的市場份額會不可阻擋的上升,雖然因為價格等問題並不會直接威脅到x86 PC的核心地位,但是卻會蠶食掉相當一部分移動PC和AI PC市場。
誰能想到,曾經毫不起眼,被視為CPU附贈品的核顯,會有一天成為兵家必爭之地。