作者:周源/華爾街見聞
高通新一代驍龍旗艦移動平臺,整體效能直逼PC級,重新定義了什麼叫“效能”。
移動級消費晶片效能直追PC級晶片,這是從所未有的事。
10月22日,釋出的驍龍8至尊版,成為高通成立以來效能最強悍的旗艦移動平臺,其技術釋放直如泉水“噴湧”,激射而出,故能傲視業界,難覓對手。
本代驍龍8旗艦,並沒有順延從2021年以來驍龍8Gen X的命名規則,轉而改稱驍龍8至尊版,英文名“Snapdragon 8 Elite”,這是為什麼呢?
因為驍龍8至尊版採用和驍龍X Elite相同的CPU架構——高通自研Oryon CPU架構,放棄了此前在移動晶片組中使用的Kryo CPU架構。
這個超級計算平臺(不僅僅是一顆SoC晶片),CPU採用高通曆史上從未有過的全大核設計;綜合性能、能效表現和AI能力,在驍龍8Gen 2(降低功耗)和驍龍8Gen 3(提升AI效能)的基礎上,達到了一個全新高度。
綜合而言,驍龍8至尊版的技術重點瞄準突破智慧手機的端側AI體驗。
安卓陣營今年推出的令人驚歎的AI體驗,比如榮耀在10月30日推出“一句話的事兒”的端側AI智慧體,能解構並自動達成使用者模糊意圖所指的實際需求,就來自驍龍8至尊版的底層技術能力;小米15 Pro推出的無網通訊功能,也在驍龍8至尊版的NB-NTN(非地面網路)衛星通訊技術看到了影子。
全大核結構統治晶片設計
評價任何晶片的效能優劣,有三個維度,統稱PPA。
也就是,Power(能耗)、Performance(效能)和Area(面積)。其中,能耗排第一,其次是效能,排第三的面積,主要考量與成本相關。
這個優良特性也被驍龍8至尊版繼承:基於GeekBench的測試結果,驍龍8至尊版的CPU的單/多核效能均提升45%,綜合能效提升44%,整體節能提升27%;GPU效能和能效提升均為45%,參照對比第三代驍龍8(即驍龍8Gen 3)標準。
與驍龍8Gen3和驍龍8Gen 2相比,驍龍8至尊版同樣採用臺積電工藝。與前兩代有所不同的是,本代旗艦平臺採用臺積電3nm工藝製程(第二代N3E),這個技術規格與蘋果A18系列、聯發科天璣9400相同。
本代移動旗艦平臺,並非簡單的SoC晶片整合,之所以稱之為算力平臺,是因為高通將超過40個不同元件全部封裝在一起。
除了CPU、NPU、還包括射頻、收發器、電源管理、超聲波指紋識別和移動連線晶片等等,具有全方位的移動、AI推理、綜合應用(比如影像、遊戲、螢幕解鎖等)和通訊連線能力。
高通將之命名為驍龍8至尊版,即“Elite”,與2023年推出的筆電晶片驍龍X Elite相似,原因就是高通首次將驍龍X Elite的Oryon CPU架構引入移動平臺,代際為第二代。
Oryon CPU架構主要針對日益增長的AI效能需求而設計。
因此,驍龍8至尊版是高通在首顆專為端側生成式AI打造的移動AI晶片——驍龍8Gen 3的基礎上進行了又一次技術大迭代版,是一個實打實的AI移動晶片整合平臺。
與高通曆史上所有SoC旗艦移動晶片最大的不同,除了這是一個整合多達40+個不同功能晶片的移動平臺,還有其CPU結構第一次採用了全大核設計,CPU架構也從Kryo變成Oryon。
基於第二代自研Oryon CPU架構,驍龍8至尊版配置了兩個超級核心(Prime),主頻高達4.32GHz;與之搭配的是六個“效能核心”(Performance Core),主頻達到驚人的3.53GHz,這與聯發科天璣9400的超超大核3.62GHz的主頻非常接近。
換句話說,天璣9400的超超大核,就主頻引數而言,僅相當於驍龍8至尊版效能核心主頻的水平。
驍龍8至尊版的兩個超級核心的主頻,已經不遜色於PC級CPU的主頻表現,故而效能強悍。高通甚至不無驕傲的公開表示,採用第二代Oryon CPU架構的核心,比英特爾寄予厚望的Lunar Lake PC處理器更強大。
“第二代Oryon CPU與友商(指英特爾)推出的最好的PC產品(即Lunar Lake)相比表現如何?”高通執行長Cristiano Amon表示,“與競品相比,我們的CPU效能提升了62%,這比英特爾剛剛釋出的產品要快得多,同時能效提高了190%。”
從CPU結構看,驍龍8至尊版採用了2個超級核心和6個性能核心,小核消失。這麼說的話,驍龍8Gen 3是高通最後一次採用三叢集CPU架構的移動平臺。
至此,Arm於2011年推出的big.LITTLE架構正式退出驍龍旗艦移動平臺的歷史舞臺,全大核時代正式宣告來臨,晶片CPU設計思路從此為全大核結構統治。
CPU和NPU分別有哪些提升?
雖然驍龍8至尊版也採用了和驍龍X Elite相類似的Oryon CPU架構,但前者用的Oryon已是第二代,那麼差別在哪裡?
高通專為移動平臺做了特別改進,除CPU配置不同,另外的最佳化主要是提升快取。
每個超級核心(Prime)和每個效能核心(Performance Core)的L1級快取分別提升至192KB和128KB,總計1152KB,超過1MB(1024KB);同時提升L2級快取至24MB,2個超大核獨享12MB,6個性能核分享12MB。
據高通介紹,這是一個全新的微架構,具有“即時喚醒”(Instant wake)功能,能減少各個CPU核心的頻繁電源迴圈。
以前,高通採用的Kryo CPU架構使用的“上電序列”(Power-Up Sequence)涉及重置程式碼,以便核心做好執行準備。但現在,高通以“即時喚醒”技術,允許核心立即執行下一條指令,消除了上電序列帶來的延遲,從而進一步提升執行效率。
同時,驍龍8至尊版支援的LP-DDR5X的速率為10.7Gbps(頻寬),主頻也達到了5.33GHz,比前驍龍8Gen 3的4.8GHz和驍龍8Gen 2的4.2GHz分別有11.04%和26.90%的提升。
高通表示,採用第二代高通Oryon CPU的微架構和新的記憶體技術,最終將帶來驍龍8至尊版出色的使用者體驗,包括更快的應用啟動速度、無縫的多工處理和先進的生成式AI功能。
對了,與驍龍8至尊版帶來的全新CPU架構和新的記憶體系統相比,AI才是這個移動平臺更引人關注的焦點。
既然說到AI效能,那麼高通始自驍龍8Gen 2採用的AI計算專用晶片“Hexagon NPU”就繞不過去,這是高通AI引擎的核心所在。
本代移動旗艦平臺,對Hexagon NPU做了哪些提升?
首先,增加了標量(Scalar)和向量(Vector)加速器數量:標量加速器有8個核心,向量加速器有6個核心;其次,資料吞吐能力全線增強;第三,有個類似超大核的張量(Tensor)加速器,總體上提升了45%的NPU效能和能效,基礎大語言模型上的token生成速率翻倍。
若做作用或任務拆分,張量(Tensor)加速器主要負責LVM(Logical Volume Manager)邏輯卷AI模型加速(主要作用於儲存器資源效率管理);標量(Scalar)加速器負責大語言模型(LLM)AI模型加速,向量(Vector)加速器支援長文字(Long Conetext support),三者共同提升了整體運算能力,同時支援超長文字和LLM加速。
目前業界流行的部分大語言模型應用的響應速度,驍龍8至尊版處理速度超過70 tokens/s,而驍龍8Gen 3的這個速度是每秒20 tokens(70億引數LLM)。
本代移動平臺的AI能力,基於大幅升級的Hexagon NPU,能支援在端側構建個性化多模態AI智慧體。這對提升使用者體驗尤為關鍵。
驍龍8至尊版能在底層對包括自動語音識別(ASR)、大語言模型(LLM)、大視覺模型(LVM)和全新多模態大模型(LMM)等在內的多模態模型提供支援。透過異構計算,這些AI模型能在高通AI引擎的不同核心上執行。
這些技術能力,能為智慧手機使用者帶來前所未見的全新體驗。
比如,智慧手機的感測器和攝像頭,能根據使用者的日常喜好,在端側本地建立屬於個人的神經網路(NPU),AI個人智慧體因之就能更有效理解使用者需求,相當於一個像真人那樣的助理。
AI個人智慧體和影像消除
在體驗層面,靠著Hexagon NPU模組,智慧手機能看懂螢幕所顯示的畫面,甚至能理解使用者的複雜意圖,並擁有即時給出解決方案的技術能力。
比如,使用者將手機攝像頭直接對準想要了解的事物,再向手機提問,手機能呼叫攝像頭的實時畫面,對之做出解構分析並給出答案。
還有一些更復雜的應用,比如使用者對著手機用語音說一句話,智慧手機有能力做使用者模糊意圖的任務解構,全程自動完成使用者意圖的需求滿足。這就相當於給使用者提供了一個高度“類人化”(像真人一樣)的AI個人助理,這是像科幻場景那樣的全新體驗。
這種體驗,在剛剛於10月31日榮耀釋出的搭載內建了榮耀AI個人智慧體YOYO的MagicOS 9.0的新一代旗艦Magic 7系列上,已經落地。Magic 7系列搭載了驍龍8至尊版。
榮耀號稱搭載MagicOS 9.0的智慧手機,使用者只需說“一句話”,就能搞定諸如點餐飲、取消隱藏的訂閱費用等複雜需求,大為拓展了AI手機的高度智慧體驗,比OPPO喜歡的用AI技術修圖、小米喜歡的AI攝影,無疑向前邁出了巨大的一步。
這種智慧終端的AI新體驗,實際上是以驍龍8至尊版的Hexagon NPU強悍底層AI技術為基礎。
驍龍8至尊版能實現使用者複雜意圖理解這種相對更高難度的AI體驗,相對來說,簡單的消除靜態照片多餘路人這種事,就是小菜了。
但是,高通作為技術豪門,不會止步於此。這次,驍龍8 至尊版的AI能力,還被擴充套件到了影片領域。
高通為其AI引擎Hexagon NPU配備了一個協同硬體模組:AI ISP(影象訊號處理器:Image Signal Processor)。
AI ISP的主要功能是提升計算攝影表現力,比如將更多的處理管道(Processing Pipeline)放在RAW域中執行。
這意味著當AI ISP在做自動對焦、自動校正白平衡和自動曝光等拍攝動作時,支援AI輔助增強功能,最終能實現更棒的影像表現力,比如更好的畫質(更高的清晰度或亮度、更好的色彩平衡)、更高幀率的影片等。
此外,高通用兩顆Micro NPU,再加上兩顆AI ISP、一顆DSP(:Digital Signal Processor)和一個記憶體,共同組建了高通感測器中樞(Sensing Hub),整體AI效能提升60%,AI推理速度提升45%。
從引數上看,AI ISP的畫素吞吐量提升33%,每秒達43億畫素;同時,這個ISP還能支援最多三個最高各4800萬畫素的攝像頭和以30FPS錄製零延遲快門的影片。
所謂的新增AI輔助增強功能體現在哪裡?很簡單,就是能做到在4K解析度下實現60fps實時的影片拍攝質量。
那麼,Hexagon NPU和AI ISP如何協同?作用是什麼?
高通以Hexagon Direct Link技術實現兩者的協同,Hexagon NPU能直接訪問ISP感測器的原生原始資料,利用NPU的技術能力輔助ISP做更快的影象分割(Insight AI),進一步理解影像中的各個元素,實現更快的“虛化”或“物件消除”。
對,這就是像從OPPO Find X7系列開始推出的AI照片消除功能。
這次,在驍龍8至尊版上,還實現了影片一鍵消除:只需在30FPS影片中選擇想要擦除的物件,就能實現消除。
基於Hexagon NPU的強悍效能,以及與AI ISP的高度協同,整個處理過程被置於端側,而無需上雲,故無延遲,體驗一流。
GPU的切片架構和無網通訊
歷代驍龍移動平臺的升級重點,除了CPU、NPU和ISP之外,還包括GPU和Modem。
其中,GPU是驍龍旗艦移動平臺的傳統強項模組,因之業界號稱驍龍移動平臺是買GPU送CPU。
也許是技術品類太多,高通這次還是沒有為驍龍8 至尊版的新一代Adreno GPU取一個響亮的營銷名稱。
驍龍8至尊版的全新Adreno GPU首次採用切片(slice)架構——將著色器核心和其他固定功能塊分成不同的切片:共分三組,每組頻率都是1.1GHz(上代為900MHz),三組接受指令處理器(Cammand Processor)的統一排程。
當渲染複雜場景時,可以直接在GPU上儲存12MB資料(圖形快取),減少向驍龍8至尊版記憶體傳送額外圖形資料(RAM),延遲相應也更低,故應用執行更流暢、電池壽命更長、圖形更清晰,3D環境也更逼真。
這種設計思路與英偉達的GPC/TPC/SM分層結構、AMD的CU計算單元,英特爾的渲染切片(Render Slice:Xe-GPU架構的核心元件)類似。
其中,英特爾的Render Slice,包含4個Xe-Core和1個光線追蹤單元,以及其他一些IP,如幾何管線、光柵化管線、取樣器和畫素後端等,構成英特爾Arc GPU的基礎。
透過這種設計,驍龍8至尊版允許使用更動態的資源分配、更高的時鐘速度和更好的負載平衡,還能透過關閉切片降低功耗。
據高通給出的資料,與上代Adreno GPU相比,這次推出的新GPU效能提高40%,能效提高40%,光線追蹤效能提高35%(得益於升級後的Snapdragon Elite Gaming技術)。
所謂光線追蹤(簡稱光追),通俗說,就是模擬各種光線效果。比如反射和折射、散射和色散等現象,為手遊帶來栩栩如生的光線、反射和照明效果,實現更接近真實環境光的精緻遊戲畫面。
為了提升遊戲體驗,驍龍8至尊版也像驍龍8Gen 2那樣,將虛幻引擎5(Unreal Engine 5)的一項核心能力——Nanite解決方案首次引入端側移動平臺,同時將虛幻引擎5升級到5.3。驍龍8Gen 2曾在端側引入虛幻引擎5的Metahuman框架。
Nanite解決方案,允許開發者在遊戲和實時渲染專案中,使用高多邊形模型而對效能造成顯著影響;Metahuman框架則致力於建立逼真的數字人類角色。
透過Nanite採用全新的虛擬幾何系統(Virtualized Geometry System),能使低端機器也可以運行復雜的大模型。這對於提高遊戲和實時渲染專案的可訪問性和效能至關重要。
這個系統的可貴之處在於其非常智慧,能做到只處理並渲染人眼能觀察到的細節,並採用高度壓縮的資料格式,從而大大減輕渲染壓力。
華爾街見聞注意到,本代Adreno GPU依然僅支援OpenGL ES 3.2和Vulkan 1.3,與驍龍8Gen 2完全一樣,作用是提升手機對大型手遊的圖形處理效率。
在通訊連線方面,驍龍8至尊版支援AI增強5G和Wi-Fi連線的移動平臺,整合驍龍X80 5G基帶及射頻系統,也就是第二代5G AI處理器。
驍龍80 5G基帶擁有多項行業第一:首次支援下行6載波聚合、首次支援6個Rx接收器路徑、首次支援AI/5G-A融合、首次支援AI多天線管理、首次支援CPE AI增強通訊和首次支援NB-NTN(非地面網路)衛星通訊。
值得一提的是,小米15 Pro用的就是驍龍8 Elite,還首次搭載小米星辰通訊系統,能讓手機在完全沒有網路的情況下,實現半徑3.5公里內的雙向通話。這個功能,與驍龍8 Elite的支援NB-NTN(非地面網路)衛星通訊技術——允許在沒有地面網路覆蓋的地區實現通訊連線,是不是很像?