前兩天,第三季度財報終於出了。結果是預期中的向好,營收351億美元,同比增長93.7%。淨利潤193.1億美元,同比增長109%。
簡單計算就是上個季度英偉達共賺2542億人民幣,淨利潤1398億,平均每天爆賺15億人民幣,相當於一天賺出8套北京價值2億的四合院。
GPU的出現就象徵著賺錢,三季度英偉達的毛利率高達74.6%。什麼概念?被譽為“大自然的印鈔機”、將鍾睒睒捧上中國首富寶座的農夫山泉,毛利率也不過60%
英偉達的圖形處理單元(GPU)技術之卓越,已廣為人知。相較之下,國產 GPU 的影響力則顯得較為有限。
然而,近年來,中國國內的許多GPU企業開始嶄露頭角。透過持續的投入和努力,國產GPU在效能、功能和應用領域等方面都有了提升,逐漸贏得了市場的認可和使用者的信任。國產GPU不僅在傳統圖形處理領域取得了進展,也能夠在人工智慧、高效能計算等新興領域展現出一定的競爭力。
01
景嘉微是國內自主智慧財產權圖形GPU領軍企業,是國內少數幾家生產GPU且具有自主智慧財產權的公司。
景嘉微的GPU 產品包括 JM5400、JM7200、JM9 系列和景宏系列,覆蓋傳統領域和新興領域。
JM5400是景嘉微早期推出的一款GPU產品,標誌著國產GPU的起步;JM7200/7201系列適用於桌面辦公、圖形工作站及有高要求的圖形生成及顯示等領域。景嘉微在JM7系列時期已完成了與主流國產CPU與作業系統的適配工作。
JM9系列是景嘉微的第三代GPU產品,包括JM9100和JM92系列,它們在前兩代的基礎上進一步優化了效能與功耗,最低功耗不到2W,全面支援國產CPU、國產作業系統和國產韌體,可廣泛應用於PC、膝上型電腦、工控機、圖形工作站等計算機裝置。
景宏系列是景嘉微今年成功研發的產品,主要用於AI 訓練、AI 推理和科學計算等領域。根據公告,景宏系列支援INT8、FP16、FP32、FP64等混合精度運算,支援全新的多卡互聯技術進行算力擴充套件,適配國內外主流CPU、作業系統及伺服器廠商,能夠支援當前主流的計算生態、深度學習框架和演算法模型庫,大幅縮短使用者適配驗證週期。
02
天數智芯
天數智芯通用GPU產品天垓、智鎧系列
天數智芯通用GPU產品適配主流CPU晶片/伺服器廠商,能夠支援國內外主流AI生態和各種深度學習框架。天數智芯已經發布了兩款自主研發的通用GPU產品天垓100、智鎧100,具備應用覆蓋廣、開發易遷移、效能可預期、全棧可定製、使用成本低等特點。
天垓100是天數智芯推出的全自研通用GPU訓練產品。它採用通用GPU架構,相容國際主流GPU通用計算模型,支援國內外主流AI生態和深度學習框架及原生運算元。2022年底,天數智芯曾宣佈天垓100累計銷售訂單已突破5億元。
智鎧100系列加速卡基於通用GPU架構,支援多種影片規格解碼、800+通用指令集、國內外主流深度學習開發框架。相容CUDA生態,支援市場主流生態,高達128路影片接入。平均遷移時間相較市場主流產品下降50%以上,生態應用遷移迅速。
天數智芯推出的國內首個通用計算應用開發及評測平臺DeepSpark持續迭代,截至目前已匯聚300+訓練和80+推理模型示例,支援主流AI應用框架,提供多維度測評體系。
天數智芯自主算力叢集方案能夠有效支援OPT、LLaMa、GPT-2、CPM、GLM等主流AIGC大模型的Pretrain和Finetune。同時適配支援了清華、智源、復旦等在內的國內多個研究機構的開源大模型。
03
中微電
中微電的GPU產品有:南風一號、南風二號、南風三號。“南風一號”GPU主要應用於信創計算機顯示可滿足黨政、金融及安防等信創產業鏈專用整機電腦PC顯示卡需求。“南風二號”提供高效能平行計算能力,滿足伺服器、訓練機、推理機、邊緣計算、科學模擬計算、智算中心等人工智慧市場需求。
去年12月,中微電科技“南風一號”顯示卡(NF1001)匯入了世恆TD120A2整機。標誌著產品已經通過了中國長城各項功能、效能、可靠性、相容性、穩定性等測試。“南風一號”也與麒麟作業系統(V10 SP1)、飛騰處理器(D2000、FT2000)、奇安信瀏覽器等多家國產裝置、應用實現相容性互認證。“南風一號”從“產品”正式轉型為“商品”。
今年4月,中微電宣佈“南風二號”核心IP研發完成,通過了FPGA的模擬測試。實驗結果表明,“南風二號”AI推理效能達到48TOPS,基本實現了國家工業和資訊化部揭榜掛帥專案和深圳市科技重大專項專案的引數指標。
04
芯動科技
芯動科技也推出了GPU產品:風華1號、風華二號。
風華一號釋出於2021年,是首款國產高效能4K級顯示卡GPU。包括“風華1號”A型卡(單芯桌面端)、“風華1號”B型卡(雙芯伺服器端)兩款,採用12nm製程工藝。支援國產新基建5G資料中心、桌面、元宇宙、雲遊戲、雲桌面等千億級產業。
風華二號釋出於2022年8月,是一款集超低功耗、強渲染、4K高畫質三屏顯示、4K影片解碼、智慧AI計算於一體的桌面和筆記本GPU,採用自研LPDDR5X視訊記憶體,頻寬達到10Gbps,整卡實測功耗4~15W。
工控領域,芯動科技的風華 2 號 GPU 已在各大城市軌道交通系統的自動售檢票系統中實現大規模商用。該系統中的自動檢票機、自動售票機和半自動售票機等裝置,採用風華 2 號 GPU 後,可支援 4 屏顯示和長時間低功耗高穩定執行,
消費電子領域,天天電競釋出的國潮電競專業顯示卡品牌 “赤兔”,搭載了芯動科技自研的風華 GPU 晶片。
05
沐曦整合
今年9月,沐曦整合近期完成了新一輪股權融資,參與此次投資的機構包括浦東創投集團、上海科創基金、湘江國投、啟夏資本、中衛頤和及上海源廬加佳資訊科技有限公司等多家知名投資方。
目前沐曦積體電路的GPU產品包括:曦思N系列、曦雲C系列、曦彩G系列。
曦彩G系列GPU是針對圖形渲染加速的解決方案,沐曦自主智慧財產權架構提供卓越的圖形影象渲染與影片處理能力, 可廣泛應用於元宇宙、雲桌面、雲遊戲、雲手機、數字孿生、XR等場景。
曦思N系列首款產品曦思 N100是一款面向雲端資料中心應用的人工智慧推理GPU,自2022年底產品量產以來,已在智慧交通、智慧安防、智慧轉碼等人工智慧領域獲得廣泛應用。沐曦整合與眸瑞科技聯合釋出的“貼圖超分”技術,依託曦思N系列AI推理GPU的強大算力,首次將AI超分成功應用到了3D模型領域。
曦雲C系列通用GPU(GPGPU)晶片是針對智算及通用計算的完美解決方案,沐曦自主智慧財產權架構提供強大高精度及多精度混合算力,可廣泛應用於智算以及通用計算、教育和科研等場景。曦雲C500單卡算力高達30TFlops FP32,單卡64GB HBM2E高頻寬視訊記憶體,頻寬1.8TB/s,這張卡還配備自研MetaXlink高速介面,適合於大模型訓練。4卡既可以支援65B大模型推理,8卡可以支援130B模型推理。
2023 年,沐曦攜手智譜華章、優刻得共同釋出了國產首臺 GPU 千億引數大模型訓推一體機。首批客戶是北京航天總醫院、數字寧夏建設運營有限公司。
06
登臨科技
登臨科技成立於2017年,目前Goldwasser系列產品已經實現規模量產,團隊致力於以GUGPU為核心構建高效能計算平臺。
Goldwasser 系列產品:包括邊緣計算產品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半長的伺服器計算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一種全高全長的 Goldwasser XL,輸出 512TOPS 算力。
該公司最引人注意的地方是,聲稱其自主創新的通用GPU 具有“與 CUDA/OpenCL 等程式設計模型相容的計算架構”,使其能夠很好地與 Nvidia 競爭,但同時也可能利用 Nvidia 最大的競爭優勢——CUDA 與之對抗。
據稱,在首代Goldwasser產品量產後一年內,登臨科技完成國內主流運營商、作業系統、CPU、網際網路企業、人工智慧框架、伺服器企業的相容互認證,併發布登臨瀚海生態計劃。
登臨科技創始人李建文、登臨科技聯合創始人王平本碩均就讀於清華大學,全球運營副總裁楊劍曾任華為全球供應鏈副總裁,其研發團隊擁有長期的GPU研發和商業產品化經驗。此外,登臨科技在矽谷、成都、杭州等城市共設立了七個研發中心。
07
壁仞科技
壁仞科技創立於2019年,致力於研發原創性的通用計算體系,建立高效的軟硬體平臺,同時在智慧計算領域提供一體化的解決方案。目前,壁仞科技首款國產高階通用GPU壁礪系列已量產落地。
BR100系列通用GPU晶片是國內算力最大的通用GPU晶片,包括BR104和BR100兩大產品。基於自主原創的晶片架構開發,採用7奈米工藝製程,並結合了包括Chiplet(芯粒技術)等在內的多項業內前沿晶片設計、製造與封裝技術。其中BR104對標英偉達2020年推出的A100、BR100對標英偉達4nm晶片H100。
此外,壁仞科技還推出了“壁礪”系列算力產品,這些產品進一步豐富了壁仞科技的GPU產品線,滿足了不同客戶和應用場景的需求。
壁仞科技與浪潮科技合作推出了搭載 BR100 的 OAM 伺服器 “海玄”,其峰值浮點算力達 8PFLOPS,最大功耗為 7KW,為資料中心提供了高能效、低 TCO(總擁有成本)的資料中心叢集方案,可滿足資料中心對大規模資料處理和高效能計算的需求,支援雲計算、大資料分析、人工智慧等多種應用的執行。
08
摩爾執行緒
最近,證監會官網顯示,摩爾執行緒智慧科技(北京)股份有限公司(下稱摩爾執行緒)在北京證監局辦理輔導備案登記,正式啟動A股上市程序,輔導機構為。
摩爾執行緒也是國內僅有的在B端和C端均有佈局的國產GPU企業,其晶片採用先進MUSA架構。
目前產品有MTT S系列顯示卡、MTT系列GPU晶片、智算叢集解決方案。MTT S系列顯示卡包括MTT S80、MTT S70、MTT S50、MTT S3000、MTT S4000。
MTT S80被稱為“國產遊戲第一卡”,是國內唯一可以支援DX12的消費級顯示卡。釋出至今,該卡的Windows驅動已經迭代多個版本,已實現國內TOP50熱門遊戲100%相容,已追蹤超過400款遊戲的執行情況,累計正式適配和最佳化遊戲185款。截至2024年10月,MTT S80在圖形測試軟體3DMark 11中的成績,已提升至4.5倍。
MTT系列GPU晶片包括:蘇堤、春曉、麴院。蘇堤是中國首顆全功能GPU晶片,麴院則是基於摩爾執行緒自研架構的最新一代全功能GPU晶片,能夠提供人工智慧所需的綜合算力,尤其是針對大語言模型訓練和推理的處理能力。
此外,針對大模型訓練,摩爾執行緒已經落地了全國產的誇娥(KUAE)智算中心全棧解決方案,從千卡智算叢集到萬卡叢集方案。
09
結語
從目前的情況來看,部分國產 GPU 產品在效能上已經取得了一定進步,如壁仞科技的 BR100 系列 GPU,其峰值算力超過了英偉達目前在售的旗艦計算產品 A100 GPU 的三倍,並創造了全球通用 GPU 的算力記錄,能夠滿足一些對算力要求較高的應用場景需求。
同時,一些國產 GPU 晶片採用了先進的製程工藝和封裝技術,在提升效能的同時,有效降低了功耗。例如芯動科技的風華 2 號,在低功耗模式下工作功耗僅在 4w 左右,能效比遠優於市場同等算力產品。
越來越多的國產 GPU 廠商意識到生態建設的重要性,並積極與上下游企業、科研機構等展開合作,共同構建完整的產業生態。如摩爾執行緒與眾多行業合作伙伴聯合展示了基於其智算叢集的豐富行業大模型應用方案,推動了國產 GPU 在各領域的應用和發展。
與英偉達、AMD 等國際巨頭相比,國產 GPU 在整體技術水平上仍存在一定差距,特別是在高階 GPU 市場,國外產品在效能、能效比、功能完整性等方面仍佔據優勢。但千錘百煉,方成正果。國產GPU的發展程序,也是其不斷追求技術進步的歷程。