時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

一條晶片“新”賽道,悄然崛起

2024-11-30 21:14:45

如果您希望可以時常見面,歡迎標星收藏哦~

GPU超越了CPU。這也意味著,在計算領域,專用計算打敗了通用計算。然而,儘管專用計算的優勢日益明顯,仍有一部分初創公司堅持走通用計算的道路,力圖透過創新突破當前架構的瓶頸,重新定義處理器的未來。在這個日益分化的計算時代,通用計算是否依然有機會與專用計算一較高下?一些雄心勃勃的初創公司正在投入巨資和大量的研發力量,試圖透過開發全新的通用處理器架構來挑戰現有格局。

通用處理器的黃金時代

回顧過去,通用處理器(CPU)曾在計算領域主宰了數十年。在70年代到90年代,CPU曾是幾乎所有計算任務的主力。

1971年,釋出了4004處理器,這是世界上第一款商用微處理器,標誌著計算機技術的一個新紀元。隨後,英特爾在1974年釋出的 8080 處理器,以及其後續的 x86 架構,為個人計算機(PC)提供了強大的處理能力。

1981年,IBM個人計算機(IBM PC)的釋出,將基於 x86 架構的通用處理器推向了全球市場。

進入1990年代,隨著網際網路的崛起和計算需求的多樣化,Intel 和 AMD 等公司繼續推動 x86 架構 的發展,通用處理器的市場份額不斷擴大。英特爾的 Pentium 處理器系列(1993年推出)標誌著高效能計算的到來。此外,90年代的企業級伺服器和資料中心也開始大量採用基於 x86 架構的通用處理器。這一時期,通用處理器不僅在桌面和辦公應用中佔據主導地位,也逐漸成為伺服器、資料中心以及高效能計算(HPC)領域的主力。

從 2000年代後期開始,隨著 GPU 和專用加速器(如 TPU、FPGA)的崛起,計算界的天平開始發生傾斜。

進入AI時代,計算需求呈現出爆炸式增長。深度學習等AI演算法對計算資源的需求遠遠超過了傳統應用。GPU憑藉其高度並行的架構,在訓練和推理大規模神經網路方面表現出色,成為了AI訓練的“標配”。這一時期,GPU在圖形處理、科學計算以及機器學習等領域的表現,逐漸超越了傳統的CPU。與此同時,各種專用積體電路(ASIC)也在不斷湧現,針對特定AI演算法進行最佳化,進一步提升了計算效率。

儘管GPU和ASIC在特定領域的優勢非常明顯,但它們也有不可忽視的缺點。首先,GPU 和 ASIC 是專為某些特定任務設計的,缺乏通用性和靈活性。如果面對複雜的計算任務或需要多種計算能力的應用,GPU 和 ASIC 就顯得不那麼高效。此外,GPU 和 ASIC 的開發和生產成本較高,且其硬體架構通常與現有的計算環境不相容,這使得大量企業在進行硬體更新時面臨著較高的技術門檻和經濟成本。

正是這些缺口,令一些初創公司找到了彎道超車的著力點。在AI時代的快速洗禮下,資料中心的挑戰和痛點愈發凸顯:居高不下的功耗、較低的伺服器利用率以及難以跟上需求的處理器效能。

初創公司Tachyum:

各種PU大亂燉,能成嗎?

初創公司Tachyum提出了一種大膽的願景:將超大規模資料中心轉變為真正的通用計算中心。

他們是如何做的呢?Tachyum推出了一種新型通用處理器,將CPU、GPGPU 和 TPU的功能統一到單個單片裝置中,無需昂貴且耗電的加速器,而是透過使用與軟體可組合性和伺服器資源的動態重新分配相一致的簡單同質軟體模型來最大限度地提高利用率,以此來滿足雲和 HPC/AI 工作負載的高需求。該架構速度更快、功耗降低10倍、成本僅為競爭產品的 1/3。

下圖是早期(2022年)Tachyum公司對Prodigy架構的構思,它集成了128個自定義的 64 位 CPU 核心,執行頻率最高可達 5.7 GHz,有十六個DDR5記憶體控制器,支援最高DDR5-7200,和64條PCIe 5.0 通道。CPU、記憶體控制器和I/O透過Tachyum自定義設計的10 Tbps非阻塞全網狀網際網路絡連線在一起。Prodigy提供了一種尖端的“系統晶片”設計,平衡了高效能的CPU 核心、記憶體、I/O和互聯子系統。

Prodigy裝置架構圖(來源:Tachyum Prodigy架構白皮書,2022)

Prodigy採用獨特的“半晶片(half-chip)”設計,使得這款128核的裝置可以作為兩個獨立的64核裝置工作,每個裝置配備8個DDR5記憶體控制器、32條PCIe 5.0通道、獨立的電源平面,並具備單獨啟動的能力。這帶來了多個好處。首先,從客戶的角度來看,兩個功能裝置可以部署在一個單一封裝中,節省成本、板空間和功耗,併為系統和板設計者提供靈活性。從運營的角度來看,這種架構為Tachyum提供了更高的64核晶片良率。如果“北半部分”出現問題,可以將晶片旋轉180度,“南半部分”將成為正常工作的 64 核裝置。

Prodigy裝置佈局主要功能模組(來源:Tachyum Prodigy架構白皮書,2022)

Tachyum在白皮書中指出,處理器效能停滯不前的根本原因是處理器矽片上的線路延遲增加。隨著矽片工藝的縮小,電晶體的速度加快,但線路的速度卻減慢了,我們現在正處於效能受到線路延遲限制的階段。由於線路的電阻率是線路橫截面積的函式,因此電阻率會隨著工藝縮小的平方而增加,工藝幾何尺寸每減小10 倍會導致電阻率增加100倍,這與線路延遲成正比。業界的方法是從鋁互連轉換為銅互連並使用低 K 電介質,這確實有所幫助,但線路延遲仍然是限制處理器效能一代一代提升的主要因素。

為了解決過去二十年中由於工藝縮小導致電晶體加速但導線變慢,從而導致處理器效能停滯的問題,並且最大化效能、可擴充套件性和靈活性、最小化總擁有成本(TCO),Tachyum 為其Prodigy處理器開發了新的指令集架構(ISA)。該架構結合了RISC(精簡指令集和CISC(複雜指令集)的特點,但沒有包含許多 CISC 處理器中常見的複雜和/或變長的低效指令。所有指令的寬度為 32 位或 64 位,其中一些指令還包括記憶體訪問,以最佳化效能。Prodigy ISA 包含大量的向量和矩陣指令,這些指令優化了向量和矩陣運算的效能和效率。新ISA透過將執行單元感知(execution unit awareness)引入指令集架構,從而使Prodigy微架構和 Prodigy 編譯器能夠協同工作,避免了執行單元之間消耗大量功耗的資料傳輸,並減少了晶片內延遲。

最初Prodigy系列處理器包括128核、64核和32核的型號,而在最新的產品披露中,Prodigy對其產品構想進行了全面的升級:Prodigy SKU家族包含192核、96核、48核多個型號,適用於從超算到大規模AI、超大規模資料中心和邊緣伺服器等各類應用。TDP(熱設計功耗)範圍從48核入門級的150 W,到頂端型號的950W。

Prodigy各型號的規格(來源:Tachyum)

Prodigy的競爭賣點在哪裡呢?據該公司白皮書的分析,其統一架構通用處理器直接與CPU和GPGPU競爭。

下圖顯示了Prodigy、Nvidia H200 GPU和 ntel Xeon 8380 CPU之間的正面對比,展示了 Prodigy 通用處理器如何與CPU和GPU架構直接競爭。比較結果表明,與 H200 GPU 和 Intel Xeon 8380 CPU 相比,Prodigy 在多個工作負載和資料型別下提供了更高的效能和每瓦效能。

具體而言,Prodigy比 Intel Xeon 8380擁有3倍的CPU核心數,主頻是8380的2.5倍,記憶體頻寬約為8380的20倍。Prodigy的Specrate 2017整數得分是8380的4倍,而 Prodigy 的FP64峰值效能是8380的30倍。

與Nvidia H200比較,Prodigy的16條DDR5-7200通道和頻寬放大技術提供了約 2TB/sec 的頻寬,同時保留了支援大記憶體和擴充套件性的靈活性,DIMM 可提供較大的記憶體支援。H200 使用 HBM3 提供 3 TB/sec 的頻寬,但將記憶體足跡限制為 80GB 的固定記憶體。Prodigy 和 H200 都支援從 FP64 到 FP8 的多種資料型別,並且都支援 4:2 稀疏性。但與 H200 不同,Prodigy 除了支援 4:2 稀疏性外,還支援 8:3 超稀疏性,提供了更高的效能,僅有輕微的精度折衷。此外,Prodigy 擁有更大的快取,減少了對 DRAM 頻寬的需求。Prodigy 還支援 TAI(Tachyum AI),一種新的資料型別,能提供更大的效能提升。

為了全面瞭解 Prodigy的能力,一個1.6萬億引數的Switch Transformer 需要 52 個 NVIDIA H200 80GB GPU(每個成本為 41,789 美元)和7個Supermicro GPU伺服器(每個成本為 25,000 美元),總成本為 2,348,028 美元。而該公司聲稱,一個配備 2TB DDR5 DRAM的Prodigy單個插槽系統可就以容納和執行如此大的模型,成本僅為23,000美元,這僅是英偉達方案成本的1/100。如果真如此,這將是一個顛覆性的通用處理器。

理論上都很美好,但是目前Tachyum公司最大的問題是,尚沒有實際的產品出來。Prodigy的推出時間一再延遲,今年推明年。Prodigy通用處理器最初計劃於2019年推出,並於2020年上市。然而它不斷推遲,推遲到2021年,然後是2022年,然後是2023年。最新的訊息是,據該公司稱,採用5nm工藝的Prodigy處理器將於明年流片和量產。一個小插曲是,此前該公司還起訴了EDA公司Cadence,說他們的設計未能滿足效能目標。

據報道,Tachyum已收到一份大型採購訂單,用於構建一個大型系統。據Toms Hardware報道,Tachyum還計劃於 2026 年釋出 Prodigy 2,這是一款使用 PCIe 6.0 和 CXL 的 3nm 處理器,以及高頻寬記憶體 (HBM) 3 RAM。

我們也希望明年真的能見到這款強大的通用處理器。

Ubitium:通用RISC-V微處理器

德國初創公司Ubitium,這家公司成立於2024年。創始人的履歷頗豐:董事長/聯合創始人Peter W Weber層就職於英特爾、德州儀器、Siliconix等;執行長/聯合創始人Hyun Shin Cho;首席技術官/聯合創始人Martin Vorbach在大學期間創辦了自己的第一家微處理器公司。他創辦了可重構處理器(FPGA)領域的領軍企業 PACT XPP Technologies。PACT 的技術已授權給所有美國主要半導體公司,馬丁名下擁有200多項專利。

Ubitium旨在透過引入完全與工作負載無關的通用處理器架構從根本上改變計算格局。首席技術官Martin Vorbach花了15年時間開發這一通用處理器架構。Ubitium的通用處理器架構代表了計算行業的一次重大創新,它挑戰了現有的處理器設計正規化。

通用處理器陣列(來源:Ubitium)

傳統的微處理器往往需要為不同的計算任務,如圖形處理、人工智慧計算等,設計專門的硬體核心。而Ubitium希望透過同質、與工作負載無關的微處理架構,用單一、多功能的晶片取代傳統處理器(CPU、NPU、GPU、DSP 和 FPGA)來處理所有工作負載,該架構基於開源指令集 RISC-V,旨在透過統一的設計,不僅使處理器尺寸更小、能效更高,而且大幅降低成本,使其能夠適應各種應用場景。

Ubitium的設計靈感源於當前計算機體系結構面臨的瓶頸,特別是在硬體資源的高效利用 方面。當前許多處理器架構面臨著不必要的“瑣碎管理”任務——這些任務佔用了大量硬體資源卻並未直接提高效能。此外,許多高效計算技術,如同步多執行緒,往往需要額外的硬體開銷來支援,這就導致了更高的能耗和複雜性。

過去數十年來,晶片技術的進步主要圍繞尺寸展開,電晶體變得越來越小,因此透過整合更多電晶體,微處理器的功能也變得更強大。然而,設計並沒有發生根本性改變。Ubitium透過重新設計處理器的內部結構,消除了這些不必要的開銷,從而提高了效能。除了架構創新外,Ubitium還計劃推出多個晶片型號,涵蓋從小型裝置到大型計算系統的不同需求。這些晶片的陣列大小可以不同,但它們都基於相同的架構和軟體平臺。

目前,該公司擁有 18 項基於 FPGA 模擬的原型技術專利,並正在開發一系列晶片,這些晶片的陣列大小各不相同,但共享相同的底層通用架構和軟體堆疊。Ubitium所開發的通用晶片目標市場是邊緣或嵌入式裝置,幫助企業將部署成本降低100倍。不過,該公司強調,該架構具有高度可擴充套件性,未來也可用於資料中心。

雖然Ubitium的產品聽起來像是FPGA,比如都強調硬體靈活性和可重用性,但它並不是傳統意義上的FPGA。相比FPGA,Ubitium的處理器並沒有依賴於“硬體模擬”或“動態硬體配置”的方法,而是透過統一的架構和核心資源來實現不同功能。

2024年11月21日,Ubitium獲得了370萬美元種子資金。這筆投資將用於開發首批原型併為客戶準備初始開發套件,首批晶片計劃於2026年推出。不過,在短短兩年內推出一個旨在“徹底改變”行業的架構至少可以說是具有挑戰性的。目前的370萬美元幾乎可以肯定不足以讓 Ubitium的“突破性”晶片起步。通常,晶片進入流片階段需要花費數億美元。

前路挑戰不可忽視

無論是 Tachyum 還是 Ubitium,它們選擇開發通用處理器的原因,都來自於計算需求的複雜性和多樣化。傳統的計算架構,如 CPU、GPU 和 FPGA,雖然各自在特定領域中表現突出,但它們的組合和協同工作往往帶來額外的成本和複雜性。尤其是在 AI、大資料和高效能計算(HPC)日益普及的背景下,資料中心和雲計算需要一種更高效、更靈活、更具成本優勢的解決方案。

但初創公司來做通用處理器還是會面臨很大的挑戰:

技術實現:要在同一個晶片上處理多種計算任務(如圖形處理、AI 推理、高效能計算等),需要精心設計架構,確保每種任務的計算能力都得到充分發揮而不互相干擾。Tachyum提出的架構仍處於早期階段,並且已經經歷了多次延期。產品是否能按計劃交付,以及它是否能在競爭激烈的市場中脫穎而出,仍然是一個巨大的不確定性。

市場接受度:儘管他們的晶片可能在效能上具有優勢,但市場對新架構的接受度仍然是個問題。尤其是在傳統的 CPU 和 GPU 仍佔據主流地位的情況下,新型的通用處理器是否能夠與 NVIDIA、Intel 等成熟廠商的產品競爭並獲得廣泛採用,仍有待觀察。

成本與規模化:即便後進者都宣稱其晶片在成本和功耗優勢顯著,但要實現大規模生產並降低成本,需要鉅額的研發和生產投資。處理器的製造和流片成本通常非常昂貴,因此資金的穩定和籌措將是其成功的關鍵因素。

Tachyum和Ubitium都在試圖解決計算領域的一個重要問題:如何整合多種處理功能,提供更靈活、更高效的解決方案。儘管兩者的技術願景非常吸引人,但在實現過程中面臨的技術挑戰、市場接受度以及資金問題都不容忽視。要想在競爭激烈的半導體市場中脫穎而出,除了技術突破,還需要強有力的資金支援和客戶認可。

小結

強如英特爾和AMD,在AI的浪潮中,都有點招架不住,初創公司能否掀起浪花?在這個風雲變幻的時代,通用處理器能否重奪王座呢?結果尚未知。

但可以明見的是,這條晶片“新”賽道,已經悄然崛起。

半導體精品公眾號推薦

專注半導體領域更多原創內容

關注全球半導體產業動向與趨勢

*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第3962期內容,歡迎關注。

『半導體第一垂直媒體』

實時 專業 原創 深度

公眾號ID:icbank

喜歡我們的內容就點“在看”分享給小夥伴哦

熱門資訊
  • AMD RDNA 4 顯示卡即將登場,RX 8000 系列有望明年 1 月釋出 | 2024-11-27 14:58:27
  • 疑似榮耀平板V9入網 主打輕薄和AI 配天璣8350晶片 | 2024-11-27 15:08:09
  • 【IT之家評測室】陸地大疆?螢石 TAMO 看護攝像機體驗 | 2024-11-27 15:15:52
  • 蘋果公佈2024年度最佳App入圍名單:45款入圍App及遊戲 | 2024-11-27 15:44:29
  • Valve 新一代 VR 控制器“Roy”模型曝光,採用無環設計 | 2024-11-27 15:44:33
  • 介面比微軟漂亮!訊息稱華為明年上半年釋出鴻蒙PC:打生態鏈閉環 | 2024-11-27 15:50:06
  • 華為旗艦鴻蒙平板將於12月12日開售 PC級專業生產力 | 2024-11-27 15:57:01
  • 5499 元,小米米家空調巨省電 Pro 立式 3 匹(超一級能效)釋出 | 2024-11-27 15:57:03
  • LG UltraGear OLED 45GX950A 顯示器曝光:5120 x 2160 解析度 | 2024-11-27 15:57:05
  • REDMI預熱Buds6 Pro電競版耳機 首發無線麥功能 | 2024-11-27 16:11:09
  • REDMI Watch5 eSIM版即將釋出 支援網路和藍芽雙模式對講 | 2024-11-27 16:11:11
  • OneGx 2 掌上游戲本結構確認:虛擬鍵盤 + 可拆卸實體鍵盤組合 | 2024-11-27 16:13:21
  • 一圖看懂華為M.2固態硬碟:疾速7400MB/s 壽命顯著領先同行 | 2024-11-27 16:20:36
  • 華為Mate 70系列業界首發衛星尋呼功能 持續領跑終端衛星通訊領域 | 2024-11-27 16:29:27
  • 風向突變,這些大品牌表示“不再抵制”馬斯克的X平臺 | 2024-11-27 16:40:51
  • 英偉達被曝將在華推出閹割版5090顯示卡 | 2024-11-27 16:41:27
  • 膝上型電腦極速大屏化:16英寸+已成第一大尺寸 | 2024-11-27 16:49:23
  • SpaceX 獲准繼續發射星艦,環保組織訴訟被駁回 | 2024-11-27 16:57:42
  • DJI Mic Mini:輕盈登場,解鎖音訊創作無限想象 | 2024-11-27 16:58:25
  • 國風水墨設計!七彩虹全新iGame影系列記憶體圖賞 | 2024-11-27 17:21:26
  • SK海力士正在NAND快閃記憶體領域獲得技術優勢 覬覦三星的主導地位 | 2024-11-27 17:21:27
  • Intel二代銳炫B580核心、視訊記憶體位寬“縮水”!效能卻更好 | 2024-11-27 17:21:29
  • 螢石DL60FVX Pro AI三攝全自動人臉影片鎖體驗 | 2024-11-27 17:22:27
  • 日本新一代固體火箭發動機再次試車,再次爆炸 | 2024-11-27 17:24:46
  • 神舟十九號:兩個首次挑戰,此前空間站被撞擊,乘組將出艙加防護 | 2024-11-27 17:31:42
  • 映泰兩款英特爾 Z890 主機板上架,分別定價 1499、1699 元 | 2024-11-27 17:50:55
  • 科學計量學鼻祖普賴斯,他預測錯了… | 2024-11-27 17:54:13
  • 加快推進《科學技術進步法》落地生根 | 2024-11-27 17:58:51
  • 從航拍飛行器到“五角大樓甄選”,大疆是怎麼被玩壞的? | 2024-11-27 18:46:08
  • 高通驍龍X筆記本銷量72萬臺:全球份額僅0.8% | 2024-11-27 18:59:41
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們