如果您希望可以時常見面,歡迎標星收藏哦~
70 多年來,半導體一直是技術發展的驅動力,引發了全球許多行業的根本性變革。從個人電腦和智慧手機到資料中心和,半導體創新塑造了整個經濟領域重要應用的發展。展望未來,電氣化、數字化以及人工智慧 (AI) 和物聯網 (IoT) 技術的加速部署等大趨勢將推動半導體行業的發展軌跡。
半導體行業長期以來一直作為全球供應鏈運作,受益於基於規模、技術和全球分銷的高效製造。然而,在過去五年中,COVID-19 疫情和不斷升級的貿易緊張局勢凸顯了透過加大對本地生產的投資來確保供應鏈主權的必要性。
在疫情期間,隨著公司為員工配備遠端工作裝置以及個人投資家用電子產品,半導體需求飆升至創紀錄水平。與此同時,隨著行業實現運營現代化,技術的日益普及產生了進一步的需求。由於一些行業低估了需求規模,供應商難以確保產能。這導致從 2020 年下半年到 2022 年底全球晶片短缺。同時,供應過剩和需求減少導致庫存過剩,使該行業在 2023 年陷入低迷。市場目前正在穩定,半導體收入預計將反彈,超過 2022 年的先前峰值。
其中,人工智慧、物聯網和汽車是半導體行業的主要增長動力。
在構成半導體市場的七種元件型別中(記憶體、邏輯、微元件、模擬、光電、感測器和分立),記憶體和邏輯產品將繼續佔半導體收入的最大份額。它們的主導地位可以透過它們對從計算和移動裝置到工業和汽車產品的廣泛應用做出的重要貢獻來解釋。隨著世界越來越由資料驅動,對更快、更高效的記憶體解決方案的需求將會增加,並且將隨著各行各業越來越多地採用人工智慧、物聯網和雲計算而得到進一步推動。此外,全球資料中心的不斷擴張也凸顯了記憶體和邏輯在處理大量實時資料方面的重要性(見圖 2)。
在應用方面,預計計算市場將從 2024 年起超過通訊市場成為最大的細分市場(見上一頁圖 2),到 2030 年的複合年增長率 (CAGR) 預計為 9%。尤其是人工智慧的採用,是這一增長的主要因素,因為各行各業越來越需要先進的半導體解決方案來管理密集型計算任務。機器學習、神經網路和資料分析等技術將在塑造半導體行業的未來方面發揮變革性作用,這些趨勢的全面影響尚未顯現。
此外,向定製積體電路 (IC) 的轉變代表了一個重要趨勢,因為公司越來越青睞量身定製的解決方案,而不是標準的現成元件。這種轉變的原因是從資料中心到消費電子產品等各種應用都需要專門的效能、能源效率和增強的安全性。一個顯著的例子是蘋果開發其專有的 M 晶片,與通用處理器相比,它提供了卓越的整合度和效能。
預計汽車行業仍將是增長最快的半導體市場,預計 2024 年至 2030 年的複合年增長率為 10%。儘管美國和歐洲市場的增長預測有一些短期調整,但這一預計增長的一個關鍵因素是汽車的持續電氣化。根據普華永道 Autofacts 的資料,2024 年第二季度全球輕型汽車類別中的純電動汽車 (BEV) 滲透率估計為 13.3%,預計到 2030 年將上升至 42.5%。BEV 依靠電力電子和電源管理 IC 來驅動電機和管理電池系統。與內燃機汽車 (ICE) 相比,由於採用高壓系統,BEV 的半導體含量是內燃機汽車的兩倍多。
向軟體定義汽車 (SDV) 的轉變也在重塑汽車行業。SDV 依賴於可以不斷更新的高階軟體功能,從而實現更大的定製化和靈活性以及更快的創新週期。硬體與軟體的這種分離帶來了更快的進步。此外,自動駕駛和增強舒適性等趨勢正在推動對高效能半導體的需求。由於這些不斷變化的需求,半導體和元件製造商需要預測未來的車輛架構並保持領先於產品需求。每輛車的半導體內容價值不斷增長,從 2019 年的 420 美元幾乎翻了一番,到 2023 年達到 800 美元,預計到 2030 年將達到 1,350 美元,從而在十年內增長了三倍。
記憶體進入新領域
記憶體在半導體市場中發揮著關鍵作用,是無數應用中資料儲存和處理的基本元件。隨著對更高密度、容量、速度和頻寬的需求不斷增長,記憶體正處於長期創新的軌道上。這種創新受到資料密集型應用(如人工智慧、物聯網、雲計算和高階資料分析)激增的影響,這些應用需要大量記憶體資源才能高效執行。在過去的二十年裡,記憶體 IC 已成為主要半導體裝置中增長最快的部分,複合年增長率為 8.6%。隨著數字經濟的擴張,預計到 2024 年,記憶體在半導體總收入中所佔的份額將從 2008 年的 18% 增加到 25%。對高效資料儲存和處理日益增長的需求凸顯了記憶體在未來半導體行業增長中的重要作用。
一、DRAM 的演變:推動 AI 和資料驅動的增長
動態隨機存取儲存器 (DRAM) 是一種用於計算機和其他電子裝置的儲存器,用於儲存正在使用或處理的資料。它長期以來一直是半導體行業的基石,預計 2024 年將佔總收入的 14%。多年來,DRAM 經歷了重大發展,推動因素包括技術進步和資料密集型應用日益增長的需求。DRAM 最初用於個人計算和資料中心,其作用已擴充套件到服務於 AI、機器學習和雲計算等新興領域,這些領域對更高頻寬、更快速度和更大容量的需求持續增長。
預計到 2028 年,高頻寬儲存器 (HBM) 的市場價值將與資料中心 DRAM 相媲美。預計到 2028 年,它將佔全球半導體市場的 4.1%,2023 年至 2028 年的複合年增長率為 57.5%。相比之下,資料中心 DRAM 的市場份額預計將略高,為 4.2%,但複合年增長率較為溫和,為 22.3%。與此同時,智慧手機 DRAM 是一個更成熟的細分市場,將佔據 2.6% 的市場份額,同期的複合年增長率為 15.3%。這凸顯了人工智慧驅動的記憶體應用的爆炸式增長(見圖 3)。
二、HBM:加速記憶體創新的下一個時代
隨著人工智慧和高效能計算的不斷發展,傳統的 DRAM 解決方案正被推向極限。HBM 已成為一項重要的創新,有助於滿足這些需求。HBM 針對平行計算和人工智慧工作負載進行了最佳化,具有超過 1,000 個輸入/輸出通道的超寬介面,可實現比傳統 DRAM 更高的資料傳輸速率。NVIDIA 和 AMD 的圖形處理單元 (GPU) 對人工智慧訓練和推理任務至關重要,它們嚴重依賴 HBM 以更高效的方式管理大型資料集和複雜計算。
隨著新平臺的推出和效能增強,HBM 的 DRAM 內容每年增長 50-100%。2022 年推出的 HBM3 代用於 NVIDIA 的 H100,具有 80GB 的 DRAM。到 2024 年,B100 將搭載 HBM3E,將 DRAM 容量提升至 192GB。3 NVIDIA 最近宣佈的基於 HBM4 的 Rubin 平臺將進一步突破這些限制,提供高達 764GB 的 DRAM。
這是一個顯著的增長,標誌著記憶體容量在四到五年內增長了六到十倍。在 HBM3E 問世之前,記憶體公司負責製造 HBM 的所有部件,包括基片。然而,隨著 HBM4 的推出,邏輯和記憶體晶片開始融合,代工廠將開始生產基片(base die)。鑑於需要根據每個客戶的要求整合定製功能,代工廠和記憶體公司之間的合作將變得至關重要。例如,臺積電與多家記憶體晶片製造商合作了兩年多,開發用於 AI 應用的 HBM。
更廣泛的 DRAM 市場受成本和規模驅動,產品具有標準化介面。相比之下,由於技術和效能需求的快速發展,HBM 在閉環生態系統中執行,導致進入門檻很高。由於 HBM 規範發展如此迅速,其設計仍然更加封閉,使供應商和客戶能夠迅速適應新的發展。因此,產品質量和矽通孔 (TSV) 產量成為確保效能和可靠性的重要因素。
HBM 市場將在 2028 年之前迅速擴張,位增長複合年增長率為 64%,收入增長複合年增長率為 58%。到 2028 年,HBM 將成為一個價值 380 億美元的細分市場,約佔伺服器 DRAM 市場的一半,佔 1,360 億美元 DRAM 總市場的 27.6%(見下頁圖 4)。
三、盈利能力上升引發新一輪 DRAM 投資浪潮
隨著 DRAM 供應收緊,價格和利潤率不斷上升,促使記憶體 IC 供應商增加資本支出 (CAPEX)。DRAM 行業的營業利潤率 (OPM) 在 2024 年初超過 20%,而預測表明,到今年年底,該數字可能會攀升至 30-40%。到 2025 年,盈利能力的激增可能會推動 CAPEX 遠遠超過 2022 年的 330 億美元,可能達到創紀錄的水平。然而,這些投資大部分將集中在 HBM 的後端製造上,因此 2025 年的 DRAM 生產能力將與 2022 年的水平接近。
政府激勵措施也在塑造格局。自 2022 年以來,美國、日本和韓國都推出了補貼和稅收優惠,預計其影響將從 2025 年開始顯現。三星的平澤 P4 晶圓廠將於 2025-265 年開始量產,SK 海力士的龍仁晶圓廠將於 2027 年開始量產,美光在博伊西、廣島和紐約的新工廠將於 2026 年至 2029 年開始量產。
四、轉向 3D DRAM:突破 2D 技術的極限
自 2017 年推出 10 nm 級節點以來,DRAM 成本改善的速度已顯著放緩。在此之前,成本每年下降 20% 至 30%。然而,在 2017 年至 2023 年期間,下降速度降至每年僅 6%,隨著製造商進一步推進更低的生產節點,預計這一速度將進一步放緩。在這些細線寬度下,2D DRAM 技術的收益遞減表明,10nm 以下的成本進一步降低將微乎其微。
預計 3D DRAM 將接替 2D DRAM 的腳步,使該行業保持長期的成本降低軌跡。從第二代 10nm 以下技術開始,3D DRAM 預計將提供顯著的成本效率。目前,8 層和 16 層 3D DRAM 產品正在開發中,預計高堆疊 3D DRAM 的量產將於 2030 年左右開始。
五、NAND 快閃記憶體復甦:從市場底部到人工智慧驅動的超級週期
NAND 快閃記憶體是一種非易失性儲存技術,由於其能夠在沒有電源的情況下保留資料,因此在固態硬碟 (SSD) 等裝置中發揮著關鍵作用。憑藉其高密度、可擴充套件性和每位元低成本,NAND 已成為消費電子和資料中心等行業和領域的現代儲存解決方案的基礎。
在過去十年中,NAND 快閃記憶體經歷了大幅增長,從 2013 年的 371 億 1GB 當量增長到 2023 年的 7449 億。這一激增主要源於對智慧手機、PC 和伺服器的需求,這些裝置依賴基於 NAND 的儲存來實現快速高效的資料處理。重要的進步,例如從 3G 到 5G LTE 的過渡以及更快的 PC 處理器,推動了進一步的增長。隨著人工智慧的普及,對高容量 SSD 的需求正在加速增長,特別是在管理訓練和推理等需要大量儲存容量的大型工作負載時。到 2028 年,NAND 市場收入預計將達到 1150 億美元,這得益於位元增長和對可擴充套件、高效能儲存日益增長的需求。
2023 年第三季度,NAND 市場跌至最低點,隨後開始復甦。為了應對供應過剩和價格下跌,供應商削減了晶圓產量,導致位減少——故意減少生產的 NAND 快閃記憶體位數量。這一策略有助於在 2023 年底前穩定平均銷售價格 (ASP),因為供應減少使需求和定價重新平衡。2024 年,由於資本支出減少 13%,NAND 快閃記憶體位供應仍然受到限制,限制了生產擴張。
隨著市場有望在 2025 年復甦,供應商已重啟閒置的晶圓廠產能,以滿足人工智慧裝置刺激的預期需求。事實上,2025 年的預期復甦可能意味著 NAND 潛在超級週期的開始,從那時起預計將出現持續、強勁的增長。
支援 AI 的智慧手機將繼續刺激 NAND 需求,因為它們需要越來越先進的儲存解決方案。預計智慧手機仍將是 NAND 市場最大的細分市場,到 2028 年將佔全球半導體市場的 5.4%,複合年增長率為 30%(見下頁圖 5)。資料中心細分市場預計將快速增長,到 2028 年將佔全球半導體市場的 3.5%,由於大規模 AI 工作負載和不斷擴充套件的儲存基礎設施,複合年增長率將高達 33.4%。預計個人電腦將佔據 2.1% 的市場份額,因為 AI 應用需要更先進的儲存功能。儘管汽車記憶體目前僅佔 NAND 市場的一小部分,但預計它將經歷強勁增長,到 2028 年複合年增長率將達到 23%,因為汽車越來越依賴先進的記憶體解決方案(見下頁圖 5)。
六、擴充套件 NAND 儲存:轉向 QLC 和 1,000 層技術
NAND 儲存單元在晶片內分層堆疊,層數越多,儲存容量越大。到 2024 年,大多數 NAND 供應商的層數將超過 200 層,但隨著層數的增加,技術挑戰也隨之而來。新技術將不斷推出,以促進進一步發展,1,000 層 NAND 的開發正在進行中,這可能會影響未來十年的行業格局。
為了滿足對高容量儲存日益增長的需求(尤其是受 AI 工作負載的推動),
NAND 供應商正在從三級單元 (TLC) 技術(每個儲存單元儲存三位)轉向四級單元 (QLC) 技術(每個單元儲存四位),以更低的成本提供更高的儲存密度。到 2029 年,QLC 預計將佔據 NAND 市場的 50% 以上。SK Hynix/Solidigm 在資料中心基於 QLC 的企業級 SSD 領域處於領先地位,而 Micron 等主要供應商則採用電荷捕獲快閃記憶體 (CTF) 技術,該技術可減少儲存單元之間的干擾並提高客戶端 SSD 的可擴充套件性。與 TLC 相比,QLC 在效能和耐用性方面面臨權衡。然而,這些挑戰正透過諸如過度配置或針對特定工作負載量身定製的混合解決方案等技術來應對。
汽車半導體進入高速發展階段
由於電動汽車的普及和 SDV 的興起,汽車半導體市場正在經歷重大轉型。2023 年,全球汽車產量自 COVID-19 危機爆發以來首次超過疫情前的水平,這表明汽車市場已經復甦並恢復正常。未來五年,我們預計市場將繼續以 8.9% 的複合年增長率增長,到 2028 年底收入將達到 1170 億美元(見圖 6)。
一、電氣化推動:功率半導體推動電動汽車革命
汽車電氣化的轉變為功率半導體創造了巨大的市場機會。這些元件在各種車輛應用中都是必不可少的,並且在主逆變器、DC-DC 轉換器、車載充電器 (OBC) 和電池管理系統 (BMS) 等電動汽車系統中發揮著特別重要的作用。根據技術研究和諮詢集團 Omdia 的資料,電動汽車每輛車的功率半導體價值是內燃機汽車的六倍。因此,汽車市場的銷售額在 2023 年達到 210 億美元,同比增長 30.2%,預計兩位數的增長將繼續。
電動汽車的廣泛採用和電池技術的進步正在刺激這一領域的創新。寬頻隙 (WBG) 半導體(例如碳化矽 (SiC)、氮化鎵 (GaN) 和氧化鎵 (Ga2O3) 等新興材料)正在改變汽車行業。與傳統矽 (Si) 相比,WBG 器件具有更高的能效、更大的功率密度和在更高溫度下工作的能力,使其成為逆變器、充電器和 DC-DC 轉換器等關鍵系統的理想選擇。例如,SiC 和 GaN 可實現更快的開關速度和更好的熱管理,從而產生更小、更輕的元件,這對於提高車輛續航里程和效能至關重要。
領先的功率半導體供應商,包括英飛凌、意法半導體、安森美、羅姆和 Nexperia,越來越關注 WBG 技術。因此,它們在電力電子領域的份額正在大幅增長。儘管 WBG 在 2023 年佔據了汽車電源市場的 12%,但 Omdia 預測到 2028 年其年收入將增長到 168 億美元,
這意味著份額將增加到 29%(見圖表 7)。
二、矽和寬頻隙:競爭還是共存?
雖然矽在低功率、成本敏感的應用中仍占主導地位,例如緊湊型城市電動汽車和混合動力汽車,但 SiC 等寬頻隙材料正成為高效能電動汽車的必需品。SiC 特別適合長距離和高效能車型的主逆變器,這些車型的功率密度和能效至關重要。然而,SiC 的高成本仍然是一個挑戰,這是由於其能源密集型和複雜的晶體生長過程所致。此外,SiC 的硬度和脆性增加了加工難度,導致成品率較低。
另一方面,隨著主要參與者大量投資新生產能力,預計未來幾年 SiC 價格將下降。僅在中國,就有 50 多家供應商進入 SiC 市場,挑戰老牌企業,這將進一步加強這一趨勢。競爭加劇,加上 SiC 製造所需的高資本投入,可能會促進這種整合,隨著行業的發展重塑競爭格局。
雖然新產能的湧入引發了對潛在供應過剩和價格大幅下跌的擔憂,但向 200 毫米 SiC 晶圓的過渡仍然帶來了相當大的挑戰。工藝的複雜性和裝置有限的可用性導致交貨時間長和產能提升延遲。這些延遲降低了供應過剩的直接風險,儘管未來的市場動態將在很大程度上取決於電動汽車需求的增長,特別是未來幾年歐洲和美國的需求增長。
相比之下,與更大的矽晶圓相容的 GaN 透過利用現有的製造基礎設施提供了巨大的成本降低潛力。這使得 GaN 對高速充電器和電源轉換器特別有吸引力。它能夠減小元件尺寸和重量,也使其成為車載充電系統的理想選擇。隨著技術的進步,GaN 有望在更高電壓應用中挑戰 SiC,目前正在進行的研究旨在擴大其電壓能力並提高其可靠性。最近的突破,例如英飛凌開發出世界上第一個 300 毫米 GaN 晶圓技術,標誌著降低生產成本邁出了重要一步,使 GaN 成為本世紀剩餘時間的有力競爭者。GaN 市場也有望進行整合,這從重大的併購活動中可以看出,包括英飛凌於 2023 年收購 GaN Systems 和瑞薩電子計劃於 2024 年下半年收購 Transphorm。
隨著汽車行業的不斷發展,我們可以期待電力電子技術共存,這取決於不同車型的特定應用需求。總之,半導體技術的選擇將在很大程度上取決於效能、功率和成本方面的具體要求。隨著這些技術的發展,它們將在一系列應用領域相互補充,突破電動汽車設計和效率的極限。
三、功率半導體市場格局的變化
功率半導體價值鏈包含幾個關鍵階段,每個階段都對最終產品的效能和成本結構產生影響。價值鏈始於基板製造和晶體生長,其中 Si 或 SiC 等原材料被加工成高質量晶圓,為半導體器件奠定基礎。接下來,在晶圓加工過程中,半導體結構在這些晶圓上製造,賦予其必要的電氣特性。然後將晶圓切割成單個晶片,這些晶片可用作分立元件或組裝成電源模組。最後階段涉及封裝,其中裝置被封裝在保護結構中,以確保最佳的熱管理、耐用性和效能。封裝對於電源模組尤其重要,因為它結合了多個晶片來處理更高的功率。
在電動汽車電力電子中,製造商為主逆變器採用分立和電源模組解決方案,每種解決方案都針對特定的功率和效率要求而設計。對於基於 SiC 的功率模組和分立解決方案,基板建立和晶體生長階段尤為關鍵,佔功率封裝總附加值的 35%-45%(見下頁圖 8)。這反映了生產高質量 SiC 基板的複雜性,這對於實現 SiC 在高壓汽車應用中提供的卓越效率和效能至關重要。隨著 SiC 技術的進步和生產規模的擴大,這些早期階段的價值預計會下降。增強的製造工藝和規模經濟可能會降低成本,使基於 SiC 的解決方案更具競爭力,並鼓勵在電動汽車中更廣泛地採用。
在功率模組解決方案中,封裝階段(涉及模組設計和組裝)佔總附加值的 35-40%(見下頁圖 8)。此步驟對於確保模組能夠承受高熱應力和機械應力至關重要,從而提高可靠性和效能。半導體制造商意識到封裝的重要性日益增加,因此正在擴充套件其開發自己的功率封裝的能力。透過這種方式,他們可以將對價值鏈的控制擴充套件到晶片設計和製造之外。這種垂直整合使他們能夠提高產品的差異化,最佳化效能並提高競爭力。隨著價值鏈上的參與者實施這些戰略,競爭格局將繼續演變。
四、從硬體到軟體:軟體定義汽車 (SDV) 和半導體需求
SDV 趨勢反映了透過可不斷更新和改進的軟體越來越廣泛地實現汽車功能。由於硬體和軟體在很大程度上是分離的,這種發展使更多的定製化、為消費者提供更大的靈活性和更快的創新週期成為可能。現代電氣/電子 (E/E) 架構,主要由半導體定義,為實現 SDV 奠定了基礎。隨著行業轉向區域和中央計算架構,對高效能處理器的需求將會增加。這種轉變反過來會減少對目前管理分散式 ECU 系統的傳統計算和電源管理裝置的需求,從而簡化車輛電子裝置。
SDV 的核心是先進的處理器,通常稱為片上系統 (SoC)。這些 SoC 將各種功能(例如中央處理單元 (CPU)、記憶體和外圍裝置)整合到單個晶片架構中。這種整合對於管理 SDV 所需的複雜軟體任務至關重要,包括實時資料處理、ADAS 控制、安全模組和資訊娛樂系統。此外,對 GPU 和神經處理單元 (NPU) 的需求不斷增長,反映了它們在為自動駕駛和其他高階功能的核心機器學習演算法提供動力方面的作用。汽車 SoC 市場預計將在 2028 年達到 160 億美元,預計複合年增長率為 17%(見下一頁圖表 9)。
雖然 SoC 對於中央處理至關重要,但微控制器 (MCU) 對於處理特定控制任務和外圍介面仍然至關重要。MCU 專門用於實時操作,並且通常部署在精確計時、功率效率和可靠性至關重要的系統中,例如發動機控制、嵌入式感測器和電池管理系統。現代 MCU 支援高階連線選項,包括乙太網、Wi-Fi、藍芽和車對萬物 (V2X) 通訊,這些通訊依賴於車輛與外部網路之間的實時資料交換。
記憶體解決方案對於儲存和訪問 SDV 生成的大量資料至關重要。這些元件支援複雜車輛軟體系統的高速資料訪問和儲存要求。高容量、高速記憶體使車輛能夠儲存大量感測器資料和軟體應用程式,從而實現實時處理和決策。2023 年,記憶體晶片佔整個汽車半導體市場的 8%,到 2028 年,這一份額將增至 11%,預計相關收入將達到 130 億美元(見圖表 9)。
適應脫鉤:恢復力策略
隨著全球政治格局的變化,半導體行業已成為地緣政治緊張局勢的焦點。出口管制限制和本地內容要求正在挑戰傳統的全球供應鏈。對於科技公司來說,建立抵禦這些中斷的恢復力變得越來越重要。確保穩定的供應鏈,降低風險,並在這種動盪的環境中保持競爭力,現在是成功的關鍵因素。
一、中美的地緣政治
近年來,中美兩國的地緣政治之爭愈演愈烈。這種趨勢對半導體行業有著深遠的影響,該行業在供應鏈的各個階段都嚴重依賴兩國。因此,我們看到以美國為中心和以中國為中心的技術領域的出現,這些領域專注於數字和連線技術。在全球南方,中國科技公司正在實施許多大型數字基礎設施專案。
美國相關立法措施包括《出口管制改革法案》(2018年)、《外國公司問責法案》(2021年)、《安全裝置法案》(2021年)和《美國晶片法案》(2022年)。目前,正在討論《國防授權法案》(NDAA)第5949條的擬議規則制定。這將禁止美國政府實體採購含有某些中國半導體的電子產品和裝置。如果獲得透過,這些禁令將於2027年12月23日生效。過去,最初對政府部門實施的限制往往會在幾年內擴充套件到更廣泛的民用市場,這表明這些半導體限制最終可能會影響更廣泛的行業。
與此同時,中國大陸本身也在制定類似的法規,特別是《中國製造 2025》(自 2015 年起)、資訊科技應用創新 (ITAI) 計劃(自 2016 年起)、《出口管制法》(2020 年)、《資料安全法》(2021 年)、《反外國制裁法》(2021 年)或《外國主權豁免法》(2023 年)。中國政府已敦促中國汽車製造商在來年將本土晶片含量提高到 25%。此外,中國正在迅速增強其半導體能力,以減少對外部世界的依賴。
考慮到某些地區在全球半導體制造中發揮的關鍵作用,加劇的地緣政治緊張局勢對主要供應鏈路線和夥伴關係構成了重大風險。如果緊張局勢升級,經濟和貿易壓力可能會加劇,可能會損害業務運營和供應鏈的穩定性。影響的程度當然取決於這些發展的強度和速度,但無論如何,這將對半導體行業維持穩定生產和分銷的能力產生廣泛影響。
二、增強地緣政治韌性的策略
與半導體相關的地緣政治韌性正在成為服務於全球市場的科技公司取得成功的關鍵因素。透過認識地緣政治風險並採取有效的策略,公司可以增強其韌性,同時仍保持創新和競爭力。隨著全球格局的不斷發展,保持領先於這些挑戰將是長期成功的關鍵。
專用矽片的復興
由於對效能、效率和安全性的需求不斷增長,專用應用專用 IC 市場將在未來十年內復甦。這種需求激增擴大了包括設計服務、代工廠和電子設計自動化 (EDA) 工具在內的價值鏈。GUC、Alchip 和 ADTechnology 等公司提供專業設計服務,而開放計算專案的 chiplet 市場等計劃正在使預先設計的處理器元件的訪問變得民主化。小批次代工服務(例如來自弗勞恩霍夫積體電路研究所 (IIS) 的服務)現在允許以數萬而不是數百萬的規模生產定製 IC,使沒有超大規模能力的企業能夠使用這項技術。隨著智慧財產權的可用性增加、軟體工具的開發以及設計成本的降低,定製 IC 市場將在各個行業中繼續增長(見圖 10)。
然而,可擴充套件性仍然是一個關鍵挑戰,尤其是對於設計成本很高的先進半導體而言。根據電子行業諮詢公司 IBS 的研究,設計一個 10nm 晶片的成本超過 1.7 億美元,設計一個 5nm 晶片的成本超過 5 億美元。資料中心行業不斷發展的格局為定製 IC 開發提供了肥沃的土壤,四大資料中心計算使用者——亞馬遜、Meta、微軟和谷歌——佔資料中心 IT 資本支出的 30-40%。這些公司運營的應用程式具有規模和效能需求,這使得定製 IC 開發成為戰略重點。
一、用於影片處理的定製 IC
由於影片流需求規模巨大,影片處理成為定製 IC 開發的首要目標。谷歌估計,全球 60% 的網際網路流量可歸因於影片流。在過去五年中,該公司開發了定製影片編碼 IC,即影片編碼單元 (VCU)。這些 IC 使谷歌能夠顯著減少 YouTube 所需的伺服器數量。谷歌報告稱,使用 VP9 影片編碼格式,配備 20 個 VCU 的伺服器取代了多個基於 Skylake 的伺服器機架。儘管最初在定製 IC 設計和生產方面進行了投資,但谷歌估計,VCU 專案在三年內將 YouTube 的成本降低了 20 到 33 倍。
Meta 和騰訊也開發了自己的影片處理器,報告稱效能顯著提高。其他影片流公司(如 NETINT)部署 ASIC 以最大限度地提高每臺伺服器、瓦特和美元的效能(見下頁圖 11)。
二、用於網路和安全應用的定製 IC
網路和安全應用是計算密集型且可處理大規模工作負載,是定製 IC 開發的另一個主要領域。在與 Omdia 的對話中,亞馬遜表示,其大約 20% 的基礎設施專用於網路和安全處理。這種狀況促使開發了整合乙太網控制器的定製 IC,該控制器位於 DPU 上,俗稱 Nitro 卡。內部 DPU 處理虛擬 PC 資料平面處理(例如封裝或路由)、加密和其他網路功能。隨著每次迭代,亞馬遜都會擴充套件 Nitro 卡的功能,新增儲存控制、安全監控、系統控制和分析功能。透過將這些任務解除安裝到定製 IC 上,亞馬遜釋放了 CPU 核心,然後將其作為基礎設施即服務 (IaaS) 出售給企業。該專案的成功促成了基於硬體的信任根和 Nitro 虛擬機器管理程式的定製安全晶片的開發。
三、用於 AI 處理的定製 IC
AI 是效能最密集、商業意義最重大的應用之一,這鼓勵所有主要的雲服務提供商推進定製 IC 的開發。這些定製晶片旨在透過加速 AI 應用或提高效率,為提供商提供競爭優勢。谷歌是第一家開發定製 AI IC 的雲提供商,其張量處理單元 (TPU) 最初部署在專門用於 AI 推理的版本中。到 2024 年,谷歌預計將部署超過一百萬個 TPU,主要用於 AI 推理任務。
四、勇往直前:中國矽片競賽中的定製 AI 晶片
在中國,由於持續的 GPU 出口制裁,定製 AI IC 開發已成為必需品。中國雲提供商正在構建針對 AI 推理和訓練進行最佳化的定製 IC,以保持競爭力。
五、下一波浪潮:安全、Web 服務、資料庫和分析
下一波定製 IC 開發預計將針對安全、Web 服務、資料庫和分析方面的工作負載。隨著這些應用規模不斷擴大,定製 IC 將成為最佳化計算效率和最大化效能的關鍵。例如,為資料庫處理設計的定製晶片可以減少查詢響應時間並增加單個伺服器可以處理的使用者數量。該領域的早期實驗已經在進行中,微軟等公司正在部署。同樣,在快速數字化的全球經濟中,對增強網路安全的需求日益增長,這將刺激安全應用定製 IC 的開發。主權雲運動已經建立了安全要求,這些要求將影響這些晶片的設計。
六、對計算市場格局的影響
Omdia 預測,到 2028 年,這些趨勢將產生每年近 2500 萬個定製單元的需求。平均而言,旨在利用這些晶片處理能力的伺服器將配置超過 10 個系統。因此,到 2028 年,預計由這些專用處理器加速的伺服器的年度部署將超過 200 萬臺。2023 年和 2024 年,影片處理晶片將成為最廣泛的部署,而 AI 投資才剛剛開始取得重大成果。影片處理晶片也比針對 AI 最佳化的晶片便宜得多,後者配備了高成本的 HBM 記憶體和眾多計算核心(見圖 12)。
以美元計算,資料中心市場每年的定製 IC 機會預計將在 2028 年達到近 240 億美元(見圖 12),為無法在 GPU 領域與 NVIDIA 競爭的半導體設計師和製造商提供了巨大的潛力。
博通、Marvell 和英特爾等公司已調整戰略,以利用資料中心領域對定製 IC 日益增長的需求。
雖然最大的資料中心運營商是第一批在內部開發專用、特定應用 IC 的公司,但這一趨勢正在擴充套件到汽車和醫療保健等行業。在汽車行業,許多參與者透過與 NVIDIA、英特爾和華為等供應商合作優化了現成的處理器。例如,特斯拉設計了自己的處理器用於自動駕駛中的神經網路計算,並結合了冗餘和安全功能。Denso 為汽車應用建立定製處理器並將其供應給世界各地的汽車製造商。比亞迪還在內部整合了半導體制造,專注於電池管理系統 (BMS)、動力總成控制和實時感測器資料處理的 MCU。
隨著其他參與者從最佳化現成處理器轉向開發自己的設計,汽車定製 IC 市場的價值將呈指數級增長。我們預計,2028 年 158 億美元的汽車 SoC 收入中,很大一部分將由專用、特定應用的 IC 組成
七、如何決定:定製還是建立自己的能力?
決定是否進行定製 IC 開發取決於公司的戰略需求、運營規模和對技術的期望控制水平。然後,公司必須評估其內部能力,包括專業知識和資源,以確定他們是否可以管理內部開發的複雜性,或者與外部合作伙伴合作是否是更合適的途徑。對於尋求降低風險同時仍能從定製中受益的企業,與無晶圓廠半導體公司或整合裝置製造商 (IDM) 的合作可以提供量身定製的解決方案。為了滿足精確的技術和效能規範,這些合作可以從完全定製的服務到共同設計。
對於擁有更強內部能力的公司來說,內部開發定製 IC 可以帶來顯著的好處。該方法可以針對特定目標進行最佳化,例如降低功耗或提高效能,從而允許進行更深入的定製以滿足特定用例。擁有設計流程還可以增強對 IP 安全性的控制,從而更容易保護專有技術。此外,內部開發可以促進創新並創造新的商業機會,例如授權智慧財產權或開發利基產品。
定製化的增加還使公司能夠將硬體與軟體緊密整合,使產品更適應特定用例。硬體和軟體之間的這種協同作用正在導致根本性的轉變,傳統硬體製造商正日益成為軟體驅動的公司。這種轉變不僅增強了產品供應,還創造了新的收入模式並在市場上建立了競爭優勢。
最終,選擇哪條途徑取決於公司的目標、應用的複雜性以及定製化和上市速度之間的平衡。使用商業或開源 IP 可能會縮短開發時間,同時仍保留必要的靈活性。對於中小型公司來說,與老牌公司合作是進入定製 IC 市場的有效方式。另一方面,大型公司可能會從對 IP 的完全所有權中受益,使他們能夠針對其獨特用例創新和最佳化解決方案(見圖 13)。
人工智慧——從規模到多樣性
人工智慧正在迅速普及,並對全球的行業和經濟產生深遠影響。對於半導體行業而言,人工智慧提供了兩大機遇。
首先,人工智慧輔助晶片設計和製造工藝最佳化有望提高效率、減少錯誤並加快上市時間。其次,人工智慧應用(尤其是預測性和生成性人工智慧)的爆炸式增長,正在推動對先進半導體元件的需求大幅增長,成為未來幾年的主要增長動力。
預測性人工智慧應用(例如自動質量檢測和供應鏈最佳化)預計將大幅增長,到 2028 年年收入將達到 1350 億美元(見圖 14)。這些系統利用現有資料來預測結果並增強業務流程。
相比之下,生成性人工智慧旨在根據學習到的資料模式建立新內容。它透過從現有資料集中學習來為生成文字、影象、音樂或其他輸出的應用程式提供支援。這些型別的人工智慧系統正在從早期採用發展到大眾市場採用,預計到 2028 年將實現 580 億美元的收入,從 2023 年起的複合年增長率為 54%(見圖表 14)。
人工智慧的規模競爭在 2019 年至 2021 年達到頂峰,但目前已放緩,谷歌的 1.6 萬億引數 Switch-C 在 2021 年創下了紀錄。雖然 GPT-4 和類似模型尚未打破這一紀錄,但它們的典型模型大小正在增加。自 2023 年 2 月 Meta 的 LLaMa 模型洩露以來,小型人工智慧模型(50 億至 700 億個引數)激增,尤其是在開源社群。這個“缺失的中間”類別現在成為了創新的溫床,因為這些模型足夠小,研究人員和個人可以使用高階個人硬體進行探索。
一、使用人工智慧加速器改造資料中心
人工智慧的採用,尤其是從預測人工智慧到生成人工智慧的轉變,正在導致對半導體的需求激增,特別是人工智慧加速器和高頻寬儲存器 (HBM)。傳統的機器學習模型和 500M 以下重量級的小型神經網路(例如 YOLO-v5)正在被 5B-70B 重量級的大型模型(例如 Phi、Gemma 和 Mistral-7B)取代。隨著 AI 計算需求的激增,NVIDIA 的資料中心業務預計今年將產生超過 800 億美元的收入,儘管並非所有收入都與計算或 AI 嚴格相關。這一預測尤其引人注目,因為在其出色的 2023 年第二季度業績之前,該公司的總收入還不到該數字的一半。
AI 矽片需求的快速增長,尤其是在資料中心,已經改變了 CPU 與協處理器(例如 GPU 或特定領域 ASIC)之間的傳統關係。CPU 越來越多地成為 GPU 的業務邏輯協處理器,或充當各種專用加速器的協調器(見圖 15)。
我們估計,到 2028/29 年,按價值計算,超過 80% 的資料中心處理器要麼是 AI 加速器,要麼具有 AI 功能,從而為總潛在市場貢獻約 1500 億美元。這一增長的主要驅動力與特定用例無關,而是與 Transformer 模型架構的採用有關。Transformer 模型最初是為機器翻譯而設計的,此後已成為幾乎所有應用程式中使用最廣泛的 AI 架構。然而,這種設計的一個關鍵限制是,它的記憶體需求與上下文視窗的大小成二次方關係,而它的推理吞吐量取決於記憶體頻寬。頻寬、延遲,尤其是可預測的延遲至關重要,因為當前的 AI 方法在訓練過程中的某個時刻需要全對全通訊,從而將操作速度降低到最慢的機器或網路鏈路的速度。
與直覺相反,提供足夠的記憶體和 I/O 頻寬比提供計算能力 (FLOP) 更耗能。記憶體的能耗大約是 FLOP 的 10 倍,而 I/O 又增加了 10 倍。由於記憶體容量和快速訪問都是必不可少的,因此僅僅增加更多的 DRAM 是不夠的;高頻寬記憶體 (HBM) 必須直接與加速器整合。這種需求催生了旗艦 GPU,例如 NVIDIA 的 B200 和 AMD 的 MI300,它們消耗大量電力——B200.2 的功耗超過一千瓦。實現顯著的效率改進,特別是在半導體層面,對於降低 AI 應用的運營成本至關重要。
二、定製加速器正在顛覆 GPU 的主導地位
資料中心不斷增長的電力需求,再加上 GPU 的資本成本,刺激了一波定製矽片專案和 AI 加速器初創企業。這反映了電子行業的週期性轉變,正如索尼首席技術官牧本次雄 (Tsugio Makimoto) 在 1991 年所描述的那樣,在定製階段(處於技術前沿時)和標準化階段(需求穩定時)之間。人工智慧引發了“牧本浪潮”的新階段,超大規模雲提供商 IBM、特斯拉、華為和蘋果都推出了自己的定製加速器 ASIC。Marvell 未具名的“客戶 C”也有望在 2026 年前提高其定製 AI ASIC 產量。
到目前為止,定製 ASIC,尤其是谷歌的雲 TPU,是唯一在 GPU 市場中取得重大進展的 ASIC。博通是谷歌 TPU 和 Meta 的訓練和推理加速器 (MTIA) 的 ASIC 外包合作伙伴,其 AI 相關收入在過去一年中增長了三倍——增長速度甚至快於 NVIDIA 的資料中心業務。
AI 晶片初創公司難以產生影響,主要是因為他們無法吸引構建產品軟體開發工具包 (SDK)、工具、服務和垂直解決方案所需的軟體開發人員。因此,代工廠和 ASIC 合作伙伴有機會提供整合服務,降低客戶的進入門檻。這些服務不僅必須涵蓋封裝和光刻,還必須涵蓋相鄰的 IP,而且至關重要的是,應該擴充套件到軟體領域。提供強大的開發人員工具鏈是克服採用挑戰的重要因素。
三、邊緣 AI:加速器矽片的演變
AI 應用的增長也受到 AI 加速器矽片向邊緣和客戶端計算的擴充套件的推動。智慧手機是早期採用者,蘋果和高通早在 2017 年就將專用 AI 加速器核心整合到其片上系統中。到 2023 年,大約 66% 的智慧手機都具有某種形式的 AI 加速,滲透率現已如此之高,甚至出現在售價低於 120 美元的裝置中。高通等公司現在能夠在移動裝置上執行 70-100 億個引數模型。14 然而,個人電腦卻落後了。在英特爾 Meteor Lake CPU 推出之前,個人電腦上的 AI 加速僅限於耗電大、基於 GPU 的遊戲裝置或 Apple Silicon Macs,它們從一開始就擁有內建的 AI 功能。從那時起,英特爾、AMD 和高通都推出了具有 AI 加速的 PC CPU。這些處理器越來越類似於智慧手機中的片上系統設計(見圖 16)。
四、接下來是什麼:克服障礙並重新思考 Transformer 之後的 AI?
未來幾年的一個關鍵問題是,是否有更多參與者可以採用定製矽片,以及最低投資門檻是多少。雖然人們普遍認為,在 12 個月左右的時間裡,非經常性支出為 5000 萬美元,但真正的挑戰可能在於開發和維護支援晶片所需的軟體工具。這無疑已被證明是 AI 晶片初創公司面臨的主要障礙。
另一個緊迫的問題是 Transformer 模型之後會發生什麼。人們正在探索幾種替代方案,例如 Striped Hyena 和 Mamba,它們旨在用狀態機(從較舊的中借用的概念)取代 Transformer 中的記憶體密集型自注意力機制。此外,轉向三元 1.5 位數字表示可以擴充套件 Transformer 的使用範圍。如果一項突破再次使人工智慧計算受限,那麼全球對旗艦 GPU 的大量投資可能會影響較小,儘管它們的大規模並行處理能力仍將提供價值。為了保持競爭力,行業參與者必須繼續深入參與正在進行的人工智慧研究,併為未來的技術變革做好準備。
半導體精品公眾號推薦
專注半導體領域更多原創內容
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。
今天是《半導體行業觀察》為您分享的第3964期內容,歡迎關注。
『半導體第一垂直媒體』
實時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦