半導體產業正經歷一場由人工智能 (AI) 崛起以及傳統摩爾定律放緩所驅動的關鍵轉型。在此背景下,Arm于近日發布了《芯片新思維:人工智能時代的新根基》行業報告。在報告中,來自 Arm 與業界的專家提供了多元化的視點,深度解讀了 AI 時代啟幕之際的行業現狀與趨勢,探討了行業應如何在滿足 AI 帶來的算力需求同時,解決能效、安全性與可靠性等挑戰。
報告指出,為應對AI的爆發式增長所帶來的空前計算需求,芯片行業正持續發展演進。產業正在積極采用定制芯片、計算子系統 (CSS) 和芯粒等創新技術與方法,而這些技術與方法將定義未來十年的技術創新方向。
定制芯片在全行業的廣泛采用
如今,幾乎所有的半導體行業從業者都在探索和投資定制芯片,特別是全球四大超大規模云服務提供商,他們在2024年全球云服務器采購支出中占了近半數的份額。
Arm 解決方案工程部執行副總裁Kevork Kechichian表示,傳統的 SoC 通常是通用芯片組,而定制芯片則是針對特定市場、應用或客戶的需求而量身打造的芯片解決方案。
例如,AWS Graviton4 是基于 Arm 技術打造的定制芯片解決方案,專為加速數據中心和 AI 工作負載而設計,該解決方案實現了性能與能效的顯著提升。
此外,微軟在2023年發布了首款面向云端定制的芯片 Microsoft Azure Cobalt,該芯片選用了 Arm Neoverse 計算子系統 (CSS) 進行打造,旨在應對復雜的計算基礎設施挑戰。去年,Google Cloud 也發布了基于 Arm Neoverse 平臺的 Axion 定制芯片,專為應對數據中心復雜的服務器工作負載而設計。
Kevork 指出,并非僅限于超大型云服務提供商,許多中小企業也在積極研發專屬的定制芯片解決方案,以應對日益復雜的計算需求。例如,在 Arm 技術和英特爾代工服務 (IFS) 的支持下,芯片設計技術提供商智原科技正在開發面向數據中心和先進 5G 網絡的 64 核定制 SoC。韓國的 AI 芯片公司 Rebellions 也宣布打造新的大規模 AI 芯片平臺,用以提升AI 工作負載的能效表現。
定制芯片被認為是實現更高效 AI 計算的重要趨勢,但定制芯片在成本、研發周期以及生態構建等方面存在的挑戰如何應對?
Kevork表示,定制芯片的開發成本非常高,所需的資源也非常大,這既體現在投入開發的人力上,也體現在為開發定制芯片所需的大量計算資源上。為此,Arm 已探索出多種能夠有效降低開發投入的方法。
從加快產品上市的角度出發,Arm 的定制化解決方案能夠讓合作伙伴顯著縮短其產品上市周期。最基礎的方法是從平臺的角度出發,識別可復用的模塊與資源,并確保定制工作是在已有基礎上進行,無需一切從零開始。同時還需要充分評估現有的資源,并在此基礎上構建定制化產品。正是基于這種方式,Arm 與 SoC 及各類 IP 提供商密切合作,將解決方案交付給合作伙伴。
計算子系統(CSS)與芯粒技術的崛起
Arm Neoverse CSS 經過驗證的核心計算功能以及靈活的內存與 I/O 接口配置,加快了產品上市進程,帶來顯著的優勢。它在確保軟件一致性的同時,為 SoC 設計人員提供了靈活性,使其能夠基于 CSS 周圍新增定制子系統,以打造差異化的解決方案。
先進的封裝技術和工藝是近期芯片演進的另一個重要方向,推動了芯粒的發展。這些技術允許多個半導體晶粒的堆疊和互連,在提升性能和能效的同時,開創了現代芯片設計的可能性,如晶粒間接口以及新的 2.5D 和 3D 封裝解決方案。
理想情況下,芯片廠商無需重新設計一款芯片,只需添加更多芯粒以增加算力和性能,甚至可以升級現有芯粒,從而更快地將新產品推向市場。與此同時,生產更小的芯片還有助于提高良率,并減少制造過程中的浪費。
作為致力于推動芯粒發展的領先企業,Arm 已在整個技術生態系統內展開合作,借助通用框架和行業標準來加速芯粒市場的發展。
在談及芯粒技術發展面臨的挑戰時,Kevork 表示,在我們當前所處的技術范式中,最關鍵的是如何對芯粒 (chiplet) 的設計與接口方式進行標準化。這涉及從封裝廠如何集成這些芯粒,一直到在系統中不同芯粒之間進行通信的全過程。因此,與合作伙伴就標準化問題達成共識至關重要。
在此背景下,Arm 推出了芯粒系統架構 (Chiplet System Architecture, CSA),致力于對各個芯粒之間及在整個系統內的通信方式等多個方面實現標準化。此外,Arm 還攜手合作伙伴共同推動 AMBA CHI 芯片到芯片互連協議等倡議的落地實施,確保來自不同供應商的不同芯粒通過一個統一的接口協議來確保芯粒之間的互操作性。
過去,標準化常被視為放棄自身的 IP 或競爭優勢。但如今,鑒于系統的高度復雜性以及合作模式的演變,標準化變得尤為重要——所有參與方都將從中獲得多重益處。
應對 AI時代的安全威脅
隨著 AI 驅動的網絡攻擊手段不斷演變,構建更具彈性和適應性的安全機制,確保芯片在復雜多變的網絡環境中的安全性成為必選項。
Kevork 認為,當前行業正在加速演進,針對 SoC 平臺 IP 的攻擊手段日趨復雜。Arm 正在通過構建多層級的軟硬件防護體系,提升防御能力。比如,Arm 在芯片中直接集成加密技術,并結合經 AI 強化的安全監測系統,使現代 SoC 架構能夠抵御傳統攻擊與新興的威脅。
此外,AI 本身也正日益成為抵御安全攻擊的有力助手。通過基于網絡的監測與先進的代碼分析,AI 驅動的技術能夠以人類難以企及的速度和規模識別可疑行為,并發現潛在漏洞。Arm 正在最大限度地發揮這一優勢。
隨著 AI 模型在日常計算中日益普及,保護其完整性變得尤為重要。這推動了機密計算架構 (CCA)的崛起——即使處于潛在不可信的環境中,此類架構也能為敏感的 AI 計算創建“安全飛地”。而針對長期以來被攻擊者頻繁利用的內存漏洞,行業也正在通過一系列創新手段加以解決,例如 Armv9 架構中的內存標記擴展 (MTE) 技術,能使惡意攻擊者更難針對內存發起攻擊。
AI與芯片面臨的挑戰與機遇
AI 工作負載的計算需求極大,需要大量電力與能源資源來支持其運行,且這種需求在未來將會持續增長。Kevork 表示,從芯片設計的角度來看,最主要的能耗來源是計算和數據傳輸。此外,還需要對過程中所產生的熱量進行冷卻處理。
首先,AI 依賴于大量的乘積累加運算,這就要求芯片中集成高能效的計算結構。與此同時,這些計算并非總在同一位置完成。多數情況下,某些 AI 的輸出必須在其他運算或計算組件中進一步處理,這就會產生數據傳輸,從而帶來額外的能源和電力的開銷。因此,要實現高能效的 AI 計算,優化計算組件之間的通信至關重要,這些組件可能位于同一芯片內,也可能位于另一個模塊或機架中。
此外,將計算單元和內存單元緊密封裝,可以最小化延遲和電力損耗,但卻也帶來了散熱方面的挑戰。因此,高效的冷卻解決方案對于管理能源密度和確保硬件可靠性至關重要。
因此,為降低能源成本,芯片設計正在集成優化的內存層次結構與協同設計的通信機制。這些解決方案既減少了數據的傳輸,還借助芯片堆疊、高帶寬內存以及先進的互連等技術,最大程度地降低剩余數據傳輸過程中的能耗。與此同時,AI 框架和算法也正日益針對每瓦性能和單位成本性能等指標進行微調,實現算力與經濟可持續性之間的平衡。
隨著 AI 技術的不斷發展,更具能效的芯片設計與更小型、更高效的 AI 模型的研發正不斷取得進展。這類模型尤其適合在小型設備上運行生成式 AI 工作負載,具備資源占用更低、準確性更高以及可移植性更強等優勢。
此外,行業在數據類型優化方面也在不斷進步。例如,全行業推動采用 FP4(4 位浮點數)靈活架構并推出新指令集和功能,帶來了增量收益,并有助于實現更高效的 AI 計算。而芯片堆疊技術和 3D 封裝技術的發展,也催生了諸如芯粒等更高能效的芯片設計方案。
報告還指出,底層架構的創新也至關重要,如新的指令集和功能的引入,能夠為 AI 帶來重大的創新機遇。例如,Arm 定期推出的新功能,如可伸縮矢量擴展 (SVE2) 和可伸縮矩陣擴展 (SME),這些功能都集成于 Arm 架構中,為生態系統增加了新的 AI 能力。值得注意的是,如今的硬件已經具備訓練 Transformer 模型的強大能力,而這類模型正是生成式 AI 的基礎。
在 Arm 看來,理想的情況是,AI 和芯片技術能夠實現一種整體協同設計的方法,即硬件和算法同步開發,以實現最佳性能和效率。
小結
在 AI 時代,芯片設計方式將持續演進,并重新聚焦于高能效計算,以應對日益復雜的計算工作負載。這一趨勢體現在通過定制芯片、CSS 以及芯粒等創新方式打造的專用芯片組,從而優化芯片設計中的功耗、性能與面積。
報告指出,芯片設計的成功將越來越依賴于以下幾點:IP 提供商、晶圓代工廠與系統集成商之間的緊密合作;計算、內存與電源傳輸之間的系統級優化;接口的標準化,以支持模塊化設計;針對特定工作負載的專用架構以及能靈活應對新興威脅的強大安全框架。
“若想取得成功,我們既要直面復雜性,又要找到高效管理復雜性的方法——這將依賴于全新的工具、方法論,以及生態系統內前所未有的協作,”Kevork 總結道,“唯有通過整個生態系統的協作,我們方能構建起必要的技術基石——既能釋放 AI 的變革潛力,又能有效管控其計算成本與復雜度。”
通過與半導體生態系統中的合作伙伴持續協作,Arm將持續致力于應對能效、安全性和性能等根本性挑戰,定義計算的未來。
-
ARM
+關注
關注
134文章
9342瀏覽量
376416
發布評論請先 登錄
Turkcell受邀出席華為IP GALA技術峰會
砥礪創新 芯耀未來——武漢芯源半導體榮膺21ic電子網2024年度“創新驅動獎”
面向未來 三星構建移動安全防護體系
名單公布!【書籍評測活動NO.57】芯片通識課:一本書讀懂芯片技術
Arm帶你了解2025年及未來在不同技術市場的關鍵技術方向
Arm 技術預測:2025 年及未來的技術趨勢

鯨啟智能機器人入選多項金融銀行機器人行業報告

Molex莫仕發布2024年機器人技術報告
面向未來的智能視覺參考設計與汽車架構,思爾芯提供基于Arm技術的創新方案

從特斯拉看智能駕駛未來發展

2024激光顯示技術與產業發展大會:共繪未來十年藍圖
哪種嵌入式處理器架構將引領未來十年的發展?

評論