2025 年 6 月 25 日,北京大學團隊在智能計算硬件方面取得領先突破,國際上首次實現了基于存算一體技術的高效排序硬件架構 (A fast and reconfigurable sort-in-memory system based on memristors),解決了傳統計算架構面對復雜非線性排序問題時計算效率低下的瓶頸問題,在這一極難攻克的人工智能基礎算子加速領域形成優勢,將為具身智能、大語言模型、智能駕駛、智慧交通、智慧城市等人工智能應用提供更高效算力支持。該成果由北京大學集成電路學院楊玉超教授、人工智能研究院陶耀宇研究員組成的團隊完成,已在國際頂級學術期刊《自然?電子》上發表。


排序加速:存算一體架構中難啃的 “硬骨頭”
排序,作為人工智能系統中最常用、最耗時的基礎操作之一,廣泛存在于自然語言處理、信息檢索、圖神經網絡、智能決策等人工智能相關領域中。在傳統的馮?諾依曼計算架構中,處理器與存儲器分離的特點導致數據被頻繁搬運,嚴重制約了計算速度和系統能效,因此將存儲與計算融合的 “存算一體” 架構是突破硬件性能的必由之路。
例如在智能駕駛場景中,車輛在高速公路等簡單環境中,只需對周邊幾臺車的行進路線進行排序就能判斷是否會對自身安全產生影響,整個耗時可控制在毫秒級別,但在復雜的城市環境中風險來自周邊的數百個乃至更多的各類交通參與者,排序的復雜程度和硬件延遲大幅提高;再比如,在抖音、小紅書等平臺大的規模檢索與推薦系統中,用戶點擊、評分、相似度計算后,常需要對海量的候選內容進行快速排序,找出最相關項,排序性能直接影響系統的響應時間和可擴展性;此外,在大語言模型訓練、機器人路徑規劃、強化學習搜索等場景中,快速評估多個決策或行動的優劣并進行排序,也是必不可少而又極為費時的步驟。
然而,在傳統計算架構下,大規模的非線性排序難以在端側或邊緣設備高效完成,這一過程消耗大量時間與功耗,極大制約了具身智能、智能駕駛等新興技術的發展與普及。 近年來,“存算一體” 被認為是突破傳統硬件架構計算瓶頸的關鍵技術,已經在矩陣計算等規則性強的數值計算中取得顯著成果。然而由于排序存在邏輯復雜、操作非線性、數據訪問不規則,缺乏通用、高效的硬件排序原語等諸多障礙,目前國際主流的存算一體架構均無法解決大數據排序問題,這一難題成為了制約下一代人工智能計算硬件發展的前沿焦點與核心卡點問題。
科研團隊圍繞 “讓數據就地排序” 的第一性原理目標,在存算一體架構上攻克了多個核心技術難題,實現了排序速度與能效的數量級提升。主要突破包括:首先,開發了一套基于新型存內陣列結構的高并行比較機制;第二,開創性地引入了 “憶阻器陣列”,實現了低延遲、多通路的硬件級并行排序電路設計;第三,在算子層面,優化了面向人工智能任務的算法 - 架構協同路徑,同時兼容現有矩陣計算;第四,完全自主設計的器件 - 電路 - 系統級技術棧整合。
在人工智能系統中,排序通常作為數據預處理或決策中間環節存在,一旦執行效率不高,將成為整個系統的主要瓶頸。論文第一作者、北京大學集成電路學院博士生余連風介紹道,“排序的核心是比較運算,需要精準地實現‘條件判斷 + 數據搬移’,在復雜的應用場景中,要對不同因素的優先級進行比較,因此排序的邏輯非常復雜。一般排序過程需要構建支持多級‘比較 - 選擇’的比較器單元,而傳統存算一體架構主要面向‘乘加’、‘累加’等操作,難以支持這樣的復雜運算,我們的工作成功解決了這一難題,設計了一種‘無比較器’的存算一體排序架構。”
據實測結果顯示,該硬件方案在典型排序任務中提升速度超 15 倍,面積效率提升超過 32 倍,具備并行處理百萬級數據元素排序任務的潛力,功耗僅為傳統 CPU 或 GPU 處理器的 1/10。在人工智能推理場景中,支持動態稀疏度下的推理響應速度可提升 70% 以上,特別適用于要求極高實時性的任務環境。論文通訊作者、北京大學人工智能研究院陶耀宇研究員說,“正因為排序計算在人工智能中是高頻、通用、基礎且極難處理的一類操作,這一難題的突破意味著存算一體從‘適合特定應用’走向‘可支持更廣泛的通用計算’,為人工智能相關任務構建了全鏈路的底層硬件架構支持。”
提高計算效率,打造加速引擎
據悉,該技術具有廣泛的應用前景,可用于智慧交通圖像排序系統、金融智能風控評分引擎、邊緣監控設備的目標優先識別模塊等場景。在測試中該技術展現出高速度與低功耗的顯著優勢。例如,在智慧交通場景中,系統有望在毫秒級內完成十萬級事件優先級評估,為超大規模交通決策、應急響應調度等提供高效的實時算力支持。存算一體超高性能排序加速架構的成功突破,不僅是一次架構創新的勝利,更是將科研成果轉化為實際應用、服務國家重大戰略需求的重要行動。
“根據初步測算,若該技術在智能終端、工業控制、數據中心等核心應用場景中推廣,僅在邊緣 AI 芯片市場就可形成百億元級年產值潛力,大幅提升傳統算力系統的性能。北京大學科研團隊正是瞄準了‘算力’這個牛鼻子,聚焦‘存算一體’這一關鍵技術開展高強度科研攻關,實現了從器件到系統的全棧自主設計。這一成果不僅是技術層面的突破,更是攻克了存算一體化排序加速的‘硬骨頭’難題,在面向人工智能基礎操作的硬件加速領域實現了突破,將為我國建設科技強國,實現高水平科技自立自強注入新算力。
來源:半導體芯科技
【2025全年計劃】
隸屬于ACT雅時國際商訊旗下的兩本優秀雜志:《化合物半導體》&《半導體芯科技》2025年研討會全年計劃已出。
線上線下,共謀行業發展、產業進步!商機合作一覽無余,歡迎您點擊獲取!
https://www.compoundsemiconductorchina.net/seminar/
-
半導體
+關注
關注
335文章
28809瀏覽量
235905 -
智能硬件
+關注
關注
205文章
2385瀏覽量
109131
發布評論請先 登錄
蘋芯科技 N300 存算一體 NPU,開啟端側 AI 新征程

億鑄科技亮相2025中國移動云智算大會

午芯芯科技國產電容式MEMS壓力傳感器芯片突破卡脖子技術
濟南市中區存算一體化智算中心上線DeepSeek
梯度科技推出DeepSeek智算一體機
澎峰科技發布DeepSeek智算一體機
存算一體架構創新助力國產大算力AI芯片騰飛
科技新突破:首款支持多模態存算一體AI芯片成功問世

后摩智能首款存算一體智駕芯片獲評突出創新產品獎
蘋芯科技引領存算一體技術革新 PIMCHIP系列芯片重塑AI計算新格局

評論