深度學(xué)習(xí)是一種關(guān)鍵的計算方法,它正在推動技術(shù)的發(fā)展——處理海量數(shù)據(jù)并發(fā)現(xiàn)人類永遠(yuǎn)無法自行辨別的微妙模式。但為了獲得最佳性能,深度學(xué)習(xí)算法需要得到正確的軟件編譯器和硬件組合的支持。特別是,允許根據(jù)需要靈活使用硬件資源進(jìn)行計算的可重構(gòu)處理器是關(guān)鍵。
在最近的一項研究中,香港的研究人員報告了一種名為 ReAAP 的新型可重構(gòu)處理器,其性能優(yōu)于幾種常用于支持深度神經(jīng)網(wǎng)絡(luò) (DNN) 的計算平臺,深度學(xué)習(xí)是一種有用的形式,通常涉及具有許多計算密集型的大型數(shù)據(jù)集數(shù)據(jù)層。他們在 10 月 10 日發(fā)表在IEEE Transactions on Computers上的一篇論文中對其進(jìn)行了描述。
在他們的研究中,研究人員將他們在 ReAAP 中提出的軟件編譯器與 Nvidia GPU 和 ARM CPU 上的其他三個基線軟件編譯器進(jìn)行了比較。結(jié)果表明,它的執(zhí)行速度是運行在GPU并且是運行相同軟件編譯器的 1.6 到 3.3 倍在中央處理器上.
此外,Zheng 指出,ReAAP 為各種不同的計算密集層實現(xiàn)了硬件資源的持續(xù)高利用率。
雖然 ReAAP 擅長處理具有典型數(shù)據(jù)密集型工作負(fù)載的 DNN,但它目前不太適合在數(shù)據(jù)稀疏時支持 DNN。鄭說他的團(tuán)隊希望在未來解決這個問題。更重要的是,研究人員希望以 ReAAP 為基礎(chǔ),使其能夠更好地處理量化數(shù)據(jù)(處理的數(shù)據(jù)以一種顯著降低神經(jīng)網(wǎng)絡(luò)的內(nèi)存需求和計算成本的方式)。
“在 [ReAAP 更好地處理量化數(shù)據(jù)] 的擴(kuò)展完成和評估后,我們將考慮將其與其他幾個人工智能計算加速解決方案一起商業(yè)化,”鄭說,并指出這將使 ReAAP 在資源方面更有效率受限平臺,例如各種物聯(lián)網(wǎng) (IoT) 設(shè)備。
而普通處理器通常允許數(shù)據(jù)使用特定的硬件路徑進(jìn)行處理,可重構(gòu)處理器提供了一種更具適應(yīng)性的選擇:重新配置最有效的硬件資源以根據(jù)需要處理數(shù)據(jù)。
“可重構(gòu)處理器結(jié)合了軟件靈活性和硬件并行性的優(yōu)勢,”參與該研究的香港科技大學(xué)電子與計算機(jī)工程系博士后研究員鄭建偉解釋道。
這些優(yōu)勢促使他的團(tuán)隊創(chuàng)建了 ReAAP,這是一個集成的軟硬件系統(tǒng)。它的軟件編譯器負(fù)責(zé)評估和優(yōu)化各種深度學(xué)習(xí)工作負(fù)載。一旦確定了并行處理數(shù)據(jù)的最佳解決方案,它就會發(fā)送指令重新配置硬件協(xié)處理器,從而分配適當(dāng)?shù)挠布Y源來進(jìn)行并行計算。“作為端到端系統(tǒng),ReAAP 可以部署以加速各種深度學(xué)習(xí)應(yīng)用程序,只需在 [the] 軟件中為每個應(yīng)用程序定制一個 Python 腳本,”Zheng 解釋說。
審核編輯 :李倩
-
處理器
+關(guān)注
關(guān)注
68文章
19833瀏覽量
233970 -
AI
+關(guān)注
關(guān)注
88文章
34592瀏覽量
276337 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1223瀏覽量
25325
原文標(biāo)題:一種讓AI更快的可重構(gòu)處理器
文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Cadence推出Tensilica NeuroEdge 130 AI協(xié)處理器
一種低翹曲扇出重構(gòu)方案

光子 AI 處理器的核心原理及突破性進(jìn)展
AI MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-AI3 加速器和高性能實時處理器

端側(cè) AI 音頻處理器:集成音頻處理與 AI 計算能力的創(chuàng)新芯片
基于相變材料的可重構(gòu)超構(gòu)表面用于圖像處理

BitEnergy AI公司開發(fā)出一種新AI處理方法
對稱多處理器的特點是什么
對稱多處理器和非對稱多處理器的區(qū)別
英特爾?至強(qiáng)?可擴(kuò)展處理器助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

AMD推出全新銳龍AI 300系列處理器

ARM處理器的結(jié)構(gòu)和特點
下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入處理


評論