女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

緩解高性能存算一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計

后摩智能 ? 來源:后摩智能 ? 2025-07-11 15:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在高性能計算與AI芯片領(lǐng)域,基于SRAM的存算一體(Processing-In-Memory, PIM)架構(gòu)因兼具計算密度、能效和精度優(yōu)勢成為主流方案。隨著存算一體芯片性能的持續(xù)攀升,供電電壓降(IR-drop)問題日益成為制約其性能、能效與可靠性的關(guān)鍵瓶頸,而傳統(tǒng)電路級優(yōu)化方法往往需在功耗、性能或面積上做出妥協(xié),難以實現(xiàn)系統(tǒng)化解決。

針對這一挑戰(zhàn),后摩智能與北京大學(xué)等高校合作的論文《AIM: Software and Hardware Co-design for Architecture-level IR-drop Mitigation in High-performance PIM》,創(chuàng)新性地提出了AIM軟硬件協(xié)同設(shè)計,成功入選ISCA 2025。

該論文首創(chuàng)性地建立了量化工作負(fù)載與IR-drop關(guān)聯(lián)的關(guān)鍵參數(shù)HR,開發(fā)了基于正則化與權(quán)重優(yōu)化的算法以降低權(quán)重HR值,設(shè)計了動態(tài)反饋系統(tǒng)實現(xiàn)電壓/頻率的實時調(diào)節(jié)以應(yīng)對IR-drop波動,并通過HR感知的任務(wù)映射機(jī)制實現(xiàn)了跨層協(xié)同優(yōu)化。這一系列軟硬件協(xié)同創(chuàng)新技術(shù)有效緩解了高性能PIM芯片的IR-drop問題,同時顯著提升了芯片性能與能效表現(xiàn)。基于一款256 TOPS PIM芯片的后仿真驗證數(shù)據(jù)表明,AIM能夠?qū)R-drop大幅降低69.2%,并同步實現(xiàn)能效提升2.29倍或性能增益15.2%。

本文將展開介紹這一創(chuàng)新方法。

研究動機(jī)

在高性能存算一體(PIM)芯片中,IR-drop 已成為制約性能與可靠性的關(guān)鍵挑戰(zhàn)。7nm 工藝下 256 TOPS SRAM PIM 芯片實測顯示,動態(tài) IR-drop 可達(dá) 140mV,導(dǎo)致時序違規(guī)和計算精度退化。傳統(tǒng)電路級方案(如電源平面修改、電容插入)雖能緩解 IR-drop,但會引入高額設(shè)計成本并犧牲功耗、性能和面積(PPA)。例如,Graphcore IPU 通過 3D 封裝和深槽電容緩解 100mV IR-drop,卻導(dǎo)致設(shè)計成本激增。

83856f5c-5c69-11f0-baa5-92fbcf53809c.png

圖1:(a)IR-drop現(xiàn)象(b)靜態(tài)和動態(tài)電流

圖1 IR-drop現(xiàn)象。實際電源電壓和理想電壓的插值,由電流通過電源網(wǎng)絡(luò)的寄生電阻引起,這會導(dǎo)致電路單元電壓不足,引發(fā)時鐘延遲、時序違規(guī)甚至功能失效。

圖1:(b):靜態(tài)和動態(tài)電流。IR-drop 由靜態(tài)和動態(tài)電流共同決定,其中動態(tài)電流隨計算負(fù)載波動,是高性能 PIM 中 IR-drop 惡化的主要原因。

PIM架構(gòu)的獨特優(yōu)勢為架構(gòu)級優(yōu)化提供契機(jī):

工作負(fù)載規(guī)律性: PIM 專為神經(jīng)網(wǎng)絡(luò)設(shè)計, workload 可預(yù)測(如自LLMs的推理的結(jié)構(gòu)和工作流固定);

原位處理特性:權(quán)重數(shù)據(jù)可離線分析,輸入數(shù)據(jù)流和計算模式解耦。這為建立IR-drop和工作負(fù)載的關(guān)聯(lián)奠定基礎(chǔ)。

方法簡介

AIM通過“指標(biāo)建模-軟件優(yōu)化-硬件協(xié)同”三層架構(gòu)實現(xiàn)端到端IR-drop緩解:

1.架構(gòu)級指標(biāo)關(guān)聯(lián)

提出瞬時位流翻轉(zhuǎn)率(Rtog)和權(quán)重漢明率(HR),建立工作負(fù)載與IR-drop的直接關(guān)聯(lián)。Rtog量化了PIM bank中從SRAM到加法器的位流翻轉(zhuǎn)頻率,如圖2所示,其與 IR-drop 的線性相關(guān)系數(shù)在 7nm DPIM 中達(dá) 0.977。而HR作為Rtog的理論上界,可通過量化過程優(yōu)化,且與輸入無關(guān),便于離線處理。

8398744e-5c69-11f0-baa5-92fbcf53809c.png

圖2:IR-drop和Rtog的相關(guān)性

2.軟件側(cè)HR優(yōu)化

2.1 LHR(低漢明率正則化)

在量化訓(xùn)練中引入可微HR近似,懲罰高HR權(quán)重,使權(quán)重分布趨向低HR局部極小值(如-8、0、8),精度損失可忽略。如圖3中所示,Resnet18的可以通過LHR平均降低28%,且精度損失可以忽略。

83a73cb8-5c69-11f0-baa5-92fbcf53809c.png

圖3:(a) LHR的權(quán)重分布與漢明率的局部極小值對齊 (b) 通過插值計算浮點數(shù)的HR及其相應(yīng)梯度

2.2 WDS(權(quán)重分布偏移)

通過向量化偏移δ(如8/16)將權(quán)重分布推向正區(qū)間,利用補(bǔ)碼編碼特性降低HR,并通過硬件移位補(bǔ)償消除計算誤差。

3.硬件側(cè)動態(tài)調(diào)節(jié)

3.1 IR-Booster

結(jié)合軟件HR信息與硬件IR監(jiān)測,動態(tài)調(diào)整電壓-頻率(V-f)對。通過安全級與激進(jìn)級雙層調(diào)節(jié),在保障可靠性的同時提升能效(如低功耗模式下能效提升2.29×)。

83baac1c-5c69-11f0-baa5-92fbcf53809c.png

圖4:(a) 宏組顆粒度下的電源和V-f調(diào)整 (b) 由IRFailure調(diào)節(jié)的IR-Booster

3.2 HR-aware任務(wù)映射

基于模擬退火算法,按 HR 特性分配任務(wù)至宏單元組,避免不同 HR 任務(wù)相互干擾。與順序映射相比,如圖5所示,該方法將多算子并發(fā)時能效提升 15%~22%。

83cce5d0-5c69-11f0-baa5-92fbcf53809c.png

圖5:HR感知任務(wù)映射與其他方法對比

實驗結(jié)果

在7nm 256 TOPS PIM芯片的后布局仿真中,AIM展現(xiàn)顯著優(yōu)勢:

1.IR-drop緩解

圖6展示了展示了應(yīng)用 AIM 前后,7nm PIM 芯片布局中 IR-drop(電源網(wǎng)絡(luò)電壓降)的分布變化。后布局仿真顯示,AIM 將宏單元內(nèi)的 IR-drop 從 140mV 降至 43.2~58.1mV,緩解率達(dá) 58.5%~69.2%,直接證明其在硬件層面的有效性。

83e1317a-5c69-11f0-baa5-92fbcf53809c.png

圖6:7nm 工藝 256 TOPS PIM 芯片布局的 IR-drop 緩解效果

2.能效與性能提升

83fc29da-5c69-11f0-baa5-92fbcf53809c.png

圖7:IR-drop、功耗與性能的消融研究

如圖7所示,AIM在解決IR-drop的同時優(yōu)化了芯片的功耗和計算性能。

能效比提升1.91~2.29×(宏單元的功耗從4.2978mW降至1.876mW);

計算性能提升1.129~1.152×(256TOPS提升至295TOPS)。

3.任務(wù)映射優(yōu)化

相比順序映射,HR-aware映射使多算子并發(fā)時的能效提升15%~22%,延遲降低9ms。

總結(jié)

AIM通過軟硬件協(xié)同設(shè)計,突破傳統(tǒng)IR-drop緩解的PPA瓶頸,為高性能PIM提供了兼具效率與可靠性的解決方案。后布局仿真驗證了其在7nm工藝下的有效性,未來可擴(kuò)展至浮點PIM和異構(gòu)計算架構(gòu)(如TPU、GPU)。該工作為存算一體芯片的實用化部署提供了關(guān)鍵技術(shù)支撐,代碼與模型已開源(https://github.com/pku-zyp/LHR-of-AIM-in-ISCA25.git),推動學(xué)術(shù)界與產(chǎn)業(yè)界的進(jìn)一步創(chuàng)新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52464

    瀏覽量

    440166
  • 存算一體
    +關(guān)注

    關(guān)注

    0

    文章

    108

    瀏覽量

    4653
  • 后摩智能
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    1372

原文標(biāo)題:后摩前沿 | 緩解高性能存算一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計

文章出處:【微信號:后摩智能,微信公眾號:后摩智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    一體力AI芯片將逐漸走向落地應(yīng)用

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)前不久,后摩智能宣布,其自主研發(fā)的業(yè)內(nèi)首款一體力AI芯片成功點亮,并成功跑通智能駕駛算法模型。 ? 這
    的頭像 發(fā)表于 05-31 00:03 ?5502次閱讀

    談?wù)?b class='flag-5'>芯片設(shè)計中的IR-drop

    什么是IR-drop?其實,IR這個詞并不是什么縮寫,這里的I就是指電流,R是指電阻,他們放在起相乘,得出來的結(jié)果就是電壓。
    發(fā)表于 06-16 09:26 ?8868次閱讀
    談?wù)?b class='flag-5'>芯片</b>設(shè)計中的<b class='flag-5'>IR-drop</b>

    一體技術(shù)路線如何選

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)過去幾年,越來越多企業(yè)加入到一體技術(shù)的研究中,如今,一體
    的頭像 發(fā)表于 06-21 09:27 ?4953次閱讀

    一體技術(shù)發(fā)展現(xiàn)狀和未來趨勢

    一體
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2023年04月25日 17:21:41

    基于Altera FPGA的軟硬件協(xié)同仿真方法介紹

    摘要:簡要介紹了軟硬件協(xié)同仿真技術(shù),指出了在大規(guī)模FPGA開發(fā)中軟硬件協(xié)同仿真的重要性和必要性,給出基于Altera FPGA的門級軟硬件
    發(fā)表于 07-04 06:49

    基于SoPC的嵌入式軟硬件協(xié)同設(shè)計性能怎么優(yōu)化?

    軟硬件協(xié)同設(shè)計(Hardware/Software Co-deaign)是在20世紀(jì)90年代興起的跨領(lǐng)域交叉學(xué)科。隨著超大規(guī)模集成電路制造工藝的進(jìn)步,單個芯片所能提供的晶體管數(shù)量已經(jīng)超過了大多數(shù)
    發(fā)表于 04-08 08:03

    基于軟硬件協(xié)同設(shè)計的低功耗生理信號處理ASIC設(shè)計

    摘 要 文主要介紹了種采用軟硬件協(xié)同設(shè)計策略的用于生理信號處理的低功耗醫(yī)學(xué)集成芯片軟硬件協(xié)同
    發(fā)表于 06-19 10:29 ?24次下載

    思科謀求“軟硬件一體”轉(zhuǎn)型

    作為路由器和交換機(jī)領(lǐng)域的領(lǐng)導(dǎo)者,思科正在謀求在手抓硬件的同時,另手也開始抓軟件,實現(xiàn)“軟硬件一體”轉(zhuǎn)型。
    發(fā)表于 12-10 08:52 ?1047次閱讀

    軟硬件協(xié)同設(shè)計是系統(tǒng)芯片的基礎(chǔ)設(shè)計方法學(xué)

    軟硬件協(xié)同仿真驗證是對軟硬件功能設(shè)計的正確性及性能進(jìn)行驗證和評估。傳統(tǒng)設(shè)計中,硬件和軟件通常是分開獨立開發(fā)設(shè)計的,到系統(tǒng)設(shè)計后期才將
    的頭像 發(fā)表于 08-12 11:28 ?3880次閱讀

    一體芯片在可穿戴設(shè)備市場有哪些機(jī)會

    2022年,TWS耳機(jī)廠商在種新型計算架構(gòu)中找到突破口——一體。與傳統(tǒng)馮諾依曼架構(gòu)相比,基于
    發(fā)表于 10-14 09:38 ?1479次閱讀

    2023年一體芯片設(shè)計的技術(shù)趨勢

    一體旨在計算單元與存儲單元融合,在實現(xiàn)數(shù)據(jù)存儲的同時直接進(jìn)行計算,以消除數(shù)據(jù)搬移帶來的開銷,極大提升運算效率,以實現(xiàn)計算存儲的高效節(jié)能。
    的頭像 發(fā)表于 01-13 15:26 ?2596次閱讀

    基于3DIC架構(gòu)的一體芯片仿真解決方案

    的“存儲墻”、“功耗墻”問題。一體將存儲與計算有機(jī)融合以其巨大的能效比提升潛力,有望成為數(shù)字經(jīng)濟(jì)時代的先進(jìn)生產(chǎn)力。
    的頭像 發(fā)表于 02-24 09:34 ?6300次閱讀

    一體芯片的技術(shù)壁壘

    作為后摩爾時代發(fā)展的必然趨勢之一體越來越受到行業(yè)的關(guān)注。在十問的前六問中,我們梳理了
    的頭像 發(fā)表于 09-22 14:16 ?1350次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>芯片</b>的技術(shù)壁壘

    一體芯片新突破!清華大學(xué)研制出首顆一體芯片

    集成電路學(xué)院教授吳華強(qiáng)副教授高濱團(tuán)隊基于一體計算范式研制出的全球首顆全系統(tǒng)集成支持高效片上學(xué)習(xí)(機(jī)器學(xué)習(xí)能在硬件端直接完成)的憶阻器
    的頭像 發(fā)表于 10-11 14:39 ?1420次閱讀

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片高性能計算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《一體架構(gòu)創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?851次閱讀
    主站蜘蛛池模板: 蓬安县| 怀仁县| 垫江县| 濮阳市| 长岭县| 无极县| 永顺县| 威信县| 林西县| 迁西县| 葵青区| 理塘县| 宜城市| 宁远县| 长葛市| 伽师县| 库尔勒市| 孝义市| 邵东县| 兴仁县| 库尔勒市| 长兴县| 奎屯市| 青龙| 仁怀市| 慈利县| 顺平县| 阿鲁科尔沁旗| 金沙县| 房产| 奉节县| 沾益县| 鄢陵县| 都昌县| 双柏县| 连城县| 金昌市| 葵青区| 上林县| 奇台县| 弋阳县|