女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IPU 與 GPU 間無縫銜接,未來聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

工程師鄧生 ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-01-02 10:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“不管是在今天 GPU 能夠做的事情上,還是 GPU 不能做的事情上,IPU 都有它的價值點和價值定位。” 日前,在英國 AI 芯片初創(chuàng)公司 Graphcore 中國區(qū)的媒體溝通會上,Graphcore 高級副總經(jīng)理兼中國區(qū)總經(jīng)理盧濤和 Graphcore 中國工程總負責(zé)人、AI 算法科學(xué)家金琛,就 Graphcore 的新產(chǎn)品性能以及該公司在中國的落地策略向 DeepTech 等媒體進行了同步。

溝通會上,Graphcore 解讀了其于本月公布的大規(guī)模系統(tǒng)級產(chǎn)品 IPU-M2000 的應(yīng)用測試數(shù)據(jù)。公布數(shù)據(jù)顯示,在典型 CV 模型 ResNet、基于分組卷積的 ResNeXt、EfficientNet、語音模型、BERT-Large 等自然語言處理模型以及 MCMC 等傳統(tǒng)機器學(xué)習(xí)模型中,IPU-M2000 在吞吐量、訓(xùn)練時間和學(xué)習(xí)結(jié)果生成時間方面都有較好表現(xiàn)。比如,在 IPU-M2000 上 EfficientNet 的吞吐量達到 A100 的 18 倍。

圖 | IPU-M2000 與 GPU 的吞吐量、訓(xùn)練及結(jié)果生成時間對比(來源:Graphcore)

66e3cb43bec8442f90d9105440bb1a58.jpeg

此前,IPU-M2000 與 Graphcore 第二代 IPU 處理器 GC200 已于今年 7 月 15 日發(fā)布。據(jù)介紹,GC200 芯片基于臺積電的 7nm 工藝制造,集成 250 TFlops AI-Float 算力和 900MB 處理器內(nèi)存,相較第一代產(chǎn)品性能提升 8 倍。而對于第三代 IPU,盧濤在此次溝通會上并未透露發(fā)布的具體時間表,不過他表示下一代產(chǎn)品正在研發(fā)中,將依舊重點解決存儲問題。

支持 PyTorch、TensorFlow,在 IPU 與 GPU 間無縫銜接

另外,Graphcore 還發(fā)布了 Poplar SDK 1.4 版本和 PyTorch 的 IPU 版本。

Graphcore 對 Poplar SDK 1.4 版本在易用性和速度上進行了優(yōu)化,能夠支持模型和數(shù)據(jù)并行,同時能夠?qū)崿F(xiàn)模型的橫向擴展 —— 從 1 個 IPU 橫向擴展到 64 個 IPU。金琛表示,下一版本的 Poplar SDK 有望實現(xiàn)橫向擴展到 128 個 IPU。

值得關(guān)注的是,除支持 Graphcore 的自研框架 PopART 外,Poplar SDK 1.4 還支持 Facebook 的 PyTorch 框架、以及 Google 的 TensorFlow 框架。

據(jù)金琛介紹,Graphcore 在 PyTorch 代碼中引入了 PopTorch 輕量級接口,通過這一接口,用戶可基于當(dāng)前的 PyTorch 模型進行封裝,以實現(xiàn) IPU 和 CPU 之間的無障礙銜接。

對于實現(xiàn)這一功能的核心技術(shù),金琛做進一步解釋說,Graphcore 采用 PyTorch 里的 jit.trace 機制對計算圖進行編譯,轉(zhuǎn)化為 IPU 和 PyTorch 兼容的表達格式,最后用 Graphcore 自研框架 PopART 后端的 audiff 功能自動生成反向圖,便可以實現(xiàn)同一個模型在不同平臺的無差別運行。

目前,PyTorch 因其直觀易懂、靈活易用等優(yōu)勢受到開發(fā)者的廣泛喜愛和應(yīng)用。Poplar SDK 1.4 增加了對 PyTorch 的支持,策略上是希望用戶在 IPU 上也能體驗 PyTorch,讓用戶多一個轉(zhuǎn)戰(zhàn) IPU 的理由。不過目前英偉達的 GPU 已經(jīng)在 AI 計算領(lǐng)域占據(jù)大部分市場,此時 IPU 能夠提供的價值、轉(zhuǎn)場到 IPU 的成本等,都是用戶所要考慮的問題。

在遷移成本上,盧濤表示,經(jīng)過幾年來對 Poplar SDK 的打磨,現(xiàn)在從 GPU 到 IPU 的軟硬件遷移難度已經(jīng)比大家認為的小得多。

金琛補充道,在訓(xùn)練上,針對一個不太復(fù)雜的模型,一般一周可以遷移完成,對于復(fù)雜的模型大概需要兩周;在推理上,基本上是 1-2 天的工作量。

談及性能,盧濤表示:“IPU 在訓(xùn)練推理、語音、圖像模型處理上基本全面超越 GPU。” 不過他也坦言:“不能說 100% 超越了 GPU,因為算法模型確實非常多,比如說語音有不同的語音模型、圖像也是有不同的圖像模型。”

未來:持續(xù)優(yōu)化性能,進一步壓縮遷移成本

IPU 在機器學(xué)習(xí)性能上的明顯優(yōu)勢是不可否認的,但前有身強體壯且努力奔跑的巨頭英偉達,Graphcore 更是一刻也不容懈怠。盧濤在溝通會上也多次提到,“目前 Graphcore 面對的壓力最主要還是來自英偉達”。

“重壓” 之下,Graphcore 短期內(nèi)的計劃是聚焦在數(shù)據(jù)中心高性能訓(xùn)練和推理市場上,持續(xù)打磨 IPU 和軟件平臺,持續(xù)優(yōu)化性能和提高可用性。盧濤說,“只有在我們聚焦的領(lǐng)域跑得更快,Graphcore 和英偉達之間的距離才會越來越短,甚至在某些領(lǐng)域超過英偉達”。

他還表示,Graphcore 希望未來數(shù)年內(nèi),能在數(shù)據(jù)中心的 AI 訓(xùn)練、推理批量部署、以及發(fā)貨和體量上做到除英偉達以外的另一個頭部地位。

為實現(xiàn)該目標(biāo),Graphcore 也將從增加 AI 框架支持、以及模型覆蓋兩個維度著手,以期進一步減少用戶的遷移成本。此外,除目前 AI 應(yīng)用最廣泛的互聯(lián)網(wǎng)和云計算兩個場景外,盧濤表示公司明年還將在金融、汽車、智慧醫(yī)療、智慧教育、智慧城市和政府服務(wù)等領(lǐng)域,至少突破一到兩個比較主流的領(lǐng)域。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4936

    瀏覽量

    131083
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5201

    瀏覽量

    73418
  • IPU
    IPU
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    15792
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案

    中型數(shù)據(jù)中心的定義與特點 中型數(shù)據(jù)中心通常服務(wù)于中大型企業(yè)、科研機構(gòu)或地方行業(yè)節(jié)點,具備50至200個機柜,部署多臺服務(wù)器、交換設(shè)備、存儲系統(tǒng)與光通信鏈路等,強調(diào)高帶寬、低延遲與高可用性。關(guān)鍵設(shè)備
    發(fā)表于 07-01 16:33

    施耐德電氣發(fā)布數(shù)據(jù)中心高密度AI集群部署解決方案

    在人工智能(AI)驅(qū)動的產(chǎn)業(yè)革命浪潮中,數(shù)據(jù)中心正迎來深刻變革。面對迅猛增長的人工智能算力需求,部署高密度AI集群已成為數(shù)據(jù)中心發(fā)展的必然選
    的頭像 發(fā)表于 04-19 16:54 ?760次閱讀
    施耐德電氣發(fā)布<b class='flag-5'>數(shù)據(jù)中心</b>高密度<b class='flag-5'>AI</b>集群<b class='flag-5'>部署</b>解決方案

    是德科技推出AI數(shù)據(jù)中心構(gòu)建器以驗證和優(yōu)化網(wǎng)絡(luò)架構(gòu)和主機設(shè)計

    : KEYS )推出Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器,這是一款先進的軟件套件,通過模擬真實工作負載來評估新算法、組件和協(xié)議對AI訓(xùn)練性能的影響。KAI
    的頭像 發(fā)表于 04-10 08:50 ?264次閱讀

    是德科技推出AI數(shù)據(jù)中心構(gòu)建器

    是德科技(NYSE:KEYS)推出Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器,這是一款先進的軟件套件,通過模擬真實工作負載來評估新算法、組件和協(xié)議對AI訓(xùn)練性能的影響。KAI
    的頭像 發(fā)表于 04-07 11:06 ?482次閱讀

    適用于數(shù)據(jù)中心AI時代的800G網(wǎng)絡(luò)

    ,成為新一代AI數(shù)據(jù)中心的核心驅(qū)動力。 AI時代的兩大數(shù)據(jù)中心AI工廠與AI
    發(fā)表于 03-25 17:35

    DeepSeek推動AI算力需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI算力需求正以前所未有的速度增長。DeepSeek等大模型的訓(xùn)練推理任務(wù)對算力的需求持續(xù)攀升,直接推動了服務(wù)器、光通信設(shè)備以及數(shù)據(jù)中心基礎(chǔ)設(shè)施的升級。特
    發(fā)表于 03-25 12:00

    華為全新升級星河AI數(shù)據(jù)中心網(wǎng)絡(luò)

    在華為中國合作伙伴大會2025期,以 “星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時代新動能”為主題的數(shù)據(jù)中心網(wǎng)絡(luò)分論壇圓滿落幕。本次論壇匯聚了來自全國
    的頭像 發(fā)表于 03-24 14:46 ?452次閱讀

    Cadence顛覆AI數(shù)據(jù)中心設(shè)計

    日前舉辦的英偉達 GTC 2025 開發(fā)者大會匯聚了眾多行業(yè)精英,共同探討人工智能的未來。而人工智能正在重塑全球數(shù)據(jù)中心的格局。據(jù)預(yù)測,未來將有 1 萬億美元用于 AI 驅(qū)動的
    的頭像 發(fā)表于 03-21 15:43 ?428次閱讀

    摩爾線程GPU原生FP8計算助力AI訓(xùn)練

    并行訓(xùn)練推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線程是國內(nèi)率先原生支持FP8計算精度的國產(chǎn)GPU企業(yè),此次開源不僅為AI
    的頭像 發(fā)表于 03-17 17:05 ?588次閱讀
    摩爾線程<b class='flag-5'>GPU</b>原生FP8計算助力<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    ”“大模型圈的大黑馬”“硅谷震驚了”“來自中國的學(xué)霸級AI”…… 從智能手機到自動駕駛,從數(shù)據(jù)中心到物聯(lián)網(wǎng),F(xiàn)PGA 正悄然改變著我們的生活。未來,F(xiàn)PGA 又將如何塑造世界?DeepSeek 帶你一起
    發(fā)表于 03-03 11:21

    AI推理帶火的ASIC,開發(fā)成敗在此一舉!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)去年年底,多家大廠爆出開發(fā)數(shù)據(jù)中心ASIC芯片的消息,包括傳聞蘋果與博通合作開發(fā)面向AI推理的ASIC,亞馬遜也在年底公布了其AI?ASIC的應(yīng)用實例,展
    的頭像 發(fā)表于 03-03 00:13 ?3215次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>帶火的ASIC,開發(fā)成敗在此一舉!

    GPU是如何訓(xùn)練AI大模型的

    AI模型的訓(xùn)練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數(shù)等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU
    的頭像 發(fā)表于 12-19 17:54 ?713次閱讀

    超云亮相2024數(shù)據(jù)中心標(biāo)準大會,展示AI全棧推理硬件創(chuàng)新成果

    11月20日-21日,CDCC?2024第十二屆數(shù)據(jù)中心標(biāo)準大會在北京國家會議中心隆重召開。作為數(shù)據(jù)中心行業(yè)規(guī)模最大的高端會議,本屆大會以“AI之光,照耀
    的頭像 發(fā)表于 11-22 09:54 ?467次閱讀
    超云亮相2024<b class='flag-5'>數(shù)據(jù)中心</b>標(biāo)準大會,展示<b class='flag-5'>AI</b>全棧<b class='flag-5'>推理</b>硬件創(chuàng)新成果

    華迅光通AI計算加速800G光模塊部署

    近年來,在人工智能計算需求不斷增長的推動下,對GPU和其他計算硬件的需求急劇飆升。僅今年一年,英偉達的股價就上漲了200%以上,這一點顯而易見。此外,由于數(shù)據(jù)中心的人工智能訓(xùn)練需要高速數(shù)據(jù)
    發(fā)表于 11-13 10:16

    AI時代,我們需要怎樣的數(shù)據(jù)中心AI重新定義數(shù)據(jù)中心

    超過60%的中國企業(yè)計劃在未來12至24個月內(nèi)部署生成式人工智能。AI、模型的構(gòu)建,將顛覆數(shù)據(jù)中心基礎(chǔ)設(shè)施的建設(shè)、運維和運營。一個全新的數(shù)據(jù)中心
    發(fā)表于 07-16 11:33 ?1078次閱讀
    <b class='flag-5'>AI</b>時代,我們需要怎樣的<b class='flag-5'>數(shù)據(jù)中心</b>?<b class='flag-5'>AI</b>重新定義<b class='flag-5'>數(shù)據(jù)中心</b>
    主站蜘蛛池模板: 织金县| 磐安县| 内江市| 甘南县| 屏边| 锦屏县| 尤溪县| 全椒县| 长岛县| 攀枝花市| 北京市| 余江县| 丹江口市| 万全县| 大庆市| 太和县| 讷河市| 镇宁| 邢台市| 陈巴尔虎旗| 洪泽县| 闸北区| 锡林郭勒盟| 罗田县| 镇平县| 青州市| 南宫市| 富民县| 北海市| 留坝县| 万山特区| 牟定县| 团风县| 宁安市| 皮山县| 年辖:市辖区| 旬邑县| 吴川市| 宁都县| 库尔勒市| 噶尔县|