微軟已經(jīng)為深度學(xué)習(xí)優(yōu)化庫(kù) DeepSpeed 申請(qǐng)了商標(biāo)保護(hù)。該商標(biāo)于2020年12月8日提交,其中提到“為人工智能處理和深度學(xué)習(xí)提供臨時(shí)使用的在線不可下載的計(jì)算機(jī)軟件”,這表明微軟可能在考慮通過在線云服務(wù)提供 DeepSpeed。
該庫(kù)于今年 2 月發(fā)布,可以在適度的硬件上訓(xùn)練大規(guī)模的人工智能模型。它只需要使用 800 塊 Nvidia V100 顯卡就可以創(chuàng)建具有萬億參數(shù)的深度學(xué)習(xí)模型,是目前世界上最大的模型的 5 倍多。如果沒有DeepSpeed,同樣的任務(wù)需要 4000 塊 Nvidia A100(性能比 V100 快2.5倍),而且事件縮短了 100 多天。
在 GPT-3 顯示模型在神經(jīng)網(wǎng)和數(shù)據(jù)集越大的情況下繼續(xù)改進(jìn)后,這個(gè)工具特別有用。然而,這確實(shí)有可能將最新的創(chuàng)新推到資源較少的小型團(tuán)隊(duì)的范圍之外,但DeepSpeed已經(jīng)允許這些團(tuán)隊(duì)以最小的硬件與更大的服務(wù)競(jìng)爭(zhēng)。轉(zhuǎn)移到云處理可能會(huì)使大型模型AI訓(xùn)練更容易獲得。
責(zé)任編輯:haq
-
微軟
+關(guān)注
關(guān)注
4文章
6682瀏覽量
105623 -
人工智能
+關(guān)注
關(guān)注
1806文章
48960瀏覽量
248537 -
云服務(wù)
+關(guān)注
關(guān)注
0文章
855瀏覽量
39661
發(fā)布評(píng)論請(qǐng)先 登錄
有可能在 FX3 GPIF2 中創(chuàng)建兩個(gè)獨(dú)立的狀態(tài)機(jī)嗎?
ads8568采集基本正常,但可能在某一次上電后,出現(xiàn)不工作的狀態(tài),為什么?
微軟最新消息:微軟入歐洲云服務(wù)提供商協(xié)會(huì) 微軟執(zhí)行副總裁將離職
微軟調(diào)整協(xié)議:OpenAI獲準(zhǔn)使用其他云服務(wù)
微軟調(diào)整協(xié)議,OpenAI獲準(zhǔn)使用其他云服務(wù)
華為 Flexus 云服務(wù)器打造 Laverna 在線筆記應(yīng)用

彈性云服務(wù)器通過什么存儲(chǔ)數(shù)據(jù)和文件?
通過工業(yè)智能網(wǎng)關(guān)實(shí)現(xiàn)與微軟Azure IoT中心快速配置操作

評(píng)論