電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)去年底以來(lái)國(guó)產(chǎn)GPU廠商陸續(xù)開(kāi)啟上市輔導(dǎo),最近摩爾線程、沐曦IPO獲受理。另消息稱,壁仞科技已完成新一輪約15億元融資,并計(jì)劃最快今年8月向港交所申請(qǐng)IPO,籌備赴港上市。
根據(jù)Jon Peddie Research的數(shù)據(jù),獨(dú)立GPU市場(chǎng)英偉達(dá)一家獨(dú)大,近年來(lái)持續(xù)維持超80%的市場(chǎng)份額,而AMD公司則占據(jù)剩余近20%的市場(chǎng)份額。自人工智能市場(chǎng)爆發(fā)式增長(zhǎng)以來(lái),英偉達(dá)憑借優(yōu)越的產(chǎn)品性能和完善的CUDA 生態(tài)筑造了護(hù)城河,領(lǐng)先優(yōu)勢(shì)不斷擴(kuò)大。根據(jù)TechInsights 數(shù)據(jù),在GPU市場(chǎng),2023年全球應(yīng)用于智算中心的GPU總出貨量達(dá)到385萬(wàn)顆,相比2022年的267萬(wàn)顆增長(zhǎng)了44.2%。其中,英偉達(dá)面向智算中心市場(chǎng)的GPU出貨量達(dá)到376萬(wàn)顆,市場(chǎng)份額超過(guò)90%。
隨著國(guó)內(nèi)GPU廠商經(jīng)歷前期研發(fā)、產(chǎn)品市場(chǎng)驗(yàn)證、走向資本市場(chǎng)等動(dòng)作,國(guó)內(nèi)GPU產(chǎn)品和應(yīng)用生態(tài)越來(lái)越強(qiáng),勢(shì)必在GPU市場(chǎng)爭(zhēng)取到一定的份額。
營(yíng)收規(guī)模
近年來(lái),摩爾線程把握市場(chǎng)發(fā)展機(jī)遇,專注于技術(shù)研發(fā)和產(chǎn)品創(chuàng)新,持續(xù)推出具有行業(yè)競(jìng)爭(zhēng)力的全功能GPU產(chǎn)品。2024年公司營(yíng)業(yè)收入超4億元,近三年?duì)I業(yè)收入復(fù)合增長(zhǎng)率超過(guò)200%,持續(xù)經(jīng)營(yíng)能力不斷提升。
報(bào)告期各期,公司歸屬于母公司所有者的凈利潤(rùn)分別為-183,955.22 萬(wàn)元、-167,331.03 萬(wàn)元及-149,193.77 萬(wàn)元,扣除非經(jīng)常性損益后歸屬于母公司所有者 的凈利潤(rùn)分別為-141,200.30 萬(wàn)元、-169,066.22 萬(wàn)元和-150,690.72 萬(wàn)元。2022年至2024年,公司營(yíng)業(yè)收入由0.46億元增長(zhǎng)至4.38億元,復(fù)合增長(zhǎng)率為208.44%。報(bào)告期內(nèi)公司研發(fā)費(fèi)用金額較高,報(bào)告期內(nèi)分別為111,649.37 萬(wàn)元、133,442.57 萬(wàn)元、135,868.90 萬(wàn)元。合計(jì)研發(fā)投入金額380,960.84萬(wàn)元;發(fā)行人最近3年累計(jì)研發(fā)投入占最近三年累計(jì)營(yíng)業(yè)收入比例為626.03%
沐曦報(bào)告期各期,公司營(yíng)業(yè)收入分別為42.64萬(wàn)元、5,302.12萬(wàn)元、74,307.16萬(wàn) 元和 32,041.53 萬(wàn)元,歸屬于母公司所有者的凈利潤(rùn)分別為-77,696.52 萬(wàn)元、-87,115.82 萬(wàn)元、-140,887.94 萬(wàn)元和-23,251.22 萬(wàn)元,尚未實(shí)現(xiàn)盈利。
報(bào)告期內(nèi),沐曦主要收入來(lái)源為核心產(chǎn)品訓(xùn)推一體芯片曦云C500系列的銷售。2023 年度、2024 年度和2025 年1-3月,發(fā)行人訓(xùn)推一體芯片曦云C500 系列收入分別為1,546.81萬(wàn)元、72,173.52萬(wàn)元和31,359.27萬(wàn)元,占同期主營(yíng)業(yè)務(wù)收入的比例分別為30.09%、97.28%和97.87%,最近一年一期占比較大。發(fā)行人正在研發(fā)基于國(guó)產(chǎn)供應(yīng)鏈的新一代訓(xùn)推一體芯片曦云 C600 系列和 C700 系列,以及智算推理GPU曦思N系列、圖形渲染GPU曦彩G系列的新產(chǎn)品。
相比于國(guó)際巨頭英偉達(dá)、AMD的營(yíng)業(yè)收入、凈利潤(rùn)、毛利率、研發(fā)投入等,國(guó)內(nèi)廠商都還相去甚遠(yuǎn)。其中2024年海光信息毛利率達(dá)63.72%。不過(guò)可以看到國(guó)內(nèi)企業(yè)研發(fā)投入率高位數(shù),其中沐曦的研發(fā)投入率達(dá)121.24%。
來(lái)源:沐曦招股書(shū)
摩爾線程表示,與國(guó)際龍頭公司英偉達(dá)、AMD等企業(yè)相比,公司在技術(shù)積累、產(chǎn)品性能等方面仍需持續(xù)提升。英偉達(dá)在GPU領(lǐng)域擁有深厚的技術(shù)底蘊(yùn)和豐富的行業(yè)經(jīng)驗(yàn),其產(chǎn)品在性能、兼容性以及超大規(guī)模GPU集群建設(shè)等方面具有較為明顯的技術(shù)優(yōu)勢(shì)和成本優(yōu)勢(shì)。公司產(chǎn)品在部分性能指標(biāo)上已經(jīng)接近或達(dá)到國(guó)際先進(jìn)水平,實(shí)現(xiàn)了對(duì)部分“卡脖子”領(lǐng)域核心產(chǎn)品的突破。
例如,公司MTT S80顯卡的單精度浮點(diǎn)算力性能接近英偉達(dá)RTX 3060;基于公司MTT S5000 產(chǎn)品構(gòu)建的千卡 GPU智算集群效率超過(guò)同等規(guī)模國(guó)外同代系GPU集群計(jì)算效率。公司在國(guó)內(nèi)GPU領(lǐng)域具有一定的技術(shù)優(yōu)勢(shì),基于自主研發(fā)的MUSA架構(gòu),公司率先實(shí)現(xiàn)了在單芯片架構(gòu)上同時(shí)支持AI計(jì)算加速、圖形渲染、物理仿真以 及超高清視頻處理所需計(jì)算能力的突破,推動(dòng)了我國(guó)GPU產(chǎn)業(yè)的自主可控進(jìn)程。
來(lái)源:摩爾線程招股書(shū)
產(chǎn)品技術(shù)
全球龍頭企業(yè)在技術(shù)、市場(chǎng)和生態(tài)方面具有顯著優(yōu)勢(shì)。在架構(gòu)、計(jì)算能力、存儲(chǔ)能力、集群能力和軟件生態(tài)方面,國(guó)內(nèi)外均存在差異。英偉達(dá)和AMD均采用通用型架構(gòu),并進(jìn)行數(shù)次迭代,如英偉達(dá)常見(jiàn)的GPU架構(gòu)包含Ampere架構(gòu)、Hopper架構(gòu)、Blackwell架構(gòu)。AMD常見(jiàn)的有 RDNA 架構(gòu)、CDNA架構(gòu)等。英偉達(dá)及AMD先進(jìn)的計(jì)算架構(gòu)決定了其領(lǐng)先的GPU計(jì)算性能。而國(guó)內(nèi)企業(yè)根據(jù)自身技術(shù)特色沿用了不同的技術(shù)路徑,包括通用型架構(gòu)(GPU)和專用型架構(gòu)(如ASIC),不同公司的架構(gòu)設(shè)計(jì)各有差異。
在計(jì)算能力方面,英偉達(dá)和AMD支持多種混合精度(FP64、FP32、FP16、BF16、FP8、FP4、INT8)等。算力指標(biāo)上,英偉達(dá)主要產(chǎn)品的FP16/BF16在300-2000TFLOPS左右,AMD主要產(chǎn)品的FP16/BF16在300-1,300 TFLOPS左右。
國(guó)內(nèi)企業(yè)支持部分混合精度,大多不支持FP64且對(duì)矩陣計(jì)算的支持程度較低。采用專用型架構(gòu)的企業(yè)通常以支持 FP16、BF16、INT8 為主。算力指標(biāo)上,國(guó)內(nèi)多數(shù)頭部企業(yè)主流在售產(chǎn)品的FP16/BF16在100-300 TFLOPS 左右。
在存儲(chǔ)能力上,緩存方面,英偉達(dá)和AMD 均使用了復(fù)雜的多級(jí)高速緩存架構(gòu),以提升數(shù)據(jù)訪問(wèn)效率,減少延遲。顯存方面,英偉達(dá)和AMD采用高帶寬顯存HBM2e、HBM3及HBM3e,顯存帶寬在2-7TB/s 左右。
國(guó)內(nèi)部分企業(yè)以采用相對(duì)簡(jiǎn)單的緩存架構(gòu)為主。國(guó)內(nèi)企業(yè)結(jié)合自身產(chǎn)品特點(diǎn),分別選擇HBM2e、HBM2、GDDR等顯存類型,顯存帶寬在0.5-2TB/s 左右。
來(lái)源:沐曦招股書(shū)
軟件生態(tài)方面,英偉達(dá)自研 CUDA,擁有成熟完善且全球領(lǐng)先的生態(tài),已建立顯著生態(tài)優(yōu)勢(shì):AMD自研ROCm 并兼容CUDA,軟件生態(tài)較為豐富。國(guó)內(nèi)企業(yè)通常采取自建軟件生態(tài)或應(yīng)用開(kāi)發(fā)、功能調(diào)試和性能調(diào)優(yōu)等核心環(huán)節(jié),多數(shù)國(guó)內(nèi)企業(yè)無(wú)顯著生態(tài)優(yōu)勢(shì),適配和遷移成本較高。
沐曦是國(guó)內(nèi)少數(shù)幾家系統(tǒng)掌握了先進(jìn)制程 GPU芯片及其基礎(chǔ)系統(tǒng)軟件研發(fā)、設(shè)計(jì)和量產(chǎn)技術(shù)的企業(yè)之一,深度積累了GPU IP(包括指令集、 微架構(gòu)等)、GPU SoC、高速互連、GPU軟件等核心技術(shù),打造了自主開(kāi)放、高度兼容國(guó)際主流GPU 生態(tài)(CUDA)的軟件生態(tài)體系,能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,在底層技術(shù)上擺脫對(duì)國(guó)外算力資產(chǎn)的依賴,為推進(jìn)新質(zhì)生產(chǎn)力發(fā)展提供動(dòng)力引擎。
沐曦自主構(gòu)建的MXMACA軟件棧不僅擁有統(tǒng)一、完整且高效的全棧式工具鏈,涵蓋應(yīng)用開(kāi)發(fā)、功能調(diào)試和性能調(diào)優(yōu)等核心環(huán)節(jié),同時(shí)高度兼容GPU行業(yè)國(guó)際主流CUDA生態(tài),能夠擁抱全球開(kāi)發(fā)者豐富的開(kāi)源成果,具有較高的易用性和遷移效率,在通用性和靈活性上具備獨(dú)特的競(jìng)爭(zhēng)力。
摩爾線程構(gòu)建的AI+圖形融合的GPU統(tǒng)一驅(qū)動(dòng)架構(gòu),實(shí)現(xiàn)跨操作系統(tǒng)與異構(gòu)硬件的無(wú)縫兼容。憑借自主研發(fā)的MUSA Unified Driver核心模塊,驅(qū)動(dòng)層同時(shí)支持Windows、麒麟、統(tǒng)信、OpenEuler、龍蜥等操作系統(tǒng)及Intel/AMD/鯤鵬/海光/飛騰等CPU平臺(tái),在統(tǒng)一代碼庫(kù)中整合AI張量計(jì)算與圖形渲染管線,使DirectX、 Vulkan 圖形API與MUSA AI計(jì)算框架共享底層硬件資源調(diào)度。
編譯器技術(shù)通過(guò)多層次中間表示,實(shí)現(xiàn)生態(tài)兼容與性能優(yōu)化雙重突破。基于 LLVM 的前端支持PyTorch Eager 模式腳本、CUDA內(nèi)核代碼與標(biāo)準(zhǔn)SPIR-V著 色器語(yǔ)言混合編譯,后端生成自主指令集的二進(jìn)制碼。
為營(yíng)造低門(mén)檻開(kāi)發(fā)環(huán)境,公司推出MUSA統(tǒng)一編程模型,語(yǔ)法上兼容CUDA C++核心語(yǔ)義和 Triton 語(yǔ)言,內(nèi)置架構(gòu)抽象層能自動(dòng)適配主流 GPU生態(tài),在保持90%以上硬件利用率的前提下,將跨平臺(tái)代碼移植工作量削減90%。軟件開(kāi)發(fā)生態(tài)通過(guò)模塊化SDK體系覆蓋核心技術(shù)需求,MUSA SDK提供超 3,000 個(gè)從設(shè)備級(jí)內(nèi)存管理到分布式訓(xùn)練通信的API接口,封裝muDNN、muBlast、 muFFT、MCCL等主流加速庫(kù)的優(yōu)化實(shí)現(xiàn),并集成自動(dòng)化性能分析工具鏈。
為深度融入現(xiàn)有AI生態(tài),公司構(gòu)建了AI Framework Bridge雙向接口體系,支持PyTorch、DeepSpeed、MegaTron-LM、vLLM、SGLang 等通用AI 框架,助力開(kāi)發(fā)者平滑遷移。 公司專注于自主知識(shí)產(chǎn)權(quán)的MUSA架構(gòu)研發(fā),通過(guò)開(kāi)放API和SDK工具集, 助力開(kāi)發(fā)者和合作伙伴快速集成GPU解決方案。
公司生態(tài)團(tuán)隊(duì)建立了“摩爾學(xué)院”,為開(kāi)發(fā)者提供系統(tǒng)化的學(xué)習(xí)路徑,覆蓋企業(yè)開(kāi)發(fā)者、科研機(jī)構(gòu)及在校學(xué)生,提升開(kāi)發(fā)者對(duì)公司產(chǎn)品的認(rèn)知度和使用能力。 此外,公司搭建了開(kāi)放生態(tài)合作平臺(tái),向開(kāi)發(fā)者和合作伙伴開(kāi)放申請(qǐng)通道,提供定制化的技術(shù)支持、資源共享及聯(lián)合開(kāi)發(fā)機(jī)會(huì),強(qiáng)化生態(tài)系統(tǒng)的持續(xù)優(yōu)化和價(jià)值創(chuàng)造理念。
通過(guò)構(gòu)建完善的生態(tài)系統(tǒng),公司實(shí)現(xiàn)了從產(chǎn)品研發(fā)到市場(chǎng)的全鏈條閉環(huán),增 強(qiáng)了市場(chǎng)競(jìng)爭(zhēng)力。未來(lái),公司將秉持“技術(shù)驅(qū)動(dòng)、生態(tài)賦能、全場(chǎng)景兼容”理念, 發(fā)揮GPU技術(shù)潛力,推動(dòng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型與智能化升級(jí)。
增長(zhǎng)可期
根據(jù)沙利文數(shù)據(jù),隨著AI和大數(shù)據(jù)應(yīng)用的不斷深入,中國(guó)算力規(guī)模呈現(xiàn)出快速增長(zhǎng)態(tài)勢(shì),整體規(guī)模從2020年的136.20 EFLOPs增長(zhǎng)至2024年的617.00 EFLOPs,期間年復(fù)合增長(zhǎng)率為45.9%,預(yù)計(jì)到2029年中國(guó)算力總規(guī)模將達(dá)到3,442.89 EFLOPs,年復(fù)合增長(zhǎng)率達(dá)40.0%。GPU作為實(shí)現(xiàn)算力的基礎(chǔ)硬件之一,在數(shù)據(jù)中心建設(shè)和部署過(guò)程中具有廣泛的配套需求。
根據(jù)弗若斯特沙利文預(yù)測(cè),全球GPU市場(chǎng)規(guī)模預(yù)計(jì)在2029年將達(dá)到36,119.74億元,其中,中國(guó)GPU市場(chǎng)規(guī)模在2029年將達(dá)到13,635.78億元,在全球市場(chǎng)中的市場(chǎng)占比預(yù)計(jì)將從2024年的30.8%提升至2029年的37.8%。
過(guò)去五年,中國(guó)GPU產(chǎn)業(yè)呈現(xiàn)快速增長(zhǎng)態(tài)勢(shì),市場(chǎng)規(guī)模從2020年的384.77億元快速增長(zhǎng)到2024 年的1,638.17 億元。未來(lái),隨著AI的應(yīng)用不斷開(kāi)發(fā),對(duì)于GPU等算力基礎(chǔ)設(shè)施的需求預(yù)計(jì)將會(huì)出現(xiàn)爆發(fā)增長(zhǎng)。
-
gpu
+關(guān)注
關(guān)注
28文章
4937瀏覽量
131128 -
摩爾線程
+關(guān)注
關(guān)注
2文章
234瀏覽量
5326 -
沐曦
+關(guān)注
關(guān)注
0文章
34瀏覽量
1419
發(fā)布評(píng)論請(qǐng)先 登錄
英偉達(dá)殺瘋了!Blackwell橫掃市場(chǎng),AMD、英特爾加入降本浪潮

荷蘭與英偉達(dá)、AMD商討共建人工智能設(shè)施
黃仁勛宣布:豐田與英偉達(dá)攜手打造下一代自動(dòng)駕駛汽車

加速拋棄英偉達(dá),微軟又發(fā)布一顆芯片 #微軟 #英偉達(dá) #半導(dǎo)體 #芯片 #電路知識(shí)
英偉達(dá)計(jì)劃2025年推出基于Arm架構(gòu)的消費(fèi)級(jí)CPU,挑戰(zhàn)英特爾和AMD
軟銀升級(jí)人工智能計(jì)算平臺(tái),安裝4000顆英偉達(dá)Hopper GPU
英偉達(dá)下一代GPU或?qū)⒏挠萌逻B接器

英偉達(dá)Blackwell GPU未來(lái)一年訂單爆滿
英偉達(dá)年度研發(fā)支出超120億美元,為AMD的兩倍之多
英偉達(dá)或明年將革新AI GPU設(shè)計(jì),采用插槽設(shè)計(jì)
英偉達(dá)Blackwell GPU量產(chǎn)加速,Q4營(yíng)收沖刺百億美元大關(guān)

評(píng)論