電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025年6月6日,面壁智能CEO李大海在北京智源大會(huì)上發(fā)布有史以來最具想象力的面壁小鋼炮模型MiniCPM4.0,代號(hào)“前進(jìn)四”,開源兩個(gè)版本,8B閃電稀疏版和0.5B最強(qiáng)小小鋼炮。

李大海表示,面壁智能是第一個(gè)把全模態(tài)模型帶到端側(cè)的公司。面壁智能小鋼炮,旨在把大模型放到離用戶最近的地方,做高效的端側(cè)智能。
MiniCPM4.0最大的特點(diǎn)——快
2019年面壁智能超前入局大模型,發(fā)布世界首個(gè)知識(shí)增強(qiáng)大模型ERNE,2020年發(fā)布國內(nèi)首個(gè)中文大模型CPM-1,2021年發(fā)布持續(xù)學(xué)習(xí)發(fā)模型CPM-2,2022年發(fā)布可控生成大模型CPM-3;2023年,面壁智能又發(fā)布CPM-Bee多語言百億大模型,之后還發(fā)布了第三代千億參數(shù)多模態(tài)大模型CPM-Cricket,評(píng)分超越GPT-3.5,邏輯能力比肩GPT-4。
2024年面壁智能領(lǐng)先走向端側(cè)智能。2月發(fā)布MiniCPM-2B旗艦級(jí)端側(cè)模型;4月發(fā)布MiniCPM 2.0;9月發(fā)布MiniCPM-V 2.6,在端側(cè)性能實(shí)現(xiàn)全面對(duì)標(biāo) GPT-4V;12月發(fā)布MiniCPM 3.0,在包括自然語言理解、知識(shí)、代碼、數(shù)學(xué)等多項(xiàng)能力上超越OpenAI的 GPT-3.5;2025年1月,面壁智能發(fā)布MiniCPM-o 2.6端側(cè)全模態(tài)模型,性能比肩GPT-4o;2025年3月發(fā)布cpmGO,首個(gè)純端側(cè)智能體助手。

李大海介紹,面壁智能端側(cè)大模型面壁小鋼炮包括基座模型MiniCPM、旗艦多模態(tài)模型MiniCPM-V、旗艦全模態(tài)模型MiniCPM-o。截至目前,面壁小鋼炮旗艦端側(cè)大模型有超過1000萬下載量。李大海表示:“這是千千萬萬開發(fā)者對(duì)我們的認(rèn)可,未來還會(huì)持續(xù)發(fā)布更好的端側(cè)大模型,賦能智能硬件的創(chuàng)新和開發(fā)。”

“這次發(fā)布的面壁小鋼炮模型MiniCPM4.0版本,最大的特點(diǎn)就是快。”李大海談到,“相比其他模型,MiniCPM4.0-8B僅22%訓(xùn)練開銷,在同等參數(shù)下,性能更強(qiáng),可對(duì)標(biāo)Qwen3-8B,超越Gemma3-12B。”
MiniCPM4-MCP支持15個(gè)主流應(yīng)用,包括Airbnb、Github mcp、Slack、PPTs、PowerPoint、office-Word-Mcp-Server、Computer Use、Desktop-commander、File_system、OpenAI Whisper等;MiniCPM4-Survey端側(cè)版表現(xiàn)比肩DeepResearch。

面壁小鋼炮正在進(jìn)行廣泛的生態(tài)適配,適配主流芯片與開源框架部署,芯片如括華為、英特爾、聯(lián)發(fā)科、高通;開源框架如LLM、LlamaFactory、AutoGPT、SGland等。李大海強(qiáng)調(diào),依托分塊稀疏注意力機(jī)制,MiniCPM4.0在英特爾平臺(tái)上推理深度優(yōu)化實(shí)現(xiàn)兩倍加速。
多維度技術(shù)創(chuàng)新——架構(gòu)高效、推理高效
MiniCPM4.0之所以能夠做到又快又好,源于系統(tǒng)級(jí)層層效率優(yōu)化,包括四個(gè)層面:架構(gòu)高效、推理高效、學(xué)習(xí)高效、數(shù)據(jù)高效。

架構(gòu)高效方面,MiniCPM4.0采用InfLLM升級(jí)版InfLLM 2.0稀疏注意力結(jié)構(gòu)。李大海介紹說,稀疏度越高,計(jì)算量越小,速度越快。傳統(tǒng)Transformer模型每token需和序列中所有token進(jìn)行相關(guān)性計(jì)算逐字重復(fù)計(jì)算,效率低下。InfLLM 稀疏注意力機(jī)制,對(duì)文本分塊分區(qū)域處理,只對(duì)最具相關(guān)性重點(diǎn)區(qū)城進(jìn)行注意力計(jì)算“抽查”,更高效。
而且MiniCPM4.0采用高效雙頻換擋,即長文本用稀疏,短文本用稠密。

推理高效方面,面壁智能自研全套端側(cè)高性能推理框架。CPM.cu自研極速端側(cè)推理框架,稀疏、投機(jī)和量化的高效結(jié)合,F(xiàn)R-Spec輕量化投機(jī)采樣,并給小模型減負(fù)加速,使得速度提升5倍;BitCPM極致低位寬量化,端側(cè)極致內(nèi)存容量友好,4-bit量化達(dá)業(yè)界SOTA等級(jí),瘦身90%;Arklnfer自研跨平臺(tái)部署框架,面向多平臺(tái)端側(cè)芯片極致優(yōu)化,跨平臺(tái)高效投機(jī)采樣和限制解碼,端側(cè)多平臺(tái) ModelZoo絲滑使用,速度提升2倍。
李大海表示,與云端不同,云端多采用英偉達(dá)、昇騰的芯片,而端側(cè)較為復(fù)雜,這種跨平臺(tái)部署框架對(duì)于大模型端側(cè)部署來說就極為重要。在他看來,面壁智能新帶來的面壁小鋼炮模型MiniCPM4.0,在多項(xiàng)技術(shù)的加持下,使用更少的數(shù)據(jù),需要更少的訓(xùn)練、更少的算力,因而成本也會(huì)下降,這有助于大模型能在更多場(chǎng)景實(shí)現(xiàn)落地。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
模型
+關(guān)注
關(guān)注
1文章
3499瀏覽量
50085 -
云模型
+關(guān)注
關(guān)注
0文章
10瀏覽量
7086
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
恩智浦技術(shù)賦能下一代家庭能源管理系統(tǒng)
2024年11月發(fā)布了Matter 1.4版本,其中一大亮點(diǎn)是它極大地?cái)U(kuò)展了對(duì)家庭能源管理系統(tǒng) (HEMS) 的支持。Matter 1.3引入了能源報(bào)告功能,實(shí)現(xiàn)大型家電和供電設(shè)備能源管理用例,而Matter 1.4則更進(jìn)一步,
德賽西威與面壁智能發(fā)布端側(cè)大模型語音交互方案
日前,全球領(lǐng)先的移動(dòng)出行科技公司德賽西威與端側(cè)大模型技術(shù)領(lǐng)軍企業(yè)面壁智能共同發(fā)布業(yè)界首個(gè)基于高通
中科創(chuàng)達(dá)與面壁智能達(dá)成戰(zhàn)略合作
近日,全球領(lǐng)先的智能操作系統(tǒng)及端側(cè)智能產(chǎn)品和技術(shù)提供商中科創(chuàng)達(dá)(股票代碼:300496)與人工智能大模型
英特爾與面壁智能宣布建立戰(zhàn)略合作伙伴關(guān)系,共同研發(fā)端側(cè)原生智能座艙,定義下一代車載AI
今日,英特爾與面壁智能簽署合作備忘錄。雙方宣布達(dá)成戰(zhàn)略級(jí)合作伙伴關(guān)系,旨在打造端側(cè)原生智能座艙,定義下一代車載AI。目前,雙方已合作推出“英

首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
AI巨頭強(qiáng)強(qiáng)聯(lián)手,勢(shì)必為智能體化AI體驗(yàn)時(shí)代按下超級(jí)加速鍵。
AI終端的下一步是“普適智能”,而不是“極限性能”。聯(lián)發(fā)科憑借天璣9400+強(qiáng)悍的端
發(fā)表于 04-13 19:52
廣和通CES 2025發(fā)布Fibocom AI Stack,賦能千行百業(yè)端側(cè)應(yīng)用
近日盛大舉行的國際消費(fèi)電子產(chǎn)品展覽會(huì)(CES 2025)上,廣和通隆重發(fā)布了其創(chuàng)新的Fibocom AI Stack解決方案。這一方案的發(fā)布,標(biāo)志著廣和通在推動(dòng)端
黑芝麻智能端到端算法參考模型公布
黑芝麻智能計(jì)劃推出支持華山及武當(dāng)系列芯片的端到端算法參考方案。該方案采用One Model架構(gòu),并在決策規(guī)劃單元引入了VLM視覺語言大模型和PRR行車規(guī)則的概率化表征子模塊,

谷歌計(jì)劃12月發(fā)布Gemini 2.0模型
近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)楣雀柙谌斯?b class='flag-5'>智能領(lǐng)域
科大訊飛發(fā)布訊飛星火4.0 Turbo大模型及星火多語言大模型
近日,科大訊飛正式推出了其最新研發(fā)成果——訊飛星火4.0 Turbo大模型。這一發(fā)布不僅標(biāo)志著科大訊飛在人工智能領(lǐng)域的又一次重大突破,也預(yù)示
聯(lián)發(fā)科天璣9400發(fā)布:能效比與端側(cè)AI引領(lǐng)移動(dòng)芯片行業(yè)革新
在AI大模型的推動(dòng)下,智能手機(jī)市場(chǎng)的高端化進(jìn)程進(jìn)一步加速,旗艦機(jī)型的競爭已不再單純依賴于“大力飛磚”式的極限性能比拼,而是更加注重綜合素質(zhì)的提升。特別是在手機(jī)芯片領(lǐng)域,高性能與低功耗、高能效比的平衡成為了新的競爭焦點(diǎn)。
通過展頻進(jìn)一步優(yōu)化EMI
電子發(fā)燒友網(wǎng)站提供《通過展頻進(jìn)一步優(yōu)化EMI.pdf》資料免費(fèi)下載
發(fā)表于 09-04 09:32
?1次下載

PerfXCloud 重大更新 端側(cè)多模態(tài)模型 MiniCPM-Llama3-V 2.5 閃亮上架
近日,PerfXCloud完成重大更新,上架了面壁小鋼炮 MiniCPM 系列的端側(cè)多模態(tài)模型

三星計(jì)劃10月發(fā)布Galaxy S24 FE,拓展中端AI手機(jī)市場(chǎng)
據(jù)8月14日外媒報(bào)道,三星電子正積極籌備在今年10月推出其全新的Galaxy S24 FE手機(jī),并計(jì)劃在隨后的12月發(fā)布Galaxy A16手機(jī),以此進(jìn)一步鞏固和拓展其在中端AI手機(jī)市場(chǎng)的地位。這
基于AX650N芯片部署MiniCPM-V 2.0高效端側(cè)多模態(tài)大模型
今年4月份,面壁智能&清華大學(xué)自然語言處理實(shí)驗(yàn)室推出MiniCPM系列的最新多模態(tài)版本MiniCPM-V 2.0。該模型基于

評(píng)論