近日,北京大學(xué)與智元機器人的聯(lián)合實驗室有了重大成果,北?攜?智元機器?團隊提出 OmniManip 架構(gòu)。
在具身智能領(lǐng)域,將視覺語言基礎(chǔ)模型(VLMs)應(yīng)用于機器人實現(xiàn)通用操作一直是核心問題。目前存在兩大挑戰(zhàn),一是VLMs缺乏精確3D理解能力,二是難以將高層次推理轉(zhuǎn)化為機器人低層次動作。
為解決這些難題,OmniManip架構(gòu)應(yīng)運而生。它基于以對象為中心的3D交互基元,把VLM的高層次推理能力轉(zhuǎn)化為機器人的低層次高精度動作。針對大模型幻覺和真實環(huán)境操作的不確定性,OmniManip引入了VLM規(guī)劃和機器人執(zhí)行的雙閉環(huán)系統(tǒng)設(shè)計。
OmniManip的關(guān)鍵設(shè)計亮點頗多,包括基于VLM的任務(wù)解析,可將復(fù)雜任務(wù)分解為多個明確主動物體、被動物體和動作類型的結(jié)構(gòu)化階段。還有閉環(huán)機器人執(zhí)行,通過物體6D姿態(tài)跟蹤器實時更新物體位姿,轉(zhuǎn)換為機械臂操作軌跡。
-
機器人
+關(guān)注
關(guān)注
213文章
29664瀏覽量
212442 -
語言模型
+關(guān)注
關(guān)注
0文章
561瀏覽量
10758
發(fā)布評論請先 登錄
宇樹科技攜兩款機器人亮相2025GDC
寧德時代自研機器人團隊成立,探索多元科技領(lǐng)域
字節(jié)豆包大模型團隊提出稀疏模型架構(gòu)
字節(jié)豆包大模型團隊推出UltraMem稀疏架構(gòu)
寧德時代自研機器人團隊成立
機器視覺廠商博視像元完成近億元A+輪融資
智元與匯川加碼,機器人如何利好電機市場?
《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型
走進北大 | 算能RISC-V通用處理器設(shè)計成功開課

“0元購”智元靈犀X1機器人,軟硬件全套圖紙和代碼全公開!資料免費下載!
飛利浦家電全球首席執(zhí)行官攜全球高層團隊來華 持續(xù)看好中國市場

【「大模型時代的基礎(chǔ)架構(gòu)」閱讀體驗】+ 未知領(lǐng)域的感受
AMD贊助多支FIRST機器人競賽團隊
軟通動力與智元機器人攜手亮相世界機器人大會

評論