Dactyl AI的研究人員成功研究出一種自學(xué)算法,它能讓機(jī)器人的手具有很高的靈活性。他們研究出的算法使機(jī)器手能靈活地操縱一個(gè)立方體,這個(gè)過程在計(jì)算機(jī)模擬中相當(dāng)于進(jìn)行了百年的練習(xí)(盡管實(shí)際只有幾天的時(shí)間)。
機(jī)器人的手還遠(yuǎn)不及人類的敏捷,而且如果想應(yīng)用在工廠或倉(cāng)庫(kù)里也顯得太笨拙了。即便如此,這項(xiàng)研究依然顯示了機(jī)器學(xué)習(xí)的潛力。它還表明,有一天,機(jī)器人可能會(huì)在虛擬世界中自學(xué)新技能,這將大大加快編程或訓(xùn)練它們的進(jìn)程。
這個(gè)機(jī)器人系統(tǒng)被稱為“Dactyl”,是由位于硅谷的非營(yíng)利組織OpenAI的研究人員開發(fā)的。它使用了一個(gè)來自英國(guó)公司稱為“影子”的現(xiàn)成的機(jī)器手,一個(gè)普通的相機(jī),以及一個(gè)已經(jīng)掌握了一個(gè)龐大的多人在線視頻游戲的DotA算法,它使用了同樣的自學(xué)方法。
該算法使用一種稱為強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù)。Dactyl的任務(wù)是操縱一個(gè)立方體,把不同的面翻到上面來。通過不斷的試錯(cuò),會(huì)產(chǎn)生預(yù)期的結(jié)果。
視頻顯示,Dactyl能夠非常敏捷地旋轉(zhuǎn)立方體。它自動(dòng)地找出了人類常用的幾個(gè)抓點(diǎn)。但這項(xiàng)研究也顯示了人工智能還有很長(zhǎng)的路要走:在經(jīng)過了數(shù)百年的虛擬訓(xùn)練之后,機(jī)器人成功地操縱了魔方的概率只有13/50,這遠(yuǎn)遠(yuǎn)超過了兒童所需要的時(shí)間。
麻省理工學(xué)院名譽(yù)教授、Rethink Robotics公司的創(chuàng)始人Rodney Brooks表示:“短期內(nèi),它不適合被應(yīng)用于工業(yè)流程,但研究依然是一件好事。” Rethink Robotics公司是一家生產(chǎn)更智能工業(yè)機(jī)器人的初創(chuàng)公司。
強(qiáng)化學(xué)習(xí)的靈感來自于動(dòng)物通過積極反饋學(xué)習(xí)的方式。它最初在幾十年前就被提出了,但隨著人工神經(jīng)網(wǎng)絡(luò)的進(jìn)步,在最近幾年才被證明是可行的。Alphabet旗下的DeepMind利用強(qiáng)化學(xué)習(xí)技術(shù)創(chuàng)建了AlphaGo。這是一個(gè)計(jì)算機(jī)程序,它學(xué)會(huì)了高超的技能來玩極其復(fù)雜和微妙的棋盤游戲。
其他機(jī)器人研究人員對(duì)這種方法進(jìn)行了一段時(shí)間的測(cè)試,但由于模仿現(xiàn)實(shí)世界的復(fù)雜性和不可預(yù)測(cè)性,他們一直難有突破。OpenAI的研究人員通過在虛擬世界中引入隨機(jī)變量來解決這個(gè)問題,這樣機(jī)器人就可以學(xué)習(xí)如何解釋諸如摩擦、機(jī)器人硬件噪音以及立方體部分處于視線之外的問題。
該機(jī)器人背后的工程師之一Alex Ray表示,通過賦予它更強(qiáng)的處理能力和引入更多的隨機(jī)性,可以提高Dactyl的性能。“我認(rèn)為我們還沒有達(dá)到極限,”他說。Ray補(bǔ)充說,目前還沒有計(jì)劃將這項(xiàng)技術(shù)商業(yè)化。他的團(tuán)隊(duì)專注于開發(fā)最強(qiáng)的通用學(xué)習(xí)方法。
“這很難做好,”密歇根大學(xué)專門研究機(jī)器操縱的專家Dmitry Berenson說,“目前還不清楚最新的機(jī)器學(xué)習(xí)方法將會(huì)帶來多大影響。我們付出了很多努力來為特定的任務(wù)提供合適的方法。”但他認(rèn)為,模擬學(xué)習(xí)可能是非常有用的:“如果我們能夠真正地跨越‘現(xiàn)實(shí)差距’,學(xué)習(xí)就會(huì)變得更加容易。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29664瀏覽量
212414 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8500瀏覽量
134420
原文標(biāo)題:在算法中練習(xí)百年后,機(jī)器人的手能比你更靈活嗎?
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書
EtherCAT科普系列(4):EtherCAT技術(shù)在人形機(jī)器人靈巧手領(lǐng)域應(yīng)用

智能,觸手可及:揭秘高靈活、高精度仿生機(jī)器手的操作與實(shí)現(xiàn)

工業(yè)機(jī)器人工作站的建設(shè)意義
天創(chuàng)機(jī)器人發(fā)布全球首款防爆人形機(jī)器人“天魁1號(hào)”
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊
《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊
焊接機(jī)器人六個(gè)軸分別是什么作用

應(yīng)用于人形手機(jī)器人超小型HarmonicDrive哈默納科減速機(jī)

工業(yè)機(jī)器人常用的編程方式
ROS讓機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!
機(jī)器人神經(jīng)網(wǎng)絡(luò)系統(tǒng)的特點(diǎn)包括
OPSL 優(yōu)勢(shì)1:波長(zhǎng)靈活性

評(píng)論