0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于端到端可操作性學(xué)習(xí)的機(jī)器人操縱框架

CVer ? 來源:北京大學(xué)前沿計(jì)算研究中 ? 2023-01-30 09:55 ? 次閱讀

導(dǎo) 讀

本文是國際機(jī)器人和自動(dòng)化頂級會(huì)議 ICRA 2023入選論文 RLAfford:End-to-end Affordance Learning for Robotic Manipulation 的解讀。這項(xiàng)研究通過使用強(qiáng)化學(xué)習(xí)訓(xùn)練過程中產(chǎn)生的接觸信息來預(yù)測物體可操作性信息,更好地實(shí)現(xiàn)機(jī)器人***任務(wù),并對各種算法以及環(huán)境具有即插即用的能力。

01

研究背景

隨著生活逐漸智能化,通過機(jī)器人與物體交互變得越來越重要。如何讓機(jī)器人學(xué)會(huì)***不同形狀的物體并且學(xué)會(huì)穩(wěn)定有效的交互策略成為了當(dāng)前的研究熱點(diǎn)。近年來,強(qiáng)化學(xué)習(xí)(RL)為這一問題提供了解決方案。然而,在互動(dòng)環(huán)境中學(xué)習(xí)***不同形狀、不同結(jié)構(gòu)、不同功能的三維物體一直是強(qiáng)化學(xué)習(xí)的挑戰(zhàn)。特別是,我們往往很難訓(xùn)練出一個(gè)能夠處理不同語義類別、不同幾何形狀和多樣功能的物體的策略。

最近,視覺可操作性(Visual Affordance)學(xué)習(xí)技術(shù)在提供以物體為中心的信息先驗(yàn)和有效的可操作語義方面展現(xiàn)出巨大的潛力。例如,一個(gè)理想的策略可以通過了解到把手的可操作性來打開一扇門。然而,學(xué)習(xí)視覺可操作性往往需要人類定義的原子動(dòng)作(抓、握、推、拉等動(dòng)作),這限制了適用任務(wù)的范圍。

在本文中,我們提出了 RLAfford。在研究中,我們抓住了智能體與世界交互的最本質(zhì)信息:接觸點(diǎn)信息,來預(yù)測 RL 系統(tǒng)感興趣的物體上的接觸位置(也即物體的可操作性),預(yù)測的信息又反過來指導(dǎo) RL 進(jìn)一步訓(xùn)練。這樣的接觸預(yù)測系統(tǒng)實(shí)現(xiàn)了端到端(End-to-end)的 Visual Affordance 學(xué)習(xí)框架,它可以廣泛地適用于不同類型的***任務(wù)中。

令人興奮的是,我們的框架甚至在多階段(Multi-stage)和多智能體(Multi-agent)的任務(wù)中也能保持有效性。我們在八種類型的***任務(wù)上測試了我們的方法。結(jié)果顯示,我們的方法在成功率上遠(yuǎn)遠(yuǎn)超過了基線(Baseline)算法,同時(shí),我們的方法成功地在現(xiàn)實(shí)世界中成功完成了這八種***任務(wù)。部分VisualAffordance 學(xué)習(xí)結(jié)果如圖1所示。

00a8e546-9fce-11ed-bfe3-dac502259ad0.png

圖1. 輸入一個(gè)物體的點(diǎn)云信息,我們利用 RL 交互過程中的接觸信息來預(yù)測以物體為中心的可操作性信息。圖中顏色越深意味著可操作性越強(qiáng)??梢钥闯?,這樣的信息對于完成物體操作非常有意義。

02

方 法

00b9c15e-9fce-11ed-bfe3-dac502259ad0.png

圖2. 框架結(jié)構(gòu)。

如圖2所示,我們的方案包含兩個(gè)主要模塊。其中 1)操作模塊(Manipulation Module)生成交互軌跡,2)視覺可操作性模塊(Visual Affordance Module)用來學(xué)習(xí)生成基于實(shí)時(shí)點(diǎn)云的可操作性信息(Affordance)。接觸預(yù)測器(Contact Predictor)在兩個(gè)模塊***享,作為它們之間的橋梁。

操作模塊使用接觸預(yù)測器的預(yù)測結(jié)果作為輸入觀察的一部分,同時(shí)預(yù)測的最大值點(diǎn)參與操作模塊的獎(jiǎng)勵(lì)函數(shù)計(jì)算(MPR),以激勵(lì) RL 算法去探索最感興趣的點(diǎn)附近的區(qū)域;

操作模塊通過收集交互中的碰撞信息實(shí)時(shí)生成動(dòng)態(tài)的 Visual Affordance 學(xué)習(xí)目標(biāo)(Dynamic Ground Truth)來訓(xùn)練視覺可操作性模塊。

具體算法結(jié)構(gòu)如圖3所示。

00c6f018-9fce-11ed-bfe3-dac502259ad0.png

圖3. 算法結(jié)構(gòu)。

03

實(shí) 驗(yàn)

00d7ffb6-9fce-11ed-bfe3-dac502259ad0.png

圖4. 頂部:模擬器中的任務(wù)設(shè)置。中間:在端到端訓(xùn)練期間,Visual Affordance Map 的變化以及部分 Visual Affordance 學(xué)習(xí)結(jié)果。底部:真實(shí)世界實(shí)驗(yàn)示意圖。

如圖4所示,我們設(shè)計(jì)了三種類型的***任務(wù):單階段、多階段和多智能體。在所有的任務(wù)中,都要求一個(gè)或兩個(gè)機(jī)械臂來完成對不同物體的特定***任務(wù)。我們使用了 Isaac Gym 物理模擬器、PartNet-Mobility 數(shù)據(jù)集和 VAPO 數(shù)據(jù)集來完成虛擬環(huán)境的實(shí)驗(yàn)。我們也利用了數(shù)字孿生方法在真實(shí)世界中完成了我們設(shè)計(jì)的任務(wù)。最終,我們進(jìn)行了一些消融實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明我們的方法在成功率上遠(yuǎn)遠(yuǎn)超過了基線算法,包括基于 Visual Affordance 的方法和 RL 方法。

04

總 結(jié)

據(jù)我們所知,這是第一項(xiàng)將 Visual Affordance 與 RL 完成端到端的結(jié)合的工作。在 RL 訓(xùn)練中,VisualAffordance可以通過提供額外的觀測和獎(jiǎng)勵(lì)信號來提高策略學(xué)習(xí)的效果。我們的框架通過 RL 訓(xùn)練自動(dòng)學(xué)習(xí)VisualAffordance語義,而不需要額外的演示或人工標(biāo)注。我們方法的簡單性、比所有基線更出色的性能以及廣泛靈活的適用場景,證明了我們的方案的有效性以及對各種算法、環(huán)境具有即插即用的能力,同時(shí)也為解決更多復(fù)雜任務(wù)打開了一種新的思路。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28474

    瀏覽量

    207394
  • 模擬器
    +關(guān)注

    關(guān)注

    2

    文章

    877

    瀏覽量

    43260
  • MPR
    MPR
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    8731

原文標(biāo)題:ICRA 2023 | RLAfford:基于端到端可操作性學(xué)習(xí)的機(jī)器人操縱框架

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    #機(jī)器人基礎(chǔ)原理 奇異及可操作性第1部分

    機(jī)器人
    電子技術(shù)那些事兒
    發(fā)布于 :2022年09月21日 22:52:33

    #機(jī)器人基礎(chǔ)原理 奇異及可操作性第2部分

    機(jī)器人
    電子技術(shù)那些事兒
    發(fā)布于 :2022年09月21日 22:54:43

    水下機(jī)器人便攜式遙控單元設(shè)計(jì)

    進(jìn)行復(fù)雜的坐標(biāo)變換,并將變換結(jié)果和載體狀態(tài)以圖形化的界面生動(dòng)、直觀的顯示出來。這大大提高了水下機(jī)器人在水面上的可操作性,方便每次的水上試驗(yàn)與載體回收。以下我們以AVR系列單片機(jī)ATmega1280和步科
    發(fā)表于 03-08 14:21

    藍(lán)牙控制機(jī)器人

    藍(lán)牙控制機(jī)器人藍(lán)牙控制機(jī)器人(android版,支持2.2及2.2以上系列手機(jī)),內(nèi)有hex文件資料及詳細(xì)說明attach://147401.rar
    發(fā)表于 07-20 09:35

    什么是工業(yè)機(jī)器人

    ,完成對人體有害物料的搬運(yùn)或工藝操作。20世紀(jì)50年代末,美國在機(jī)械手和操作機(jī)的基礎(chǔ)上,采用伺服機(jī)構(gòu)和自動(dòng)控制等技術(shù),研制出有通用的獨(dú)立的工業(yè)用自動(dòng)操作裝置,并將其稱為工業(yè)
    發(fā)表于 01-19 10:58

    智能小車機(jī)器人控制V2.02

    智能小車機(jī)器人控制V2.02
    發(fā)表于 04-12 13:04

    【orangepi zero申請】畫圖機(jī)器人控制

    項(xiàng)目名稱:畫圖機(jī)器人控制試用計(jì)劃:目前做了一個(gè)畫圖機(jī)器人,使用電腦處理圖片和控制的,但是為了增加這個(gè)項(xiàng)目的集成度,打算將控制的軟件安裝在這個(gè)板子上,低廉的成本實(shí)現(xiàn)整個(gè)項(xiàng)目功能。我玩
    發(fā)表于 12-09 09:31

    機(jī)器寵物解決方案開源資料(原理圖+源碼+視頻演示)

    手掌大小的機(jī)器人,它有四只腳而不是輪子。腿式運(yùn)動(dòng)賦予其在非結(jié)構(gòu)化地形上導(dǎo)航的更多自由,并在運(yùn)動(dòng)時(shí)表達(dá)生活的歡樂。這種動(dòng)態(tài)的可操作性以前只能在最好的實(shí)驗(yàn)室或大亨公司的一些豪華機(jī)器人上看到。于是提出了一
    發(fā)表于 10-12 14:38

    深圳視覺對位雕刻機(jī)系統(tǒng),軟件可操作性

    。8、光學(xué)玻璃行業(yè)。視覺對位雕刻機(jī)系統(tǒng)特點(diǎn):1、高精度、高效率、高穩(wěn)定性的視覺對位算法2、使用網(wǎng)口相機(jī)和集成工控機(jī),性能穩(wěn)定可靠3、軟件可操作性好,觸摸屏方便、簡潔4、可根據(jù)客戶具體機(jī)型進(jìn)行定制化的高效
    發(fā)表于 07-22 09:52

    深圳CCD點(diǎn)鉆系統(tǒng),視覺對位算法,可操作性

    、高精度、高效率、高穩(wěn)定性的視覺對位算法2、使用網(wǎng)口相機(jī)和集成工控機(jī),性能穩(wěn)定可靠3、軟件可操作性好,觸摸屏方便、簡潔4、可根據(jù)客戶具體機(jī)型進(jìn)行定制化的高效方案四元數(shù)致力于運(yùn)動(dòng)控制、圖像與視覺傳感等工業(yè)
    發(fā)表于 07-27 09:36

    淺談兒童陪護(hù)機(jī)器人

    、高電流的步進(jìn)電機(jī)驅(qū)動(dòng)芯片,可以提供可靠、高效的控制性能,擁有電流細(xì)分、過流保護(hù)、過熱保護(hù)等特點(diǎn),適用于需要高速、高精度轉(zhuǎn)動(dòng)的機(jī)器人應(yīng)用。 在實(shí)際應(yīng)用中,兒童陪護(hù)機(jī)器人的轉(zhuǎn)動(dòng)控制也需要考慮安全
    發(fā)表于 05-11 15:12

    TD-LTE完成全球首個(gè)操作性試驗(yàn)

    TD-LTE完成全球首個(gè)操作性試驗(yàn) 近日,愛立信在瑞典進(jìn)行了TD-LTE
    發(fā)表于 04-25 13:55 ?641次閱讀

    高通、諾基亞完成基于全球5G NR標(biāo)準(zhǔn)的操作性連接測試

    高通公司總裁Cristiano Amon表示:“高通與諾基亞成功完成的這一項(xiàng)基于全球5G NR標(biāo)準(zhǔn)的操作性連接測試,為在2019年順利推出5G NR商用網(wǎng)絡(luò)和終端設(shè)備奠定了堅(jiān)實(shí)
    的頭像 發(fā)表于 02-08 16:11 ?5056次閱讀

    HPC應(yīng)用程序高性能分析及如何使用系統(tǒng)資源的可操作性洞察

    探索HPC性能表征分析,以獲得有效計(jì)算密集型應(yīng)用程序如何使用系統(tǒng)資源的可操作性洞察。
    的頭像 發(fā)表于 11-08 06:11 ?3481次閱讀

    雙臂協(xié)作機(jī)器人的應(yīng)用場景

    雙臂協(xié)作機(jī)器人的核心是雙臂多關(guān)節(jié)結(jié)構(gòu)和機(jī)器人操作系統(tǒng),每條臂都有高靈活性的七個(gè)自由度,比單臂協(xié)作機(jī)器人有更高的靈活性和可操作性,通過雙臂配合
    的頭像 發(fā)表于 06-27 09:08 ?1415次閱讀
    雙臂協(xié)作<b class='flag-5'>機(jī)器人</b>的應(yīng)用場景