0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個機(jī)器人操縱系統(tǒng)的框架—— DiffSkill

傳感器技術(shù) ? 來源:傳感器技術(shù) ? 作者:Robospeak ? 2022-06-21 10:13 ? 次閱讀

對于人類來說,把面團(tuán)放到砧板上,然后用搟面杖把它壓平成圓形。這看起來很容易,對吧?

那如果是由機(jī)器人來操作,會是怎樣的效果?

對于機(jī)器人來說,面對像面團(tuán)這樣的可變形物體是很棘手的,因?yàn)槊鎴F(tuán)的形狀可以以多種方式變化,而這些變化很難用方程式來表示。

此外,從面團(tuán)中創(chuàng)建新形狀需要多個步驟并使用不同的工具。這就意味著機(jī)器人需要學(xué)習(xí)一系列長長的操作任務(wù),然后還需要通過反復(fù)試驗(yàn)更多可能的選擇。

現(xiàn)在,來自,麻省理工學(xué)院、卡內(nèi)基梅隆大學(xué)和加州大學(xué)圣地亞哥分校的研究人員創(chuàng)建了一個框架,可以讓機(jī)器人快速有效地完成復(fù)雜的操作任務(wù),例如揉面皮包餃子、做披薩。

▍一個機(jī)器人操縱系統(tǒng)的框架—— DiffSkill

研究人員為使用兩階段學(xué)習(xí)過程的機(jī)器人操作系統(tǒng)創(chuàng)建了一個框架,這可以使機(jī)器人能夠在很長一段時間內(nèi)執(zhí)行復(fù)雜的面團(tuán)操作任務(wù)。

這個算法會像“老師”一樣解決機(jī)器人完成任務(wù)必須采取的每一步。然后訓(xùn)練一個“學(xué)生”機(jī)器學(xué)習(xí)在什么時間段以及如何執(zhí)行任務(wù)期間所需的每項(xiàng)技能的抽象概念,例如使用搟面杖。

e241bcec-f0ee-11ec-ba43-dac502259ad0.gif

有了這些知識,系統(tǒng)就會推理出如何執(zhí)行技能來完成整個任務(wù)。

一系列操作,堪稱“手把手教學(xué)”。

研究人員表明,這種他們稱之為 DiffSkill 的方法可以在模擬中執(zhí)行復(fù)雜的操作任務(wù),例如切割和攤開面團(tuán),或從砧板周圍收集面團(tuán),同時優(yōu)于其他機(jī)器學(xué)習(xí)方法。

e32c7a66-f0ee-11ec-ba43-dac502259ad0.gif

當(dāng)然,除了包餃子、做披薩之外,這種方法還可以應(yīng)用于其他需要機(jī)器人操縱的可變形物體的環(huán)境。

例如為老年人或運(yùn)動障礙者喂食、洗澡或穿衣的護(hù)理機(jī)器人。

“這種方法更接近我們?nèi)祟愑?jì)劃行動的方式。當(dāng)一個人執(zhí)行一項(xiàng)長期任務(wù)時,我們并沒有寫下所有的細(xì)節(jié)。我們有一個更高級別的計(jì)劃者,它大致告訴我們在此過程中需要實(shí)現(xiàn)哪些階段以及一些中間目標(biāo),然后我們執(zhí)行它們,”計(jì)算機(jī)科學(xué)與人工智能專業(yè)的研究生Li表示。

▍“學(xué)生”&“老師” 的工作流程

DiffSkill 框架中的“老師”是一種軌跡優(yōu)化算法,可以解決物體初始狀態(tài)和目標(biāo)位置靠得很近的短視界任務(wù)。

軌跡優(yōu)化器在模擬現(xiàn)實(shí)世界物理的模擬器中工作(稱為可微物理模擬器,它將“Diff”放入“DiffSkill”中)。然后,“老師”算法使用模擬器中的信息來學(xué)習(xí)面團(tuán)在每個階段必須如何移動,一次一個,然后輸出這些軌跡。

然后“學(xué)生”神經(jīng)網(wǎng)絡(luò)學(xué)會模仿老師的動作。作為輸入,它使用兩個攝像頭圖像,一個顯示當(dāng)前狀態(tài)的面團(tuán),另一個顯示任務(wù)結(jié)束時的面團(tuán)。神經(jīng)網(wǎng)絡(luò)生成一個高級計(jì)劃,以確定如何將不同的技能聯(lián)系起來以達(dá)到目標(biāo)。然后,它為每個技能生成特定的、短視界的軌跡,并將命令直接發(fā)送到工具。

e3953830-f0ee-11ec-ba43-dac502259ad0.png

接著,研究人員使用這種技術(shù)對三種不同的模擬面團(tuán)操作任務(wù)進(jìn)行了實(shí)驗(yàn)。

在一項(xiàng)任務(wù)中,機(jī)器人使用抹刀將面團(tuán)舉到砧板上,然后使用搟面杖將其壓平。在另一個例子中,機(jī)器人使用抓手從柜臺上收集面團(tuán),將其放在抹刀上,然后將其轉(zhuǎn)移到砧板上。

在第三個任務(wù)中,機(jī)器人用刀將一堆面團(tuán)切成兩半,然后用夾具將每一塊面團(tuán)運(yùn)送到不同的位置。

e3d74c66-f0ee-11ec-ba43-dac502259ad0.png

同時,研究人員開發(fā)了一種機(jī)器人操縱系統(tǒng),可以在模擬中使用工具執(zhí)行復(fù)雜的面團(tuán)操作任務(wù)。

e4072526-f0ee-11ec-ba43-dac502259ad0.gif

例如收集面團(tuán)并將其放在砧板上(左),將一塊面團(tuán)切成兩半并將兩半分開(中),以及將面團(tuán)抬到一塊砧板,然后用搟面杖將其壓平(右)。

實(shí)驗(yàn)結(jié)果證明,DiffSkill 框架能夠勝過依賴強(qiáng)化學(xué)習(xí)的流行技術(shù)。在強(qiáng)化學(xué)習(xí)中,機(jī)器人通過反復(fù)試驗(yàn)來學(xué)習(xí)任務(wù)。

事實(shí)上,DiffSkill 是唯一能夠成功完成所有三個面團(tuán)操作任務(wù)的方法。有趣的是,研究人員發(fā)現(xiàn)“學(xué)生”神經(jīng)網(wǎng)絡(luò)甚至能夠勝過“教師”算法,Lin 說。

“我們的框架為機(jī)器人獲得新技能提供了一種新穎的方式。然后可以將這些技能鏈接起來,以解決更復(fù)雜的任務(wù),這些任務(wù)超出了以前的機(jī)器人系統(tǒng)的能力,”Li說。

因?yàn)樗麄兊姆椒▊?cè)重于控制工具(抹刀、刀、搟面杖等),所以它可以應(yīng)用于不同的機(jī)器人,但前提是它們使用研究人員定義的特定工具。

未來,他們計(jì)劃將工具的形狀集成到“學(xué)生”網(wǎng)絡(luò)的推理中,以便將其應(yīng)用于其他設(shè)備。

該團(tuán)隊(duì)的研究人員們打算通過使用 3D 數(shù)據(jù)作為輸入來提高 DiffSkill 的性能,同時,他們還希望使神經(jīng)網(wǎng)絡(luò)規(guī)劃過程更高效,并收集更多樣的訓(xùn)練數(shù)據(jù),以增強(qiáng) DiffSkill 對新情況的泛化能力。

從長遠(yuǎn)來看,他們希望將 DiffSkill 應(yīng)用到更多樣化的任務(wù)中,包括布料操作。

這項(xiàng)研究得到了美國國家科學(xué)基金會、LG電子、麻省理工學(xué)院-IBM 沃森人工智能實(shí)驗(yàn)室、美國海軍研究辦公室和國防高級研究計(jì)劃局的部分支持。

文章及論文地址:

https://news.mit.edu/2022/robotic-deformable-object-0331

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28483

    瀏覽量

    207440
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    253

    瀏覽量

    23415
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8423

    瀏覽量

    132757

原文標(biāo)題:搟面皮包餃子做披薩,MIT、CMU等的研究員讓機(jī)器人自己學(xué)會了!

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    具身智能機(jī)器人的基礎(chǔ)模塊,這個是本書的第二部分內(nèi)容,主要分為四部分:機(jī)器人計(jì)算系統(tǒng),自主機(jī)器人的感知
    發(fā)表于 01-04 19:22

    《具身智能機(jī)器人系統(tǒng)》第10-13章閱讀心得之具身智能機(jī)器人計(jì)算挑戰(zhàn)

    閱讀《具身智能機(jī)器人系統(tǒng)》第10-13章,我對具身智能機(jī)器人的工程實(shí)踐有了全新認(rèn)識。第10章從實(shí)時性角度剖析了機(jī)器人計(jì)算加速問題。機(jī)器人定位
    發(fā)表于 01-04 01:15

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+兩本互為支持的書

    如何使用PyTorch進(jìn)行數(shù)字圖像處理,它借助攝像頭來獲取視頻的圖像信息,然后通過已有的圖像識別框架模型經(jīng)深度學(xué)習(xí)和優(yōu)化以達(dá)到更精準(zhǔn)的識別結(jié)果,從而為進(jìn)步的執(zhí)行處理提供數(shù)據(jù)支持和依據(jù)。而《具身智能機(jī)器人
    發(fā)表于 01-01 15:50

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    。 多模態(tài)融合的創(chuàng)新與突破 機(jī)器人控制技術(shù)的另一個重要突破在于多模態(tài)大模型的應(yīng)用。相比于僅通過文字進(jìn)行人機(jī)交互的傳統(tǒng)方法,現(xiàn)代機(jī)器人能夠融合視覺、聲音、定位等多模態(tài)輸入信息,為任務(wù)執(zhí)行提供更加全面的感知
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    研究的各個方面。 第5部分(第14章)通過實(shí)際案例的應(yīng)用研究對本書提到的概念進(jìn)行總結(jié),作者實(shí)際構(gòu)建了具身智能機(jī)器人計(jì)算
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.全書概覽與第章學(xué)習(xí)

    講解如何構(gòu)造具身智能基礎(chǔ)模型的方法和步驟,包括數(shù)據(jù)采集、預(yù)處理、模型訓(xùn)練和評估等。 在第四部分,介紹了具身智能機(jī)器人的計(jì)算挑戰(zhàn),包括計(jì)算加速、算法安全性和系統(tǒng)可靠性等內(nèi)容。 最后,在第五部分介紹了
    發(fā)表于 12-27 14:50

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    《具身智能機(jī)器人系統(tǒng)書由甘鳴、俞波、萬梓燊、劉少山老師共同編寫,其封面如圖1所示。 本書共由5部分組成,其結(jié)構(gòu)和內(nèi)容如圖2所示。 該書可作為高校和科研機(jī)構(gòu)的教材,為學(xué)生和研究人
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識與基礎(chǔ)模塊

    物理交互納入智能系統(tǒng)的核心要素。 第3章是探討機(jī)器人計(jì)算系統(tǒng)。這章節(jié)詳細(xì)闡述了自主機(jī)器人的軟硬件架構(gòu)。計(jì)算
    發(fā)表于 12-19 22:26

    【書籍評測活動NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個浪潮!

    解和響應(yīng)人類情感方面的重要步驟;谷歌的 Atlas 機(jī)器人和特斯拉的 Tesla Bot 展 示了在物理能力和智能控制方面的先進(jìn)成果;豐田的 T-HR3 機(jī)器人則在遙控操作 技術(shù)方
    發(fā)表于 11-11 10:20

    開源項(xiàng)目!用ESP32做一個可愛的無用機(jī)器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了直想做的機(jī)器人——可愛無用機(jī)器人。 無用機(jī)
    發(fā)表于 09-03 09:34

    開源項(xiàng)目!用ESP32做一個可愛的無用機(jī)器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了直想做的機(jī)器人——可愛無用機(jī)器人。 無用
    發(fā)表于 08-30 14:50

    ROS讓機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    本帖最后由 Tronlong創(chuàng)龍科技 于 2024-7-19 17:18 編輯 ROS系統(tǒng)是什么 ROS(Robot Operating System)是適用于機(jī)器人的開源的
    發(fā)表于 07-09 11:38

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開發(fā),與同行相比具有許多優(yōu)勢:語言
    發(fā)表于 07-05 08:52

    abb機(jī)器人系統(tǒng)密鑰在哪

    ABB機(jī)器人系統(tǒng)密鑰是ABB機(jī)器人系統(tǒng)中用于保護(hù)其知識產(chǎn)權(quán)和確保系統(tǒng)安全性的種技術(shù)手段。本文將
    的頭像 發(fā)表于 06-17 09:45 ?1380次閱讀

    星動紀(jì)元開源人形機(jī)器人訓(xùn)練框架Humanoid-Gym

    星動紀(jì)元,這家專注于人形機(jī)器人技術(shù)的創(chuàng)新公司,近日宣布計(jì)劃將其訓(xùn)練框架Humanoid-Gym進(jìn)行開源。Humanoid-Gym是為人形機(jī)器人
    的頭像 發(fā)表于 03-06 18:13 ?2104次閱讀