0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過(guò)多樣的幾何形狀來(lái)訓(xùn)練機(jī)器人從仿真到現(xiàn)實(shí)轉(zhuǎn)換的裝配技能

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-08-20 10:39 ? 次閱讀

家庭和工業(yè)環(huán)境中的大多數(shù)物品都由多個(gè)部件組裝而成。而裝配工作一般交給人工,但在汽車等一些行業(yè),機(jī)器人裝配已十分普遍。

這些機(jī)器人大多用于執(zhí)行重復(fù)性較高的任務(wù),它們被部署在精心設(shè)計(jì)的環(huán)境中,處理特定的部件。在多品種的小批量制造中(即小批量生產(chǎn)各種產(chǎn)品的流程),機(jī)器人還必須適應(yīng)不同的零件、姿態(tài)和環(huán)境。在保持高精度和高準(zhǔn)確度的前提下實(shí)現(xiàn)這種適應(yīng)性是機(jī)器人技術(shù)所面臨的一大挑戰(zhàn)。

得益于 NVIDIA 在接觸豐富交互的超實(shí)時(shí)仿真技術(shù)方面的最新進(jìn)展,現(xiàn)在已經(jīng)可以對(duì)機(jī)器人裝配任務(wù)(如插入等)進(jìn)行仿真,詳見(jiàn)通過(guò)使用 NVIDIA Isaac 的新型仿真方法推進(jìn)機(jī)器人裝配技術(shù)發(fā)展。這使得使用數(shù)據(jù)饑渴的學(xué)習(xí)算法來(lái)訓(xùn)練仿真機(jī)器人智能體成為可能:

https://developer.nvidia.com/blog/advancing-robotic-assembly-with-a-novel-simulation-approach-using-nvidia-isaac/

后續(xù)關(guān)于機(jī)器人裝配從仿真到現(xiàn)實(shí)的遷移研究提出了使用強(qiáng)化學(xué)習(xí) (RL) 在仿真中解決少量裝配任務(wù)的算法,以及在現(xiàn)實(shí)世界中成功部署所學(xué)技能的方法。詳見(jiàn)將工業(yè)機(jī)器人裝配任務(wù)從仿真遷移到現(xiàn)實(shí):

https://developer.nvidia.com/blog/transferring-industrial-robot-assembly-tasks-from-simulation-to-reality/

本文將介紹 AutoMate,這一新型框架被用來(lái)訓(xùn)練使用機(jī)械臂裝配不同形狀零件的專家和通才策略;然后對(duì)訓(xùn)練策略從仿真到現(xiàn)實(shí)的零樣本遷移進(jìn)行演示,這意味著無(wú)需額外調(diào)整在仿真中學(xué)習(xí)到的裝配技能,即可直接應(yīng)用于現(xiàn)實(shí)環(huán)境。

什么是 AutoMate?

AutoMate 是首個(gè)基于仿真的框架,用于學(xué)習(xí)各種裝配任務(wù)中的專業(yè)(部件特定)和通用(統(tǒng)一)裝配技能。例如:在汽車制造領(lǐng)域,AutoMate 可以幫助工人掌握發(fā)動(dòng)機(jī)部件的特定裝配技巧以及整車的統(tǒng)一裝配流程。這項(xiàng)工作成果來(lái)自于南加州大學(xué)與 NVIDIA 西雅圖機(jī)器人實(shí)驗(yàn)室的密切合作。

AutoMate 的主要貢獻(xiàn)有:

100 個(gè)裝配體和現(xiàn)成仿真環(huán)境的數(shù)據(jù)集。

一種有效訓(xùn)練仿真機(jī)器人解決各種仿真裝配任務(wù)的新型算法組合。

有效綜合各種學(xué)習(xí)方法,將多種專業(yè)裝配技能的知識(shí)提煉成一種通用裝配技能,并通過(guò) RL 進(jìn)一步提高通用裝配技能的性能。

一個(gè)能夠在以感知為初始的工作流中,部署通過(guò)仿真訓(xùn)練獲得的裝配技能的真實(shí)世界系統(tǒng)。

圖 1. 在仿真中部署 AutoMate 裝配技能

圖 2. 在現(xiàn)實(shí)中部署 AutoMate 裝配技能

數(shù)據(jù)集和仿真環(huán)境

AutoMate 提供了一個(gè)包含 100 個(gè)裝配體的數(shù)據(jù)集,這些裝配體與仿真兼容,并可以在現(xiàn)實(shí)世界中進(jìn)行 3D 打印。同時(shí),它還為所有 100 個(gè)裝配體提供了并行化仿真環(huán)境。這 100 個(gè)裝配體基于 Autodesk 的大型裝配體數(shù)據(jù)集。在這項(xiàng)工作成果中,術(shù)語(yǔ)“插頭”指的是必須插入的部件(圖 3 中用白色表示),“插座”指的是與插頭配合的部件(圖 3 中用綠色表示)。

圖 3. AutoMate 數(shù)據(jù)集中 100 個(gè)裝配體的可視化圖

圖 4. AutoMate 數(shù)據(jù)集中的裝配體仿真環(huán)境

在多種形狀上學(xué)習(xí)專家技能

盡管 NVIDIA 之前的工作成果 IndustReal 表明,純 RL 方法可以解決接觸豐富的裝配任務(wù),但它只能解決一小部分裝配體。在 AutoMate 數(shù)據(jù)集中的 100 個(gè)裝配體中,大部分都無(wú)法通過(guò)純 RL 方法解決。但仿真學(xué)習(xí)可以讓機(jī)器人通過(guò)觀察和模仿演示來(lái)習(xí)得復(fù)雜的技能。AutoMate 引入了包含三種不同算法的新型組合。該組合通過(guò)將 RL 與仿真學(xué)習(xí)相結(jié)合,使機(jī)器人能夠有效掌握適用于各種裝配體的技能。

使用仿真學(xué)習(xí)增強(qiáng) RL 面臨以下三個(gè)挑戰(zhàn):

生成裝配演示

將仿真學(xué)習(xí)目標(biāo)整合到 RL 中

選擇在學(xué)習(xí)過(guò)程中使用的演示

下文將探討如何逐一解決這三個(gè)挑戰(zhàn)。

利用拆解-組裝來(lái)生成示范

裝配運(yùn)動(dòng)學(xué)是一個(gè)狹窄通道問(wèn)題,機(jī)器人必須操縱部件通過(guò)狹窄空間,并且不能與障礙物相撞。使用運(yùn)動(dòng)規(guī)劃器自動(dòng)采集裝配演示非常困難。要采集人類演示,還需要有技能嫻熟的人類操作員和先進(jìn)的遠(yuǎn)程操作界面,而這些都十分昂貴。

“拆解-組裝”的概念告訴我們,在裝配一個(gè)物體前,首先要了解如何拆卸它。受到這一概念的啟發(fā),可以先采集拆卸演示,然后按相反步驟操作便可進(jìn)行裝配。在仿真中,命令機(jī)器人將插頭從插座上拆下,每個(gè)裝配體記錄 100 次成功的拆卸演示。

圖 5. 在仿真中生成拆卸演示的過(guò)程

帶有模仿目標(biāo)的 RL

RL 中的獎(jiǎng)勵(lì)是向智能體發(fā)出的一個(gè)信號(hào),該信號(hào)表明智能體在規(guī)定步驟中的表現(xiàn)有多好。獎(jiǎng)勵(lì)可作為反饋,指導(dǎo)智能體學(xué)習(xí)和調(diào)整其行動(dòng),以逐漸使其累積獎(jiǎng)勵(lì)最大化(從而成功完成任務(wù))。受 DeepMimic 等角色動(dòng)畫(huà)工作成果的啟發(fā),獎(jiǎng)勵(lì)函數(shù)中加入了一個(gè)模仿項(xiàng),以便通過(guò)模仿目標(biāo)增強(qiáng) RL,鼓勵(lì)機(jī)器人在學(xué)習(xí)過(guò)程中模仿演示。每個(gè)時(shí)間步的模仿獎(jiǎng)勵(lì)被定義為規(guī)定裝配體所有演示的最大獎(jiǎng)勵(lì)。

除了模仿項(xiàng),獎(jiǎng)勵(lì)公式中還包含以下項(xiàng):

目標(biāo)距離懲罰

仿真誤差懲罰

獎(jiǎng)勵(lì)任務(wù)難度

這與之前的 InsutReal 工作相一致。

通過(guò)動(dòng)態(tài)時(shí)間扭曲來(lái)選擇演示

如要確定模仿哪個(gè)演示(即哪個(gè)演示在當(dāng)前時(shí)間步提供最大獎(jiǎng)勵(lì)),第一步是計(jì)算每個(gè)演示與當(dāng)前機(jī)器人末端執(zhí)行器路徑之間的距離,然后模仿距離最小的路徑。與機(jī)器人末端執(zhí)行器路徑相比,演示路徑的路徑點(diǎn)分布可能不均勻,路徑點(diǎn)數(shù)量也可能不同,因此很難確定演示路徑中的路徑點(diǎn)與機(jī)器人末端執(zhí)行器路徑之間的對(duì)應(yīng)關(guān)系。

動(dòng)態(tài)時(shí)間扭曲 (DTW) 是一種用于測(cè)量?jī)蓚€(gè)速度可能不同的時(shí)間序列之間相似性的算法。在這項(xiàng)工作中,DTW 被用于找出機(jī)器人末端執(zhí)行器路徑和每個(gè)演示路徑之間的映射,從而使末端執(zhí)行器路徑上的每個(gè)路徑點(diǎn)與演示路徑上的匹配路徑點(diǎn)之間的距離總和最?。▓D 6)。根據(jù) DTW 返回的距離,計(jì)算每條演示路徑的模仿獎(jiǎng)勵(lì),并選擇模仿獎(jiǎng)勵(lì)最高的演示路徑。

圖 6. DTW 將末端執(zhí)行器路徑與演示路徑之間的映射可視化

所提出的拆解-組裝組合、帶有模仿目標(biāo)的 RL 和使用 DTW 匹配軌跡的組合方法在各種裝配體中都表現(xiàn)出一致的性能。在仿真中,專家策略在 80 個(gè)不同裝配體上的成功率約為 80% 以上,在 55 個(gè)不同裝配體上的成功率約為 90% 以上。在現(xiàn)實(shí)世界中,專家策略在 20 個(gè)組件上的平均成功率為 86.5%,比在仿真中用于這些組件時(shí)僅下降了 4.2%(圖 7)。

圖 7. 專家策略在現(xiàn)實(shí)世界與仿真中解決每個(gè)裝配體的成功率比較

學(xué)習(xí)通用裝配技能

為了訓(xùn)練一種能夠解決多種裝配任務(wù)的通用技能,需要重新使用已訓(xùn)練的專家技能中的知識(shí),然后使用基于課程的 RL 進(jìn)一步提高性能。所提出的方法包含三個(gè)階段:

首先,使用標(biāo)準(zhǔn)行為克隆 (BC),即從已經(jīng)訓(xùn)練過(guò)的專家技能中采集演示,并使用這些演示監(jiān)督通才技能的訓(xùn)練。

隨后,使用 DAgger(數(shù)據(jù)集聚合)完善通才技能,方法是執(zhí)行通才技能,并在通才技能訪問(wèn)的狀態(tài)下主動(dòng)查詢專家技能(即獲取專家技能預(yù)測(cè)的操作)以進(jìn)行監(jiān)督。

最后,對(duì)通才技能執(zhí)行 RL 微調(diào)階段。在微調(diào)階段,使用 IndustReal 工作中基于采樣的課程。隨著通才技能任務(wù)成功率的提高,部件的初始參與度會(huì)逐漸降低。

圖 8. 行為克隆、DAgger 和基于課程的 RL 微調(diào)示意圖

使用剛才提出的三階段方法在 20 個(gè)裝配體上進(jìn)行通才技能訓(xùn)練。在仿真中,通才策略可以聯(lián)合解決 20 個(gè)裝配體,成功率為 80.4%。在現(xiàn)實(shí)世界中,通才策略在同一組裝配體上的平均成功率為 84.5%,比在仿真中提高了 4.1%(圖 9)。

圖 9. 通才策略在現(xiàn)實(shí)世界和仿真中解決每個(gè)裝配體的成功率比較

現(xiàn)實(shí)世界環(huán)境和感知初始化工作流

現(xiàn)實(shí)世界環(huán)境包括一個(gè) Franka Panda 機(jī)械臂、一個(gè)安裝在手腕上的英特爾 RealSense D435 攝像頭、一個(gè) 3D 打印插頭和插座,以及一個(gè)用于固定插座的 Schunk EGK40 抓取器。在感知初始化工作流中:

插頭被隨意放置在泡沫塊上,插座被隨意放置在 Schunk 抓取器中。

通過(guò)安裝在手腕上的攝像頭捕捉 RGB-D 圖像,然后對(duì)部件進(jìn)行 6D 姿態(tài)估計(jì) (FoundationPose)。

機(jī)器人抓取插頭、將其移動(dòng)到插座上,并使用在仿真中訓(xùn)練的裝配技能。

圖 10. 現(xiàn)實(shí)世界環(huán)境和感知初始化工作流

專家和通才技能在感知初始化工作流中被進(jìn)行評(píng)估。專家技能的平均成功率為 90.0%,通才技能的成功率為 86.0%。這些結(jié)果表明,6-DOF 姿態(tài)估計(jì)、抓取優(yōu)化和所提出的學(xué)習(xí)專家和通才策略的方法可以有效結(jié)合,從而在現(xiàn)實(shí)條件下使用研究級(jí)硬件實(shí)現(xiàn)可靠的裝配。

總結(jié)

AutoMate 是我們第一次嘗試?yán)脤W(xué)習(xí)方法和仿真來(lái)解決各種裝配問(wèn)題。通過(guò)這項(xiàng)工作,NVIDIA 研究人員立足于現(xiàn)實(shí)世界的部署,逐步建立了工業(yè)機(jī)器人的大型模型范例。

未來(lái)的工作重點(diǎn)是解決需要高效序列規(guī)劃(即決定下一個(gè)裝配部件)的多部件裝配體,并進(jìn)一步提高技能,以達(dá)到具有行業(yè)競(jìng)爭(zhēng)力的性能指標(biāo)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28474

    瀏覽量

    207392
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4996

    瀏覽量

    103213
  • 仿真
    +關(guān)注

    關(guān)注

    50

    文章

    4096

    瀏覽量

    133699
  • 工業(yè)機(jī)器人
    +關(guān)注

    關(guān)注

    91

    文章

    3369

    瀏覽量

    92713

原文標(biāo)題:通過(guò)多樣的幾何形狀來(lái)訓(xùn)練機(jī)器人從仿真到現(xiàn)實(shí)轉(zhuǎn)換的裝配技能

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    物理仿真人形機(jī)器人的統(tǒng)一全身控制策略

    創(chuàng)建動(dòng)作自然并對(duì)各種控制輸入做出智能響應(yīng)的交互式仿真人形機(jī)器人仍是計(jì)算機(jī)動(dòng)畫(huà)和機(jī)器人技術(shù)領(lǐng)域最具挑戰(zhàn)性的問(wèn)題之一。NVIDIA Isaac Sim等高性能 GPU 加速仿真器以及使用N
    的頭像 發(fā)表于 01-06 12:31 ?75次閱讀
    物理<b class='flag-5'>仿真</b>人形<b class='flag-5'>機(jī)器人</b>的統(tǒng)一全身控制策略

    《具身智能機(jī)器人系統(tǒng)》第10-13章閱讀心得之具身智能機(jī)器人計(jì)算挑戰(zhàn)

    閱讀《具身智能機(jī)器人系統(tǒng)》第10-13章,我對(duì)具身智能機(jī)器人的工程實(shí)踐有了全新認(rèn)識(shí)。第10章從實(shí)時(shí)性角度剖析了機(jī)器人計(jì)算加速問(wèn)題。機(jī)器人定位中的SLAM算法需要處理兩個(gè)計(jì)算密集型任務(wù):
    發(fā)表于 01-04 01:15

    NVIDIA技術(shù)推動(dòng)機(jī)器人仿真

    借助機(jī)器人仿真,開(kāi)發(fā)人員能夠在基于物理學(xué)的現(xiàn)實(shí)世界數(shù)字呈現(xiàn)中對(duì)機(jī)器人進(jìn)行虛擬訓(xùn)練、測(cè)試和驗(yàn)證。
    的頭像 發(fā)表于 01-03 14:10 ?121次閱讀

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    中取得了令人矚目的效果。 閱讀感悟 傳統(tǒng)的手動(dòng)編程借助大模型實(shí)現(xiàn)智能化、自主化,單一模態(tài)的交互多模態(tài)信息的深度融合,再到擴(kuò)散模型的應(yīng)用,機(jī)器
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    影響與發(fā)展,提供了全球及國(guó)內(nèi)行業(yè)趨勢(shì)的見(jiàn)解。書(shū)中詳細(xì)討論了這一新興領(lǐng)域面臨的諸多挑戰(zhàn),應(yīng)用的不確定性、昂貴的成本倫理問(wèn)題,為讀者呈現(xiàn)了當(dāng)前形勢(shì)的現(xiàn)實(shí)視角。 接下來(lái),書(shū)中深入探討了具身智能機(jī)
    發(fā)表于 12-28 21:12

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    將自然語(yǔ)言理解與運(yùn)動(dòng)規(guī)劃融為一體。這種端端的方法使機(jī)器人能夠直接人類指令生成動(dòng)作序列,大幅簡(jiǎn)化了控制流程。該項(xiàng)目的工作流程包含設(shè)計(jì)并封裝一個(gè)人機(jī)器人函數(shù)庫(kù)、編寫(xiě)清晰地描述提示詞、在
    發(fā)表于 12-24 15:03

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    100 倍 。此外,Sim2Real 技術(shù)的進(jìn)步也促進(jìn)了技能與知識(shí)模擬環(huán)境實(shí)際應(yīng)用的轉(zhuǎn)移。這項(xiàng)技術(shù)在虛擬空間中訓(xùn)練機(jī)器人和 AI 系統(tǒng)
    發(fā)表于 12-24 00:33

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    的快速發(fā)展,相關(guān)人才的需求也在不斷增加,通過(guò)閱讀該書(shū)可以幫助大家系統(tǒng)性地了解和分析當(dāng)前具身智能機(jī)器人系統(tǒng)的發(fā)展現(xiàn)狀和前沿研究,為未來(lái)的研究和開(kāi)發(fā)工作提供指導(dǎo)。此外,本書(shū)還可以為研究人員和工程師提供具體
    發(fā)表于 12-20 19:17

    NVIDIA通過(guò)加速AWS上的機(jī)器人仿真推進(jìn)物理AI的發(fā)展

    NVIDIA Isaac Sim 現(xiàn)在可在 Amazon EC2 G6e 實(shí)例中的 NVIDIA GPU 云實(shí)例上使用,將機(jī)器人仿真的擴(kuò)展速度提高了 2 倍并加快了 AI 模型的訓(xùn)練速度
    的頭像 發(fā)表于 12-09 11:50 ?322次閱讀

    利用NVIDIA技術(shù)推動(dòng)下一代AI機(jī)器人發(fā)展

    人形機(jī)器人工廠,基于物理 AI 的工業(yè)系統(tǒng)正在通過(guò)訓(xùn)練、仿真和推理加速發(fā)展。
    的頭像 發(fā)表于 10-27 09:54 ?271次閱讀

    “0元購(gòu)”智元靈犀X1機(jī)器人,軟硬件全套圖紙和代碼全公開(kāi)!資料免費(fèi)下載!

    仿真Sim2Sim、Sim2Real代碼、強(qiáng)化學(xué)習(xí)訓(xùn)練代碼、模型轉(zhuǎn)換、推理工具,和調(diào)試工具(數(shù)據(jù)可視化、遙控器)等等,“一站式”全套圖紙和代碼幫助大家更好地學(xué)習(xí)人形機(jī)器人開(kāi)發(fā)流程。作
    發(fā)表于 10-25 15:20

    機(jī)器人仿真的類型和優(yōu)勢(shì)

    機(jī)器人仿真使機(jī)器人工程師和研究人員能夠創(chuàng)建機(jī)器人及其環(huán)境的虛擬模型。這項(xiàng)技術(shù)支持在仿真的無(wú)風(fēng)險(xiǎn)環(huán)境中測(cè)試和驗(yàn)證
    的頭像 發(fā)表于 10-14 10:43 ?550次閱讀
    <b class='flag-5'>機(jī)器人</b><b class='flag-5'>仿真</b>的類型和優(yōu)勢(shì)

    在NVIDIA Isaac Lab中訓(xùn)練四足機(jī)器人運(yùn)動(dòng)

    由于涉及復(fù)雜的動(dòng)力學(xué),為四足機(jī)器人制定有效的運(yùn)動(dòng)策略是機(jī)器人領(lǐng)域面臨的重大挑戰(zhàn)。在現(xiàn)實(shí)世界中訓(xùn)練四足機(jī)器人上下樓梯可能會(huì)損壞設(shè)備和環(huán)境,因此
    的頭像 發(fā)表于 09-06 14:48 ?606次閱讀
    在NVIDIA Isaac Lab中<b class='flag-5'>訓(xùn)練</b>四足<b class='flag-5'>機(jī)器人</b>運(yùn)動(dòng)

    工業(yè)機(jī)器人視覺(jué)技術(shù)的應(yīng)用分為哪幾種?

    ,機(jī)器人可以識(shí)別和定位物體的位置、形狀、顏色等特征。這些信息可以用于機(jī)器人的導(dǎo)航、抓取、裝配等任務(wù)。 1.1 顏色識(shí)別 顏色識(shí)別是物體識(shí)別的一種常見(jiàn)方法。
    的頭像 發(fā)表于 07-09 09:38 ?750次閱讀

    Al大模型機(jī)器人

    豐富的知識(shí)儲(chǔ)備。它們可以涵蓋各種領(lǐng)域的知識(shí),并能夠回答相關(guān)問(wèn)題。靈活性與通用性: AI大模型機(jī)器人具有很強(qiáng)的靈活性和通用性,能夠處理各種類型的任務(wù)和問(wèn)題。持續(xù)學(xué)習(xí)和改進(jìn): 這些模型可以通過(guò)持續(xù)的訓(xùn)練
    發(fā)表于 07-05 08:52