0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

借助NVIDIA Project GR00T加速人形機器人開發(fā)

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-12-02 13:42 ? 次閱讀

人形機器人是機電一體化、控制理論和 AI 交叉領域的一道綜合性難題。人形機器人的動力學和控制十分復雜,它們需要先進的工具、技術和算法才能在移動和操作任務中保持平衡。由于人形機器人需要融合復雜的傳感器和高分辨率攝像頭,才能有效感知環(huán)境并推理如何與周圍環(huán)境進行實時互動,因此另一大難題是機器人數(shù)據(jù)的采集和各種傳感器的集成。此外,為了滿足實時處理感知數(shù)據(jù)和決策所需要的算力,還需要有功能強大的機載計算機。

當前的研究重點仍是開發(fā)能夠?qū)崿F(xiàn)機器人自適應行為并促進人與機器人自然交互的技術、工具與機器人基礎模型。我們正在積極開展 NVIDIA Project GR00T 研究計劃,旨在幫助人形機器人生態(tài)系統(tǒng)構(gòu)建者加快下一代先進機器人的開發(fā)工作。本文將討論用于開發(fā)人形機器人的全新 GR00T 工作流,包括:

GR00T-Gen 多樣化環(huán)境生成工作流

GR00T-Mimic 機器人運動和軌跡生成工作流

GR00T-Dexterity 精細靈巧操作工作流

GR00T-Mobility 移動和導航工作流

GR00T-Control 全身控制(WBC)工作流

GR00T-Perception 多模態(tài)感知工作流

GR00T-Gen 多樣化環(huán)境

生成工作流

GR00T-Gen 是一套在 OpenUSD 中生成機器人任務和仿真就緒環(huán)境的工作流,用于訓練通用機器人執(zhí)行操縱、移動和導航。

為了讓機器人學習得更“扎實”,需要在具有各種物體和場景的多樣化環(huán)境中進行訓練。但通常情況下,在現(xiàn)實世界中生成大量不同環(huán)境既昂貴又耗時,而且大多數(shù)開發(fā)者還無法使用,因此仿真成為了一個極佳的替代方案。

GR00T-Gen 使用大語言模型(LLM)和 3D 生成式 AI 模型創(chuàng)建并提供以人為本的逼真、多樣化環(huán)境。它擁有 2500 多個 3D 資產(chǎn),涵蓋了 150 多個物體類別。為了創(chuàng)建視覺多樣化場景,在仿真中加入了多種紋理以實現(xiàn)域隨機化。域隨機化使訓練而成的模型和策略在部署到現(xiàn)實世界中時能夠有效地泛化。

GR00T-Gen 為移動機械臂和人形機器人提供了跨具身支持并且包含了 100 多種任務,例如開門、按鍵和導航。

GR00T-Mimic 機器人運動

和軌跡生成工作流

GR00T-Mimic 是一個強大的工作流,它可從遠程操作演示中生成用于模仿學習的運動數(shù)據(jù)。模仿學習是一種訓練機器人的方法,機器人通過觀察和復制教師演示的動作來掌握技能。該訓練過程的一個關鍵要素是可用演示數(shù)據(jù)的數(shù)量和質(zhì)量。

人形機器人要想有效、安全地在以人為中心的環(huán)境中移動,其“老師”必須是人類示范者,這樣才能讓機器人通過模仿人類行為來學習。但現(xiàn)有的高質(zhì)量訓練數(shù)據(jù)十分匱乏,這就帶來了巨大的挑戰(zhàn)。

為了解決這個問題,需要開發(fā)能夠捕捉人類行為的大量數(shù)據(jù)集。生成這種數(shù)據(jù)的可行方法之一是遠程操作,即人類操作員遠程控制機器人演示特定任務。雖然遠程操作可以生成高保真的演示數(shù)據(jù),但在特定時間能夠訪問這些系統(tǒng)的人數(shù)有限。

GR00T-Mimic 旨在擴大數(shù)據(jù)采集流程的規(guī)模。該方法包括在物理世界中使用擴展現(xiàn)實(XR)和空間計算設備(如 Apple Vision Pro)采集數(shù)量有限的人類演示。然后利用這些初始演示生成合成運動數(shù)據(jù),從而有效地擴大演示數(shù)據(jù)集。我們的目標是創(chuàng)建一個全面的人類動作庫供機器人學習,從而提高它們在真實世界環(huán)境中執(zhí)行任務的能力。

為了進一步支持 GR00T-Mimic,NVIDIA Research 還發(fā)布了 SkillMimicGen。這是利用最少的人類演示解決實機操縱任務的第一步。

GR00T-Dexterity 精細靈巧

操作工作流

GR00T-Dexterity 是一套用于精細靈巧操作的模型和策略并包含開發(fā)這些模型和策略的參考工作流。

傳統(tǒng)的機器人抓取需要集成從識別抓取點到規(guī)劃運動和控制手指等多個復雜環(huán)節(jié)。對于有許多執(zhí)行器的機器人來說,管理這些系統(tǒng)(尤其是使用狀態(tài)機來處理抓取失敗等故障)使端到端抓取成為了一大難題。

GR00T-Dexterity 引入了一個借鑒研究論文 DextrAH-G 的工作流。該工作流是一種基于強化學習(RL)的機器人靈巧性策略開發(fā)方法。借助它,可以創(chuàng)建出像素到動作的端到端抓取系統(tǒng)。該系統(tǒng)經(jīng)過仿真訓練后,可部署到物理機器人上。該工作流專為生成能夠根據(jù)輸入的深度數(shù)據(jù)流進行快速、反應性抓取的策略而設計,并且可以泛化到新物體。

該流程涉及創(chuàng)建一個幾何織物定義機器人的運動空間和簡化抓取動作,同時針對并行化訓練進行優(yōu)化。通過使用 NVIDIA Isaac Lab,可在多顆 GPU 上使用強化學習訓練織物引導的策略,從而泛化抓取行為。最后,通過模仿學習,可利用輸入的深度將學習到的策略提煉為適用于現(xiàn)實世界的版本,從而在數(shù)小時內(nèi)制定出穩(wěn)健的策略。

請注意,GR00T-Dexterity 工作流預覽版基于研究論文 DextrAH-G:使用幾何織物實現(xiàn)像素到動作的靈巧機械臂-手抓取,并已從 NVIDIA Isaac Gym(已廢棄)遷移到 Isaac Lab。如果您是 Isaac Gym 用戶,請按照教程和遷移指南開始使用 Isaac Lab。

GR00T-Mobility 移動和

導航工作流

GR00T-Mobility 是一套用于移動和導航的模型和策略并包含開發(fā)這些模型和策略的參考工作流。

傳統(tǒng)的導航方法在雜亂環(huán)境中難以發(fā)揮作用并且需要進行大量的調(diào)整,而基于學習的方法難以泛化到新的環(huán)境。

GR00T-Mobility 引入了一套基于 Isaac Lab 支持的強化學習(RL)和模仿學習(IL)構(gòu)建的新型工作流,專門用于創(chuàng)建適用于不同環(huán)境和具身的通用移動導航方法。

借助使用 NVIDIA Isaac Sim 構(gòu)建的世界模型,該工作流可生成豐富的環(huán)境動態(tài)潛在表示,以此實現(xiàn)了更具適應性的訓練。它將世界建模與行動策略學習和RL微調(diào)分離,從而提高了靈活性,并且由于支持多樣化的數(shù)據(jù)源而具有更高的通用性。

僅在 Isaac Sim 提供的逼真合成數(shù)據(jù)集上(使用該工作流)訓練而成的模型實現(xiàn)了零樣本仿真到現(xiàn)實轉(zhuǎn)換,并且可應用于一系列具身,包括差動驅(qū)動、Ackermann、四足動物和人形等。

該工作流以 NVIDIA 應用研究團隊在 X-MOBILITY:通過世界建模實現(xiàn)端到端可泛化導航中展示的研究成果為基礎。

842de9ca-ad87-11ef-93f3-92fbcf53809c.jpg

圖 1. 通過使用 Isaac Sim 通過的合成數(shù)據(jù)集,

GR00T-Mobility 工作流將世界建模和行動策略訓練相結(jié)合,

實現(xiàn)了可泛化的導航與零樣本仿真到現(xiàn)實轉(zhuǎn)換。

GR00T-Control 全身控制工作流

GR00T-Control 是一套用于開發(fā) WBC 的先進運動規(guī)劃和控制程序庫、模型、策略與參考工作流。參考工作流可運用于各種平臺、預訓練模型和加速程序庫。

WBC 對于實現(xiàn)精確、靈敏的人形機器人控制必不可少,尤其是在需要靈巧和移動的任務中。GR00T-Control 引入了一種基于學習的傳統(tǒng)模型預測控制(MPC)替代方案,其工作流與 NVIDIA 應用研究團隊開發(fā)的 Isaac Lab 相集成。這項工作基于 OmniH2O:通用和靈巧人類到人形機器人全身遠程操作與學習中展示的原創(chuàng)研究成果以及最新發(fā)布的 HOVER:人形機器人多功能中性全身控制器。

該參考工作流可幫助開發(fā)用于遠程操作和自主控制的人形機器人全身控制策略(WBC 策略)。OmniH2O 的遠程操作通過 VR 頭顯、RGB 攝像頭、口頭命令等輸入方法實現(xiàn)了高精度的人類控制。同時,HOVER 的多模態(tài)策略提煉框架促進了自主任務模式之間的無縫轉(zhuǎn)換,使其能夠適應復雜的任務。

WBC 策略工作流采用仿真到真實學習流程。該流程首先使用 Isaac Lab 作為 能夠訪問詳細運動數(shù)據(jù)的“教師”模型,通過強化學習在仿真中訓練特權控制策略。之后將該模型提煉成可部署的現(xiàn)實世界版本,該版本能夠在感官輸入有限的情況下運行,解決遠程操作延遲、VR 或視覺追蹤輸入受限(針對 OmniH2O)以及多種自主任務模式的適應性(針對 HOVER)等難題。

(使用 OmniH2O 工作流開發(fā)的)全身控制策略提供了 19 個自由度,實現(xiàn)了精確的人形機器人控制。

GR00T-Perception 多模態(tài)

感知工作流

GR00T-Perception 是一套先進的感知程序庫(例如 nvblox 和 cuVSLAM)、基礎模型(例如 FoundationPose 和 RT-DETR)以及基于 Isaac Sim 和 NVIDIA Isaac ROS 構(gòu)建的參考工作流。這些參考工作流展示了如何在機器人解決方案中結(jié)合使用這些平臺、預訓練模型和加速程序庫。

ReMEmbR 是 GR00T-Perception 新增的一項重要功能,是一項應用研究參考工作流。該工作流通過讓機器人“記住”長期事件歷史增強人機交互,大大改善了個性化和情境感知響應,同時通過集成視覺語言模型、LLM和檢索增強記憶大幅提升人形機器人的感知、認知和適應能力。

借助 ReMEmbR,機器人能夠長期保留上下文信息,通過整合圖像、聲音等感官數(shù)據(jù)提高空間感知、導航和交互效率。該工作流遵循結(jié)構(gòu)化的記憶構(gòu)建和查詢流程,可部署在真實機器人上的 NVIDIA Jetson AGX Orin 上。

想要了解有關 ReMEmbR 的更多信息,請參閱使用生成式 AI 使機器人借助 ReMEmbR 進行推理和行動:

https://developer.nvidia.com/blog/using-generative-ai-to-enable-robots-to-reason-and-act-with-remembr/

8436cc16-ad87-11ef-93f3-92fbcf53809c.png

圖 2. ReMEmbR 高級工作流包含兩個階段,

分別是記憶構(gòu)建階段和信息查詢階段。

結(jié)論

通過 NVIDIA Project GR00T,我們正在構(gòu)建能夠根據(jù)人形機器人開發(fā)者需求單獨或組合使用的先進技術、工具與 GR00T 工作流。這些改進有助于開發(fā)智能化水平更高、適應性和能力更強的人形機器人,推動人形機器人在現(xiàn)實世界應用中的發(fā)展。

進一步了解領先機器人公司如何使用 NVIDIA 平臺,包括 1X、Agility Robotics、The AI Institute、Berkeley Humanoid、波士頓動力、Field AI、傅利葉、銀河通用、Mentee Robotics、Skild AI、Swiss-Mile、宇樹科技和小鵬機器人。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28418

    瀏覽量

    207081
  • NVIDIA
    +關注

    關注

    14

    文章

    4986

    瀏覽量

    103046
  • AI
    AI
    +關注

    關注

    87

    文章

    30887

    瀏覽量

    269062
  • 人形機器人
    +關注

    關注

    2

    文章

    451

    瀏覽量

    16574

原文標題:通過 NVIDIA Project GR00T 推進人形機器人視覺和功能開發(fā)

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA Isaac 機器人平臺利用最新的生成式 AI 和先進的仿真技術,加速 AI 機器人技術的發(fā)展

    觀眾展示了用于人形機器人學習的通用基礎模型 Project GR00T(代表通用機器人 00
    的頭像 發(fā)表于 06-04 18:00 ?7707次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac <b class='flag-5'>機器人</b>平臺利用最新的生成式 AI 和先進的仿真技術,<b class='flag-5'>加速</b> AI <b class='flag-5'>機器人</b>技術的發(fā)展

    機器人掀起2024開年融資熱潮,聯(lián)想入場投資多家公司,人形機器人要“爆”

    電子發(fā)燒友網(wǎng)報道(文/劉靜)近日,英偉達在一年一度的GTC大會上重磅推出了人形機器人通用基礎模型Project GR00T。相當看好具身智能、人形
    的頭像 發(fā)表于 03-21 00:34 ?3714次閱讀
    <b class='flag-5'>機器人</b>掀起2024開年融資熱潮,聯(lián)想入場投資多家公司,<b class='flag-5'>人形</b><b class='flag-5'>機器人</b>要“爆”

    透過NVIDIA GR00T模型和Jetson Thor芯片看人形機器人未來發(fā)展

    ,具身智能作為行業(yè)熱詞不脛而走,實際上NVIDIA等公司早就在這一領域開始了布局。 具身智能指機器人或智能系統(tǒng)能夠通過感知器和執(zhí)行器與其所處的環(huán)境進行實時互動。從概念上說,具身智能的實例范圍很廣,包括機器人技術、自動駕駛汽車和聊
    的頭像 發(fā)表于 04-10 00:14 ?3517次閱讀
    透過<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GR00T</b>模型和Jetson Thor芯片看<b class='flag-5'>人形</b><b class='flag-5'>機器人</b>未來發(fā)展

    NVIDIA 加速人形機器人發(fā)展

    —SIGGRAPH— 當?shù)貢r間 2024 年 7 月 29 日— 為加速全球人形機器人的發(fā)展,NVIDIA 于今日宣布,為全球領先的機器人
    發(fā)表于 07-30 09:15 ?746次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>加速</b><b class='flag-5'>人形</b><b class='flag-5'>機器人</b>發(fā)展

    為什么人形機器人更討人喜歡?

    一般的情緒,并能回應的觸摸、語音等指令。有的人形機器人還有“自我”感覺,能感知自己的“身體”等狀況。 未來,機器人將成為智能終端的一種高級形態(tài),
    發(fā)表于 05-12 09:55

    瘋殼人形機器人開發(fā)實戰(zhàn)全套文檔教程(含工具)pdf

    瘋殼人形機器人開發(fā)實戰(zhàn)全套文檔教程(含工具)pdf
    發(fā)表于 02-25 19:52

    開發(fā)教程1】人形街舞機器人-套件檢測教程

    多自由度人形雙足舞蹈機器人套件檢測教程——機器人開發(fā)系列配套資料:https://www.fengke.club/GeekMart/su_fV1WzKsGQ.jsp 配套視頻:http
    發(fā)表于 04-22 14:14

    【教程1】人形街舞機器人-套件檢測教程

    多自由度人形雙足舞蹈機器人——瘋殼·機器人開發(fā)系列套件檢測教程內(nèi)容簡介本文檔主要介紹在如何驗證多自由度人形雙足街舞
    發(fā)表于 08-12 15:55

    英偉達發(fā)布人形機器人通用模型與Isaac機器人計劃

    作為AI領域的硬件大佬,NVIDIA在推動機器人進步方面一直積極行動。在此次召開的年度GTC開發(fā)者大會上,公司對外公布了通過Project GR
    的頭像 發(fā)表于 03-19 15:57 ?636次閱讀

    NVIDIA發(fā)布一款人形機器人通用基礎模型—Project GR00T

    NVIDIA 于今日發(fā)布人形機器人通用基礎模型 Project GR00T,旨在進一步推動其在機器人
    的頭像 發(fā)表于 03-20 10:00 ?662次閱讀

    英偉達發(fā)布人形機器人基礎模型

    英偉達在一年一度的GTC開發(fā)者大會上,由創(chuàng)始黃仁勛親自揭曉了令人矚目的Project GR00T人形
    的頭像 發(fā)表于 03-21 11:43 ?761次閱讀

    AI機器人迎來多模態(tài)模型

    配備 GR00T 模型的機器人由于需要“吸收消化”外界的多模態(tài)信息,還要快速完成理解、決策、行動等一系列動作,因此對于算力的需求是巨量的。
    發(fā)表于 04-12 10:39 ?281次閱讀

    全球機器人開發(fā)領域采用NVIDIA 機器人開發(fā)和生產(chǎn)

    比亞迪電子、西門子、泰瑞達和 Alphabet 旗下公司 Intrinsic 采用 NVIDIA Isaac 機器人平臺開發(fā)自主機械臂、人形機器人
    的頭像 發(fā)表于 06-03 18:25 ?1244次閱讀

    NVIDIA提供一套服務、模型以及計算平臺 加速人形機器人發(fā)展

    開發(fā)者可以訪問新的 NVIDIA NIM 微服務,用于 Isaac Lab 和 Isaac Sim 中的機器人仿真、OSMO 機器人云計算編排服務和遠程操作數(shù)據(jù)捕獲工作流等。 為
    的頭像 發(fā)表于 07-31 10:41 ?660次閱讀

    傅利葉發(fā)布新一代人形機器人GR-2

    傅利葉智能科技近日隆重推出了其自主研發(fā)的新一代通用人形機器人——GR-2,這款機器人以“為AI打造最佳具身載體”為核心愿景,在硬件、設計及開發(fā)
    的頭像 發(fā)表于 09-27 17:40 ?807次閱讀