0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

科學(xué)家開發(fā)可提高3D感知能力的模型,實現(xiàn)四足機(jī)器人自由行走

天津機(jī)器人 ? 來源:天津機(jī)器人 ? 2023-09-11 17:11 ? 次閱讀

借助機(jī)器人的本體感覺對足式運(yùn)動進(jìn)行研究已有數(shù)十年。在以往的研究手段中,研究人員往往采用基于模型的方法開發(fā)神經(jīng)網(wǎng)絡(luò)控制器。但是,這類方法無法在那些現(xiàn)實世界里沒有見過的環(huán)境中得到應(yīng)用。

近年來,為了獲得更好的泛化性和魯棒性,研究者們開始采用無模型強(qiáng)化學(xué)習(xí),在模擬中訓(xùn)練控制器,然后將學(xué)習(xí)到的策略直接轉(zhuǎn)移到真實的機(jī)器人上。

那么,如何在無需遙控器操控的條件下,讓四足機(jī)器人實現(xiàn)在復(fù)雜地形上自由流暢地行走呢?

近期,來自美國加州大學(xué)圣地亞哥分校和麻省理工學(xué)院的研究團(tuán)隊,開發(fā)了一個可以提高機(jī)器人 3D 感知能力的模型,能夠支配四足機(jī)器人在各種困難地形場景下完成自動化行走,比如爬樓梯、踩石頭、在樹林中走路等。

視頻所示,該四足機(jī)器人的額頭上裝有前置的深度攝像頭,該攝像頭向下傾斜的角度,可以幫助該機(jī)器人前面的兩足,根據(jù)所看到的前方場景和腳下地形做出正確的行動決策。但其后面的兩足必須先記住前面看過的內(nèi)容,才能確保在經(jīng)過時踩在正確的位置上。

所以,這中間存在一個重要的問題,即需要一個短期的 3D 環(huán)境記憶體,能夠使得機(jī)器人的四足都對三維環(huán)境有良好的感知和模擬。

為此,該團(tuán)隊構(gòu)建了一種神經(jīng)體積記憶(Neural Volumetric Memory,NVM)架構(gòu),可以先借助自監(jiān)督方法對視頻幀中的三維特征進(jìn)行學(xué)習(xí),再用幾何變換把這些三維特征投影到同一個空間下面,最后通過模型將所有的特征信息融合在一起,讓機(jī)器人對它所處的 3D 環(huán)境建立起短期記憶。

其中,需要說明的是,將上述帶有特征的全部視覺信息綜合在一起,可以幫助四足機(jī)器人記住其看到的內(nèi)容,以及足部之前做過的動作,并利用這些記憶指導(dǎo)它下一步行動。這也表明,NVM 能為機(jī)器人執(zhí)行決策提供可靠的 3D 結(jié)構(gòu)信息,并為足式機(jī)器人利用視覺進(jìn)行觀察開辟新的可能性。

2023 年 3 月,相關(guān)論文以《用于視覺運(yùn)動控制的神經(jīng)體積記憶》(Neural Volumetric Memory for Visual Locomotion Control)為題發(fā)表在CVPR上,并被選為Highlight論文[1]。

d50e95f0-4fec-11ee-a25d-92fbcf53809c.jpg

圖丨相關(guān)論文(來源:arXiv)

據(jù)介紹,該研究始于 2022 年 1 月。在當(dāng)時的條件下,該團(tuán)隊先在模擬器環(huán)境下進(jìn)行訓(xùn)練,再轉(zhuǎn)至機(jī)器人上進(jìn)行部署和測試。NVM 模塊可以令四足機(jī)器人在模擬環(huán)境和真實世界中穿越復(fù)雜地形,并獲得更好的模擬-真實泛化結(jié)果。

但是,由于模擬器和機(jī)器人在物理和視覺方面都存在一些差距,因此需要克服許多有難度的工程問題。此外,從模擬器中制定任務(wù),以及做強(qiáng)化學(xué)習(xí)訓(xùn)練所需的代碼,也需要該團(tuán)隊自行開發(fā)。

d52f9732-4fec-11ee-a25d-92fbcf53809c.jpg

圖丨實際部署(來源:arXiv)

據(jù)了解,這項成果建立在該團(tuán)隊之前的一項研究上,此前,該團(tuán)隊使用強(qiáng)化學(xué)習(xí)和基于 Transformer 的模型,將本體感受和視覺信息相結(jié)合,使得四足機(jī)器人能夠避開障礙物,在不平整的地面上行走和奔跑 [2]。

“我們目前這項研究是在不同幀上抽取三維特征,把它們放到同一個三維空間下進(jìn)行合并,而之前的那項研究僅僅將不同幀直接合并起來,當(dāng)做一個視頻放入卷積神經(jīng)網(wǎng)絡(luò)中,沒有做太多三維理解?!闭劶氨卷棾晒〉玫倪M(jìn)展,王小龍表示,“并且,之前機(jī)器人能完成的任務(wù)比較簡單,不能實現(xiàn)爬樓梯或踩木樁這種比較困難的任務(wù)?!?/p>

不過,該團(tuán)隊也表示,他們目前開發(fā)的模型還存在一些局限性。首先,不能引導(dǎo)四足機(jī)器人到達(dá)指定的目的地;其次,完成部署后,機(jī)器人只能簡單地走一條直線,如果看到障礙物,會通過另一條直線避開;此外,機(jī)器人還不能精確控制其去向。

從應(yīng)用層面上看,相較于安裝輪子才能走路的機(jī)器人,四足機(jī)器人的通用性更強(qiáng)。比如,其可以用于應(yīng)急救援領(lǐng)域,執(zhí)行受困人員搜救、廢墟清理等任務(wù);用于下水管道探測等。

后續(xù),該團(tuán)隊不僅計劃開發(fā)更多用于規(guī)劃機(jī)器人的技術(shù),還打算在四足機(jī)器人上增加機(jī)械臂,來執(zhí)行抓取、開門等任務(wù);同時,他們也想讓機(jī)器人實現(xiàn)更多創(chuàng)意性的技能,諸如跳躍、踢球等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29573

    瀏覽量

    212017
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3501

    瀏覽量

    50155
  • 3D感知
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    3805

原文標(biāo)題:科學(xué)家開發(fā)可提高3D感知能力的模型,實現(xiàn)四足機(jī)器人自由行走

文章出處:【微信號:tjrobot,微信公眾號:天津機(jī)器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    人形機(jī)器人 3D 視覺路線之爭:激光雷達(dá)、雙目和 3D - ToF 誰更勝一籌?

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)在人形機(jī)器人的設(shè)計方案中,3D 視覺技術(shù)是實現(xiàn)環(huán)境感知與智能化決策的核心支撐之一。它能夠助力人形機(jī)器人完成
    的頭像 發(fā)表于 04-15 00:14 ?2533次閱讀

    深圳人形機(jī)器人行走視頻震驚英偉達(dá)科學(xué)家,下一個劃時代產(chǎn)品是AI機(jī)器人

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)日前,深圳特區(qū)報發(fā)布了一則國產(chǎn)人形機(jī)器人行走的視頻,該視頻引起了包括英偉達(dá)高級AI研究科學(xué)家Jim Fan在內(nèi)的業(yè)內(nèi)人士和網(wǎng)友的廣泛關(guān)注。由于這款機(jī)器人步態(tài)非常接近
    的頭像 發(fā)表于 01-14 00:53 ?3141次閱讀
    深圳人形<b class='flag-5'>機(jī)器人行走</b>視頻震驚英偉達(dá)<b class='flag-5'>科學(xué)家</b>,下一個劃時代產(chǎn)品是AI<b class='flag-5'>機(jī)器人</b>?

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    ,提高語音識別的準(zhǔn)確率;同時也連接高質(zhì)量的揚(yáng)聲器,確保語音合成后的聲音清晰、自然。TF卡接口能夠存儲大量的語音數(shù)據(jù)、對話模型以及語音機(jī)器人的知識庫,使其具備更豐富的語言表達(dá)和知識儲備
    發(fā)表于 05-28 11:36

    大象機(jī)器人攜手進(jìn)迭時空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    末端執(zhí)行器。 全棧開源 從RISC-V指令集、芯片SDK到機(jī)器人控制代碼100%開放,開發(fā)自由定制算法與控制邏輯。 官方apt倉庫提供deepseek-r1-distill-qwe
    發(fā)表于 04-25 17:59

    海伯森技術(shù)推動機(jī)器人感知能力邁向新高度

    的“感知神經(jīng)元”,公司自主研發(fā)的六維力扭矩傳感器已批量應(yīng)用于20余家頭部機(jī)器人企業(yè),為人形機(jī)器人、協(xié)作機(jī)器人及高端工業(yè)場景提供克級力控精度,推動機(jī)器
    的頭像 發(fā)表于 03-10 11:07 ?536次閱讀

    開源項目!基于Arduino控制的六機(jī)器人

    代碼前需根據(jù)實際機(jī)器人尺寸調(diào)整上述參數(shù),校準(zhǔn)流程詳見步驟2。 步驟8:展示架 3D打印灰色金屬質(zhì)感PLA支架(模型文件),通過8顆螺絲組裝。注意鉆孔時避免材料開裂,安裝時防止支架扭曲變形。 通過以上
    發(fā)表于 03-03 11:25

    機(jī)器人的結(jié)構(gòu)、控制及運(yùn)動控制

    一步提高四機(jī)器人的動態(tài)性能、環(huán)境適應(yīng)性和載重能力仍然是當(dāng)前研究面臨的重大挑戰(zhàn)。 本文系統(tǒng)回顧了
    的頭像 發(fā)表于 01-20 10:15 ?2086次閱讀
    <b class='flag-5'>四</b><b class='flag-5'>足</b><b class='flag-5'>機(jī)器人</b>的結(jié)構(gòu)、控制及運(yùn)動控制

    開源項目!能夠精確地行走、跳舞和執(zhí)行復(fù)雜動作的機(jī)器人—Tillu

    學(xué)習(xí)者和愛好者的理想伙伴。 創(chuàng)新設(shè)計 Tillu的設(shè)計靈感來自廣受歡迎的Otto DIY機(jī)器人,其設(shè)計過程包括在Fusion 360中進(jìn)行CAD建模和精確的3D打印,以實現(xiàn)從堅固的伺服驅(qū)動腿部到模塊化
    發(fā)表于 01-02 17:24

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】2.具身智能機(jī)器人模型

    引入GPT這樣的大模型后,情況發(fā)生了根本性的變化。只需提供適當(dāng)?shù)奶崾驹~以及封裝好的機(jī)器人函數(shù)庫,大模型便能靈活地生成控制代碼,極大地簡化了開發(fā)過程,并
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】1.初步理解具身智能

    (第3章到第6章)介紹具身智能機(jī)器人的基礎(chǔ)模塊,涵蓋機(jī)器人計算系統(tǒng)、自主機(jī)器人感知系統(tǒng)、定位系統(tǒng)及規(guī)劃與控制系統(tǒng)的詳細(xì)內(nèi)容。 第
    發(fā)表于 12-28 21:12

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    設(shè)計專門的編碼器處理視覺、觸覺、位置等不同類型的傳感器數(shù)據(jù),再用cross-attention機(jī)制將它們對齊到同一語義空間。這種設(shè)計不僅提高模型感知能力,還增強(qiáng)了推理過程的可解釋性。在實驗中,RT-1
    發(fā)表于 12-24 15:03

    開源項目!OpenCat—— 一個全能的平價機(jī)器人

    以額外承載約 1 千克的重量(但行走速度會變慢)。它面向 STEM教育和創(chuàng)客社區(qū)。價格將與一些機(jī)器人汽車套件相似。 完整版使用樹莓派來實現(xiàn)更多人工智能增強(qiáng)的感知功能,并指揮一個升級版的
    發(fā)表于 12-16 11:44

    認(rèn)識機(jī)器人與CW32機(jī)器人控制項目

    認(rèn)識機(jī)器人與CW32機(jī)器人控制項目 一、認(rèn)識機(jī)器人 機(jī)器人是一種能夠自動執(zhí)行任務(wù)的
    的頭像 發(fā)表于 09-28 15:46 ?500次閱讀

    【CW32開發(fā)】初探機(jī)器人

    本項目使用8自由度舵機(jī)控制的機(jī)器人。主要用于愛好者學(xué)習(xí)參考。實現(xiàn)基本控制姿態(tài):前進(jìn)、左轉(zhuǎn)、
    的頭像 發(fā)表于 09-25 12:08 ?2077次閱讀
    【CW32<b class='flag-5'>開發(fā)</b>】初探<b class='flag-5'>四</b><b class='flag-5'>足</b><b class='flag-5'>機(jī)器人</b>

    Al大模型機(jī)器人

    和迭代來不斷改進(jìn)自身性能。它們可以從用戶交互中學(xué)習(xí)并根據(jù)反饋進(jìn)行調(diào)整,以提高對話質(zhì)量和準(zhǔn)確性。定制性與整合性: AI大模型機(jī)器人可以根據(jù)特定需求進(jìn)行定制和整合,以滿足不同場景和應(yīng)用的
    發(fā)表于 07-05 08:52

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品