0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook讓機器人學會了自主繞道走路

Hf1h_BigDataDig ? 來源:fqj ? 2019-06-06 14:21 ? 次閱讀

人類每天都在進行不同層次的規(guī)劃活動,比如說每天早上起床以后,你習慣性走到廚房喝一杯咖啡:你會先走下走廊,左轉(zhuǎn)進入過道,然后進入右邊的房間。

對于這些習慣成自然的流程,你無需思考,不會刻意去想你要使用哪一個肢體動作。但對于機器人而言,這并非易事。

Facebook剛剛發(fā)布了主導研究的新系統(tǒng),讓機器人也可以通過觀看視頻,拆解動作,并學習如何組合這些動作形成自己的規(guī)劃。

層級抽象結(jié)構(gòu)(hierarchal abstractions)

已經(jīng)有越來越多的研究表明,層級抽象結(jié)構(gòu)(即視覺運動子程序)可以提高強化學習中的采樣效率,這是一種利用獎勵驅(qū)動智能體達到目標的AI訓練技術。

在過去,這些層次結(jié)構(gòu)必須通過端到端的訓練來手動編碼或獲取,而這需要大量的時間、注意力和長久的耐心。

Facebook這次的新研究提出,刻意讓機器人通過觀看視頻學習導航,描述一個通過用逆向機器學習模型攝取視頻偽標簽(在本文中,偽標簽指智能體想象的行為),從而學習層次結(jié)構(gòu)的系統(tǒng)。

論文作者分別來自Facebook AI研究室,加州大學伯克利分校和伊利諾伊大學厄巴納—香檳分校。

這讓人想起去年Facebook開源的一組模型——Talk the Walk。它只需要360°的全景圖像、自然語言以及一張有當?shù)氐貥耍ū热玢y行和餐館)的地圖就可以通過問路,實現(xiàn)在整個紐約市的街道導航。

具體實現(xiàn)方式

機器人通過觀看這些視頻,研究這些簡單的視覺運動子程序是如何組合以達到高級的抽象層次,這些視覺運動子程序能夠解決一些已知問題,即經(jīng)典的規(guī)劃中的高計算成本和強化學習中的樣本復雜性的問題。

研究者提出的系統(tǒng)分為兩個階段,在第一階段,研究人員通過運行在隨機探索數(shù)據(jù)上自我監(jiān)督的智能體模型生成偽標簽。模型從分布在四個環(huán)境中的1500個不同位置學習,在不同的位置隨機執(zhí)行30個不同步驟的動作,從而產(chǎn)生45,000個交互樣本。

在系統(tǒng)的第二階段,大約217,000個偽標記視頻被剪輯成220萬個單獨的小視頻,再將其輸入預測參考視頻中相應動作的模型,同時再通過一個單獨的網(wǎng)絡檢查參考視頻中的動作序列,并編碼其行為作為向量。另一個模型通過推斷第一幀的軌跡的編碼,來預測哪一個子程序可以調(diào)用給已有的視頻幀。

交互樣本從1000萬減少到4.5萬

在一個部署在辦公環(huán)境的真實世界中的機器人實驗中,研究人員表明,相比單純交互的方法,至少應用在之前從未見過的環(huán)境上,通過觀看視頻來學習技能(這里指采用最高效的方式前往目標位置)的方式能達到更好的效果。

最令人印象深刻的是,訓練有素的模型學會了自主地前進導航并避開障礙物,比通過單純交互方式要快4倍,這使得機器人能夠做到完全自主地長距離行進。

“特別引人注目的是,這些模型從總計45,000次的環(huán)境交互中學習,”研究人員寫道,“從第一視角的視頻中成功學習,使得智能體能夠執(zhí)行連貫的軌跡,即使它只執(zhí)行過隨機動作。此外,它優(yōu)于最先進的技能學習技術,該技術需要更大量的訓練樣本,大致1000萬個?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28606

    瀏覽量

    207861
  • Facebook
    +關注

    關注

    3

    文章

    1429

    瀏覽量

    54864

原文標題:Facebook讓機器人“觀看”上萬次視頻后,TA學會了自主繞道走路

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    構(gòu)建人形機器人學習的合成運動生成管線

    通用人形機器人旨在快速適應現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復或體力要求高的任務。這些移動機器人經(jīng)過設計,能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療保健機構(gòu),它們的價值日益凸顯。
    的頭像 發(fā)表于 01-16 10:58 ?218次閱讀
    構(gòu)建人形<b class='flag-5'>機器人學</b>習的合成運動生成管線

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎模塊

    具身智能機器人的基礎模塊,這個是本書的第二部分內(nèi)容,主要分為四個部分:機器人計算系統(tǒng),自主機器人的感知系統(tǒng),自主機器人的定位系統(tǒng),自主機器人
    發(fā)表于 01-04 19:22

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    中取得了令人矚目的效果。 閱讀感悟 從傳統(tǒng)的手動編程到借助大模型實現(xiàn)智能化、自主化,從單一模態(tài)的交互到多模態(tài)信息的深度融合,再到擴散模型的應用,機器人控制技術正在以驚人的速度進化。這不僅機器
    發(fā)表于 12-29 23:04

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.初步理解具身智能

    工智能 認知發(fā)展機器人學 進化機器人學 物理體現(xiàn)與互動 五、具身智能的現(xiàn)代技術方向 另外,隨著GPT等大語言模型的發(fā)展,這些技術也在具身智能機器人領域掀起了一股浪潮,那就是基于大模型的具身智能技術
    發(fā)表于 12-28 21:12

    【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

    動態(tài)互動的。 該理論強調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務的能力。具身智能的實現(xiàn)涵蓋了機器學習、人工智能、機器人學、計算機視覺、自然語言處理及強化學習等領域
    發(fā)表于 12-20 19:17

    《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎模塊

    的導引,讀者對于具身智能機器人系統(tǒng)的相關背景知識、基礎模塊都有一個初步的認識和掌握。除了在\"5.3.2 自主機器人定位算法原理”這一小節(jié)將基于貝葉斯濾波的機器人定位部分,涉及有需要
    發(fā)表于 12-19 22:26

    麻省理工學院推出新型機器人訓練模型

    近日,據(jù)TechCrunch報道,麻省理工學院的研究團隊展示了一種創(chuàng)新的機器人訓練模型,該模型突破了傳統(tǒng)模仿學習方法的局限,不再依賴標準數(shù)據(jù)集,而是借鑒了大型語言模型(LLM)如GPT-4等所使用的大規(guī)模信息處理方式,為機器人學習新技能開辟了全新的道路。
    的頭像 發(fā)表于 11-04 14:56 ?530次閱讀

    機器人的三大矩陣是什么及關系式

    機器人學中,三大矩陣主要指的是與機器人位移、速度和力相關的矩陣,它們分別揭示了機器人在不同空間(如關節(jié)空間和作業(yè)空間)之間的映射關系。這三大矩陣及其關系式可以概括如下: 1. T矩陣(變換矩陣
    的頭像 發(fā)表于 09-04 09:37 ?1692次閱讀

    “卷不動了”?OTA來救場!智能機器人“永葆青春”的秘訣

    的掃地機器人突然學會了拖地,是不是很酷?OTA就是這種“逆天改命”成為可能的魔法! 1、智能機器人的發(fā)展趨勢與OTA機遇 智能機器人3.0
    的頭像 發(fā)表于 08-06 16:01 ?461次閱讀
    “卷不動了”?OTA來救場!智能<b class='flag-5'>機器人</b>“永葆青春”的秘訣

    ROS機器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    本帖最后由 Tronlong創(chuàng)龍科技 于 2024-7-19 17:18 編輯 ROS系統(tǒng)是什么 ROS(Robot Operating System)是一個適用于機器人的開源的元操作系統(tǒng)。它
    發(fā)表于 07-09 11:38

    NVIDIA Isaac 機器人平臺利用最新的生成式 AI 和先進的仿真技術,加速 AI 機器人技術的發(fā)展

    觀眾展示了用于人形機器人學習的通用基礎模型 Project GR00T(代表通用機器人 00 技術)。Project GR00T 利用 NVIDIA Isaac 機器人平臺的各種工具來創(chuàng)建用于人形
    的頭像 發(fā)表于 06-04 18:00 ?7758次閱讀
    NVIDIA Isaac <b class='flag-5'>機器人</b>平臺利用最新的生成式 AI 和先進的仿真技術,加速 AI <b class='flag-5'>機器人</b>技術的發(fā)展

    奧比中光攜手新加坡LionsBot,智能清潔機器人落地超過30個國家

    近年來,隨著AI 3D視覺技術飛速發(fā)展,各類創(chuàng)新型自主移動機器人不斷涌現(xiàn)。行業(yè)領先的機器人視覺與AI視覺科技公司奧比中光與新加坡自主清潔機器人
    的頭像 發(fā)表于 04-16 09:32 ?630次閱讀

    NVIDIA Isaac機器人平臺升級,加速AI機器人技術革新

    NVIDIA Isaac機器人平臺近期實現(xiàn)重大升級,通過引入最新的生成式AI技術和先進的仿真技術,顯著加速了AI機器人技術的發(fā)展步伐。該平臺正不斷擴展其基礎模型、機器人學習框架、AI工作流編排以及
    的頭像 發(fā)表于 03-27 10:36 ?724次閱讀

    機器人學習中主流智能抓取方案

    RGB顏色空間由紅綠藍三種基本色組成,疊加成任意色彩,同樣地,任意一種顏色也可以拆解為三種基本色的組合,機器人通過顏色坐標值來理解“顏色”。
    發(fā)表于 03-13 10:07 ?323次閱讀
    <b class='flag-5'>機器人學</b>習中主流智能抓取方案

    自主移動機器人(AMR)功能和特點

    復合機器人是一種集成了移動機器人、協(xié)作機器人機器視覺等多項功能的新型機器人。它的開發(fā)目的是為了解決工廠物流中最后一米的問題,提供智能搬運解
    的頭像 發(fā)表于 02-28 15:05 ?2163次閱讀
    <b class='flag-5'>自主</b>移動<b class='flag-5'>機器人</b>(AMR)功能和特點