0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)新研究使用合成訓(xùn)練數(shù)據(jù)進(jìn)行機(jī)器人操縱

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-05-23 15:12 ? 次閱讀

NVIDIA的研究人員開發(fā)了第一個(gè)可以教機(jī)器人僅通過觀察人類的行為來完成任務(wù)的深度學(xué)習(xí)系統(tǒng)。該方法利用合成數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò),是第一次在機(jī)器人上使用以圖像為中心的域隨機(jī)化方法。

來自NVIDIA的研究人員開發(fā)了一個(gè)基于深度學(xué)習(xí)的系統(tǒng),該系統(tǒng)可以教機(jī)器人僅通過觀察人類的行為來完成任務(wù)。該方法旨在加強(qiáng)人與機(jī)器人之間的交流,同時(shí)進(jìn)一步研究如何使人類無縫地與機(jī)器人一起工作。這是第一個(gè)這樣的系統(tǒng),研究由Stan Birchfield和Jonathan Tremblay領(lǐng)導(dǎo)。

“要想讓機(jī)器人在現(xiàn)實(shí)世界中執(zhí)行有用的任務(wù),必須要能很容易地將任務(wù)傳達(dá)給機(jī)器人。這包括預(yù)期的結(jié)果以及任何關(guān)于達(dá)到該結(jié)果的最佳方法的提示?!毖芯咳藛T在他們的研究報(bào)告中指出?!巴ㄟ^演示,用戶可以將任務(wù)傳達(dá)給機(jī)器人,并向機(jī)器人提供如何以最佳的方式執(zhí)行任務(wù)的線索?!?/p>

研究人員使用NVIDIA TITAN X GPU訓(xùn)練了一系列神經(jīng)網(wǎng)絡(luò)來執(zhí)行與感知、程序生成和程序執(zhí)行相關(guān)的任務(wù)。結(jié)果顯示,機(jī)器人能夠通過觀察現(xiàn)實(shí)世界的單個(gè)演示來學(xué)習(xí)任務(wù)。

該方法的工作方式:一個(gè)攝像機(jī)被用來捕獲場(chǎng)景的實(shí)時(shí)視頻流,并且通過兩個(gè)神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)地對(duì)場(chǎng)景中對(duì)象的位置和關(guān)系進(jìn)行推斷。由此產(chǎn)生的知覺被輸入到另一個(gè)網(wǎng)絡(luò)中,該網(wǎng)絡(luò)生成一個(gè)解釋如何重建這些感知的計(jì)劃。 最后,一個(gè)執(zhí)行網(wǎng)絡(luò)讀取該計(jì)劃并為機(jī)器人生成動(dòng)作,同時(shí)考慮到當(dāng)前場(chǎng)景的狀態(tài),以確保對(duì)外部干擾的穩(wěn)健性。

一旦機(jī)器人得到一個(gè)任務(wù),它就會(huì)生成一個(gè)人類可讀取的關(guān)于重新執(zhí)行該任務(wù)所需步驟的描述。該描述讓用戶能夠在機(jī)器人執(zhí)行之前快速識(shí)別和糾正機(jī)器人對(duì)人類演示的解釋中的問題。

實(shí)現(xiàn)這種能力的關(guān)鍵是利用合成數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。目前訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法需要大量有標(biāo)記的訓(xùn)練數(shù)據(jù),這對(duì)這類系統(tǒng)來說是一個(gè)瓶頸。通過合成數(shù)據(jù)生成,不用太費(fèi)力就可以生成幾乎無限的標(biāo)記訓(xùn)練數(shù)據(jù)。

這也是第一次在機(jī)器人上使用以圖像為中心的域隨機(jī)化方法。域隨機(jī)化(domain randomization)是一種產(chǎn)生大量多樣性的合成數(shù)據(jù)的技術(shù),然后愚弄感知網(wǎng)絡(luò)將真實(shí)世界的數(shù)據(jù)看作是其訓(xùn)練數(shù)據(jù)的另一種變體。研究人員選擇以圖像為中心的方式處理數(shù)據(jù),以確保網(wǎng)絡(luò)不依賴于攝像機(jī)或環(huán)境。

研究人員說:“如描述所示,這個(gè)感知網(wǎng)絡(luò)適用于任何固態(tài)的現(xiàn)實(shí)世界物體,這些物體可以通過其3D邊界立方體(bounding cuboid)來模擬。”“盡管訓(xùn)練過程中從未觀察到真實(shí)的圖像,但感知網(wǎng)絡(luò)能夠在真實(shí)圖像中可靠地檢測(cè)到物體的bounding cuboid,即使在有嚴(yán)重的遮擋的情況下也是如此。”

在他們的演示中,研究團(tuán)隊(duì)用幾個(gè)彩色積木和一輛玩具汽車訓(xùn)練目標(biāo)檢測(cè)器。系統(tǒng)被教授“塊”(blocks)的物理關(guān)系,不管這些“塊”是堆疊在一起還是彼此相鄰放置。

在上面的演示視頻中,人類操作員向機(jī)器人展示了一組立方塊。系統(tǒng)然后推斷一個(gè)適當(dāng)?shù)某绦虿凑_的順序?qū)⒘⒎綁K正確地放置好。因?yàn)樗趫?zhí)行過程中會(huì)考慮當(dāng)前世界的狀態(tài),因此系統(tǒng)能夠?qū)崟r(shí)地從錯(cuò)誤中恢復(fù)過來。

研究人員將在本周于澳大利亞布里斯班舉行的機(jī)器人與自動(dòng)化國(guó)際會(huì)議(ICRA)上發(fā)表他們的研究論文和工作。

該團(tuán)隊(duì)表示,他們將繼續(xù)探索使用合成訓(xùn)練數(shù)據(jù)進(jìn)行機(jī)器人操縱,以將他們的方法擴(kuò)展到其他場(chǎng)景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28579

    瀏覽量

    207802
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5063

    瀏覽量

    103436
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5511

    瀏覽量

    121362

原文標(biāo)題:一看就會(huì)!英偉達(dá)新研究教機(jī)器人僅通過觀察人類行為完成任務(wù)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英偉達(dá)推出基石世界模型Cosmos,解決智駕與機(jī)器人具身智能訓(xùn)練數(shù)據(jù)問題

    。Cosmos 世界基礎(chǔ)模型(WFM)使開發(fā)者能夠輕松生成大量基于物理學(xué)的逼真合成數(shù)據(jù),以用于訓(xùn)練和評(píng)估其現(xiàn)有的模型。開發(fā)者還可以通過微調(diào) Cosmos WFM 構(gòu)建自定義模型。 為加速機(jī)器人和自動(dòng)駕駛
    的頭像 發(fā)表于 01-14 11:04 ?154次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>推出基石世界模型Cosmos,解決智駕與<b class='flag-5'>機(jī)器人</b>具身智能<b class='flag-5'>訓(xùn)練</b><b class='flag-5'>數(shù)據(jù)</b>問題

    《具身智能機(jī)器人系統(tǒng)》第10-13章閱讀心得之具身智能機(jī)器人計(jì)算挑戰(zhàn)

    取特征點(diǎn),涉及大量像素級(jí)比較運(yùn)算;優(yōu)化機(jī)器人位姿,需要迭代求解大規(guī)模矩陣方程。書中提出了模塊化的硬件加速方案,闡述了如何以因子圖為通用模版,以求解非線性優(yōu)化問題為橋梁,面向多種機(jī)器人應(yīng)用進(jìn)行加速。 第11
    發(fā)表于 01-04 01:15

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    ,數(shù)據(jù)對(duì)于訓(xùn)練增強(qiáng)和優(yōu)化機(jī)器人能力的深度學(xué)習(xí)模型至關(guān)重要。 從財(cái)務(wù)上講,用戶數(shù)據(jù)對(duì)互聯(lián)網(wǎng)公司具有重要價(jià)值,估計(jì)每個(gè)用戶 600 美元,考慮到大規(guī)模商業(yè)化后每個(gè)
    發(fā)表于 12-24 00:33

    英偉達(dá)計(jì)劃推出驅(qū)動(dòng)人形機(jī)器人新技術(shù)

    英偉達(dá)(Nvidia)近日宣布,其用于驅(qū)動(dòng)人形機(jī)器人的新技術(shù)將于2025年上半年正式上市。這一舉措旨在搶占快速增長(zhǎng)的機(jī)器人市場(chǎng),并確立英偉
    的頭像 發(fā)表于 11-19 17:25 ?569次閱讀

    英偉達(dá)預(yù)測(cè)機(jī)器人領(lǐng)域或迎“GPT-3時(shí)刻”

    英偉達(dá),作為全球圖形處理器與人工智能領(lǐng)域的佼佼者,正引領(lǐng)著科技界對(duì)機(jī)器人未來的無限遐想。近日,英偉達(dá)高級(jí)科學(xué)家Jim Fan在科技媒體The
    的頭像 發(fā)表于 09-20 17:05 ?829次閱讀

    英偉達(dá)利用人工智能和Omniverse加速人形機(jī)器人開發(fā)

    8月6日,英偉達(dá)揭曉了一項(xiàng)創(chuàng)新工作流程,該流程深度融合了人工智能技術(shù)與其Omniverse平臺(tái),旨在為人形機(jī)器人的研發(fā)按下加速鍵。通過巧妙結(jié)合蘋果Vision Pro的先進(jìn)功能與英偉
    的頭像 發(fā)表于 08-06 17:29 ?735次閱讀

    英偉達(dá)打造人形機(jī)器人訓(xùn)練平臺(tái),引領(lǐng)AI新紀(jì)元

    英偉達(dá)近日宣布了一項(xiàng)重大舉措,為全球機(jī)器人制造業(yè)與AI領(lǐng)域注入強(qiáng)勁動(dòng)力。公司推出了專為人形機(jī)器人設(shè)計(jì)的訓(xùn)練平臺(tái),旨在為行業(yè)領(lǐng)先的制造商、AI
    的頭像 發(fā)表于 08-05 11:45 ?772次閱讀

    阿爾特?cái)y手英偉達(dá),將Omniverse融入機(jī)器人研發(fā)

     近日,阿爾特公司在其機(jī)構(gòu)調(diào)研活動(dòng)中透露,公司正攜手英偉達(dá)技術(shù)團(tuán)隊(duì),將Omniverse平臺(tái)深度融入機(jī)器人研發(fā)領(lǐng)域,旨在打通英偉達(dá)全面的
    的頭像 發(fā)表于 07-25 12:40 ?766次閱讀

    Al大模型機(jī)器人

    理解能力強(qiáng)大: AI大模型機(jī)器人可以理解和生成自然語言,能夠進(jìn)行復(fù)雜的對(duì)話和語言任務(wù)。它們能夠識(shí)別語言中的語義、語境和情感,并據(jù)此作出適當(dāng)?shù)幕貞?yīng)。廣泛的知識(shí)儲(chǔ)備: 這些模型基于大規(guī)模的數(shù)據(jù)進(jìn)
    發(fā)表于 07-05 08:52

    人形機(jī)器人的未來:從英偉達(dá)到特斯拉的機(jī)器人革命

    在科技飛速發(fā)展的今天,機(jī)器人技術(shù)正逐步從科幻走向現(xiàn)實(shí)。近日,英偉達(dá)CEO黃仁勛在一次采訪中大膽預(yù)測(cè),機(jī)器人技術(shù)將在未來2-3年內(nèi)取得重大突破,并預(yù)言人形
    的頭像 發(fā)表于 06-18 14:56 ?582次閱讀

    英偉達(dá)CEO黃仁勛展望AI與機(jī)器人新時(shí)代

    在COMPUTEX 2024大會(huì)上,英偉達(dá)CEO黃仁勛發(fā)表了激動(dòng)人心的演講,他看好機(jī)器人即將跨入擁有更強(qiáng)感知能力和系統(tǒng)的全新時(shí)代。黃仁勛強(qiáng)調(diào)了自家人工智能(AI)Omniverse技術(shù)在這一領(lǐng)域的巨大潛力,該技術(shù)將助力
    的頭像 發(fā)表于 06-03 11:30 ?788次閱讀

    英偉達(dá)發(fā)布人形機(jī)器人基礎(chǔ)模型

    英偉達(dá)在一年一度的GTC開發(fā)者大會(huì)上,由創(chuàng)始黃仁勛親自揭曉了令人矚目的Project GR00T人形機(jī)器人項(xiàng)目,其中引人注目的是一款全新的人形機(jī)器
    的頭像 發(fā)表于 03-21 11:43 ?808次閱讀

    英偉達(dá)GTC大會(huì)丨宇樹通用人形機(jī)器人H1與全球共同擁抱AI

    2024年3月19日,英偉達(dá)CEO黃仁勛在美國(guó)加州圣何塞SAP中心發(fā)表主題演講《見證AI的變革時(shí)刻》,正式拉開了2024年英偉達(dá)GTC大會(huì)的序幕。 宇樹(Unitree)通用人形
    的頭像 發(fā)表于 03-20 14:55 ?688次閱讀

    人形機(jī)器人火熱 OpenAI入局人形機(jī)器人 英偉達(dá)等巨頭入局機(jī)器人行業(yè)

    人形機(jī)器人火熱 OpenAI入局人形機(jī)器人 英偉達(dá)等巨頭入局機(jī)器人行業(yè) 人形機(jī)器人在AI的帶動(dòng)下
    的頭像 發(fā)表于 02-26 17:21 ?836次閱讀

    英偉達(dá)推出全新AI聊天機(jī)器人

    近日,英偉達(dá)(Nvidia)宣布推出其全新的AI聊天機(jī)器人——“Chat With RTX”。這款聊天機(jī)器人被視為英偉
    的頭像 發(fā)表于 02-19 11:09 ?961次閱讀