0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DON抓取算法:訓(xùn)練無需標(biāo)注數(shù)據(jù)集,省時(shí)省力

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-09-14 08:37 ? 次閱讀

MIT團(tuán)隊(duì)打造“密集目標(biāo)網(wǎng)絡(luò)”(DON)的機(jī)器人系統(tǒng),能夠讓抓取機(jī)器人真正“讀懂”目標(biāo),該系統(tǒng)將目標(biāo)處理生成三維“視覺路線圖”的點(diǎn)集合,讓機(jī)器人真正在視覺上理解目標(biāo)。利用這一系統(tǒng),科學(xué)家們不必再像過去的計(jì)算機(jī)視覺研究一樣,繁瑣地對大量數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行標(biāo)記了。

長期以來,人類一直以靈巧著稱,這種特點(diǎn)在很大程度上要?dú)w功于我們的眼睛。不過現(xiàn)在,機(jī)器人也逐步迎頭趕上。經(jīng)過幾十年的發(fā)展,現(xiàn)在用于生產(chǎn)線等受控環(huán)境中的機(jī)器人已經(jīng)能夠一次又一次地拾起同一個(gè)目標(biāo)了。

最近在計(jì)算機(jī)視覺方面的突破,讓機(jī)器人也能區(qū)分出不同的目標(biāo)。不過即使這樣,機(jī)器人還是無法真正理解物體的形狀,因此在拾取目標(biāo)后,幾乎無法再做什么別的事。

近日,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員在一篇新論文中表示,他們已在這個(gè)領(lǐng)域取得了一項(xiàng)重要進(jìn)展:他們打造的機(jī)器人系統(tǒng)可以識別出之前未見過的隨機(jī)目標(biāo),并能夠在視覺上“理解”這些目標(biāo),以完成更豐富的任務(wù)。

研究人員使用KUKA機(jī)器人抓起一只杯子

“密集對象網(wǎng)絡(luò)”:讓機(jī)器人讀懂抓取目標(biāo)

該系統(tǒng)名為“密集對象網(wǎng)絡(luò)”(DON),該網(wǎng)絡(luò)將對象視為點(diǎn)的集合,當(dāng)作“視覺路線圖”來使用。這種方法可以讓機(jī)器人更好地理解和抓取目標(biāo),最重要的是,機(jī)器人能夠在大量類似目標(biāo)中挑出特定的目標(biāo)。亞馬遜和沃爾瑪?shù)?a target="_blank">公司在其倉庫中使用的機(jī)器就具備類似的技能。

比如,有人可能會使用DON系統(tǒng)讓機(jī)器人抓住目標(biāo)上的特定位置,比如鞋舌頭。之后,它就能夠看到之前從未見過的鞋子,并成功抓住鞋舌頭。

參與該研究的博士生Lucas Manuelli說道:“許多控制系統(tǒng)和識別方法都無法識別朝多個(gè)方向放置的目標(biāo)的特定部分。”他與該論文另一作者、博士生Pete Florence和MIT教授Russ Tedrake一起撰寫了該論文。 “比如,現(xiàn)有的算法就無法抓住馬克杯的杯柄,尤其是在馬克杯朝多個(gè)方向放置的情況下,比如直立或側(cè)放?!?/p>

該團(tuán)隊(duì)認(rèn)為,該技術(shù)不僅能用于工業(yè)制造,還能走入家庭的日常生活。比如,給系統(tǒng)展示一座整潔的房子的圖像,讓機(jī)器人在你工作時(shí)打掃房間,或向機(jī)器人展示菜肴的圖像,讓機(jī)器人在你度假時(shí)把你的餐桌上的盤子收拾好。

DON抓取算法:訓(xùn)練無需標(biāo)注數(shù)據(jù)集,省時(shí)省力

值得注意的一點(diǎn)是,沒有任何數(shù)據(jù)事先被人類標(biāo)記過。這個(gè)系統(tǒng)是“自我監(jiān)督的”,因此不需要任何來自人類的數(shù)據(jù)標(biāo)注。

機(jī)器人抓取目標(biāo)的兩種常見方法是,創(chuàng)建特定任務(wù)的機(jī)器學(xué)習(xí),創(chuàng)建通用的抓取算法。這兩種技術(shù)都存在障礙:基于特定任務(wù)的方法很難推廣到其他任務(wù),而通用的抓取算法不夠具體,無法顧及處理特定任務(wù)時(shí)的細(xì)微差別,比如將目標(biāo)放到特定的位置上。

而DON系統(tǒng)基本上是在給定目標(biāo)上創(chuàng)建一系列坐標(biāo),作為基于目標(biāo)的一種“視覺路線圖”,使機(jī)器人更好地理解自己需要抓取哪些目標(biāo),目標(biāo)在何處等。

該團(tuán)隊(duì)訓(xùn)練系統(tǒng)將對象視為構(gòu)成較大坐標(biāo)系的一系列點(diǎn)。然后將不同的點(diǎn)映射到一起,顯示出對象的三維形狀,這種方式和使用多張照片拼接全景照片的方式有些類似。在訓(xùn)練之后,如果指定目標(biāo)上的一個(gè)點(diǎn),機(jī)器人可以拍攝該物體的照片,并一系列的點(diǎn)進(jìn)行識別和匹配,然后就可以指定點(diǎn)拾取目標(biāo)。

這個(gè)系統(tǒng)與加州大學(xué)伯克利分校的DexNet系統(tǒng)有所不同,伯克利的系統(tǒng)可以抓取許多不同的目標(biāo),但不能滿足抓取特定目標(biāo)的要求。就好比一個(gè)一歲半的嬰兒,他不明白你想要他玩哪個(gè)玩具,但仍然可以抓起很多不同的玩具,而一個(gè)四歲的孩子,就可以準(zhǔn)確地回應(yīng)“去抓住那輛紅色小卡車的車尾”的要求。

在形狀對稱毛絨玩具上進(jìn)行的一組測試中,由DON驅(qū)動的Kuka機(jī)器人手臂可以從一系列不同的目標(biāo)位置抓住玩具的右耳。這表明系統(tǒng)具有在對稱物體上區(qū)分左右的能力。

在利用不同棒球帽進(jìn)行測試時(shí),DON可以選擇特定的目標(biāo)帽子,盡管所有的帽子的設(shè)計(jì)都非常相似,機(jī)器人在之前從未在訓(xùn)練數(shù)據(jù)中看到過帽子的照片。

未來,團(tuán)隊(duì)希望將系統(tǒng)進(jìn)行改進(jìn),讓其具備執(zhí)行特定任務(wù)的能力,同時(shí)能夠更深入地了解相應(yīng)的目標(biāo),例如學(xué)習(xí)如何抓住目標(biāo),并將其移動到最終位置等。

團(tuán)隊(duì)將于下個(gè)月在瑞士蘇黎世舉行的機(jī)器人學(xué)習(xí)會議上發(fā)表這一成果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28632

    瀏覽量

    207967
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1700

    瀏覽量

    46074
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1209

    瀏覽量

    24789

原文標(biāo)題:MIT識物機(jī)器人:“秒懂”物體,過目不忘,不用標(biāo)記數(shù)據(jù)!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】+大模型微調(diào)技術(shù)解讀

    對模型進(jìn)行進(jìn)一步訓(xùn)練的過程。 大模型微調(diào)是利用預(yù)訓(xùn)練模型的權(quán)重和特征,通過在新任務(wù)數(shù)據(jù)上的訓(xùn)練
    發(fā)表于 01-14 16:51

    AI自動圖像標(biāo)注工具SpeedDP將是數(shù)據(jù)標(biāo)注行業(yè)發(fā)展的重要引擎

    利用AI模型訓(xùn)練打造的深度學(xué)習(xí)算法開發(fā)平臺SpeedDP,就可以替代人工進(jìn)行海量的圖像數(shù)據(jù)標(biāo)注。相比于人工,SpeedDP具有多個(gè)優(yōu)勢。更快熟練的人工
    的頭像 發(fā)表于 01-02 17:53 ?192次閱讀
    AI自動圖像<b class='flag-5'>標(biāo)注</b>工具SpeedDP將是<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>行業(yè)發(fā)展的重要引擎

    標(biāo)貝數(shù)據(jù)標(biāo)注在智能駕駛訓(xùn)練中的落地案例

    標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點(diǎn)云標(biāo)注以及3D&2D融合等標(biāo)注方式為智能駕駛領(lǐng)域客戶提供環(huán)境感知、決策策劃、車道線標(biāo)注、障
    的頭像 發(fā)表于 12-24 15:17 ?556次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>在智能駕駛<b class='flag-5'>訓(xùn)練</b>中的落地案例

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    自動駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動駕駛感知模型需要使用大量準(zhǔn)確真實(shí)的數(shù)據(jù)。據(jù)英特爾計(jì)算,L3+級自動駕駛每輛汽車每天產(chǎn)生的數(shù)據(jù)高達(dá)4000GB,作為自動駕
    的頭像 發(fā)表于 11-22 15:07 ?1027次閱讀
    標(biāo)貝科技:自動駕駛中的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>類別分享

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    自動駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動駕駛感知模型需要使用大量準(zhǔn)確真實(shí)的數(shù)據(jù)。據(jù)英特爾計(jì)算,L3+級自動駕駛每輛汽車每天產(chǎn)生的數(shù)據(jù)高達(dá)4000GB,作為自動駕
    的頭像 發(fā)表于 11-22 14:58 ?949次閱讀
    標(biāo)貝科技:自動駕駛中的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>類別分享

    工具型AI標(biāo)注平臺SpeedDP工作流程是怎樣的?

    SpeedDP作為一個(gè)工具型AI平臺,它能提供從數(shù)據(jù)標(biāo)注、模型訓(xùn)練、測試驗(yàn)證到RockChip嵌入式硬件平臺模型部署的可視化AI開發(fā)功能。平臺所需算法并不是固定的,使用者可以根據(jù)自身實(shí)
    的頭像 發(fā)表于 11-19 01:02 ?421次閱讀
    工具型AI<b class='flag-5'>標(biāo)注</b>平臺SpeedDP工作流程是怎樣的?

    Pytorch深度學(xué)習(xí)訓(xùn)練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學(xué)習(xí)訓(xùn)練
    的頭像 發(fā)表于 10-28 14:05 ?247次閱讀
    Pytorch深度學(xué)習(xí)<b class='flag-5'>訓(xùn)練</b>的方法

    AI大模型的訓(xùn)練數(shù)據(jù)來源分析

    學(xué)術(shù)機(jī)構(gòu)、政府組織或企業(yè)公開發(fā)布,涵蓋了各種類型的數(shù)據(jù),如圖像、文本、音頻、視頻等。例如: ImageNet :一個(gè)廣泛用于圖像識別任務(wù)的大規(guī)模圖像數(shù)據(jù)。 Common Crawl :提供了大量的網(wǎng)頁
    的頭像 發(fā)表于 10-23 15:32 ?955次閱讀

    SpeedDP! 超便利AI自動圖像標(biāo)注工具 功能豐富、省時(shí)省力

    超級AI,在線標(biāo)注,既能解放雙手,又省時(shí)省力。傳統(tǒng)的標(biāo)注模式需要你對著目標(biāo)不斷拉框,反復(fù)機(jī)械的動作做多了就變得“麻木”,影響效率還使人煩惱。而SpeedDP的出現(xiàn),可以有效的提升標(biāo)注
    的頭像 發(fā)表于 08-30 12:59 ?329次閱讀
    SpeedDP! 超便利AI自動圖像<b class='flag-5'>標(biāo)注</b>工具   功能豐富、<b class='flag-5'>省時(shí)省力</b>

    pycharm怎么訓(xùn)練數(shù)據(jù)

    在本文中,我們將介紹如何在PyCharm中訓(xùn)練數(shù)據(jù)。PyCharm是一款流行的Python集成開發(fā)環(huán)境,提供了許多用于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的工具。 1. 安裝PyCharm和相關(guān)庫 首
    的頭像 發(fā)表于 07-11 10:10 ?701次閱讀

    如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練、驗(yàn)證和測試

    理解機(jī)器學(xué)習(xí)中的訓(xùn)練、驗(yàn)證和測試,是掌握機(jī)器學(xué)習(xí)核心概念和流程的重要一步。這三者不僅構(gòu)成了模型學(xué)習(xí)與評估的基礎(chǔ)框架,還直接關(guān)系到模型性能的可靠性和泛化能力。以下是一篇深入探討這三
    的頭像 發(fā)表于 07-10 15:45 ?4578次閱讀

    人臉識別模型訓(xùn)練流程

    準(zhǔn)備階段,需要收集大量的人臉圖像數(shù)據(jù),并進(jìn)行數(shù)據(jù)清洗、標(biāo)注和增強(qiáng)等操作。 1.1 數(shù)據(jù)收集 數(shù)據(jù)收集是人臉識別模型
    的頭像 發(fā)表于 07-04 09:19 ?1076次閱讀

    PyTorch如何訓(xùn)練自己的數(shù)據(jù)

    PyTorch是一個(gè)廣泛使用的深度學(xué)習(xí)框架,它以其靈活性、易用性和強(qiáng)大的動態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時(shí),數(shù)據(jù)是不可或缺的組成部分。然而,很多時(shí)候,我們可能需要使用自己的數(shù)據(jù)
    的頭像 發(fā)表于 07-02 14:09 ?1953次閱讀

    K折交叉驗(yàn)證算法訓(xùn)練

    K折交叉驗(yàn)證算法訓(xùn)練
    的頭像 發(fā)表于 05-15 09:26 ?617次閱讀

    如何省時(shí)省力地優(yōu)化差分對過孔過渡?

    科技已成為我們生活中不可或缺的一部分且正在不斷改變我們的世界。正因如此,系統(tǒng)設(shè)計(jì)變得更加復(fù)雜,為了確保性能、功能和可靠性,設(shè)計(jì)的仿真參數(shù)不斷增加。優(yōu)化擁有眾多仿真參數(shù)的設(shè)計(jì)是一項(xiàng)極具挑戰(zhàn)性的工作,設(shè)計(jì)人員對此深有體會,因?yàn)檫@項(xiàng)任務(wù)需要耗費(fèi)大量的計(jì)算資源、時(shí)間和成本。最終,這種方法將難以為繼。試想一下,假設(shè)一項(xiàng)設(shè)計(jì)仿真有10個(gè)可控制的參數(shù),而每個(gè)參數(shù)有10個(gè)可
    的頭像 發(fā)表于 04-29 08:12 ?611次閱讀
    如何<b class='flag-5'>省時(shí)省力</b>地優(yōu)化差分對過孔過渡?