0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種讓機(jī)器人能夠與人們遞接物體的人機(jī)交互方法

NVIDIA英偉達(dá) ? 來(lái)源:英偉達(dá)NVIDIA中國(guó) ? 2020-04-29 16:43 ? 次閱讀

在倉(cāng)庫(kù)與家庭場(chǎng)景中,為了進(jìn)一步打造出能夠與人類(lèi)進(jìn)行安全、有效合作的機(jī)器人,NVIDIA 西雅圖 AI 機(jī)器人研究實(shí)驗(yàn)室(Seattle AI Robotics Research Lab)的研究人員,開(kāi)發(fā)出了一種讓機(jī)器人能夠與人們遞接物體的人機(jī)交互方法。

該系統(tǒng)目前還處于概念驗(yàn)證階段。與以往方法相比,這個(gè)方法可以實(shí)現(xiàn)更流暢的遞接,進(jìn)而幫助倉(cāng)庫(kù)機(jī)器人,甚至廚房助手機(jī)器人更好地進(jìn)行人機(jī)交互。

解決這個(gè)問(wèn)題的關(guān)鍵在于,需要開(kāi)發(fā)一套感知系統(tǒng)來(lái)精確識(shí)別手和遞接物體的各種姿態(tài)。在遞接物體時(shí),人們可能正在專(zhuān)注于其他事情,手和物體通常會(huì)相互遮擋。為了解決這個(gè)問(wèn)題,研究團(tuán)隊(duì)將該方法分成了多個(gè)階段。

首先,該團(tuán)隊(duì)定義了一組握持動(dòng)作,這組動(dòng)作描述了人手進(jìn)行遞接時(shí)握持物體的方式。

研究人員在其論文中解釋道:“當(dāng)用手握住一個(gè)物體時(shí),手的姿勢(shì)可分為打開(kāi)手掌、捏住底部、捏住頂部、捏住側(cè)面或拿起。如果手中沒(méi)有任何物體,那么可能是在等待機(jī)器人遞交物體或者未發(fā)生這個(gè)動(dòng)作。”

然后他們?cè)邳c(diǎn)云上訓(xùn)練了一個(gè)深層神經(jīng)網(wǎng)絡(luò),用于預(yù)測(cè)人類(lèi)的握持類(lèi)別。研究人員使用 Microsoft Azure Kinect RGBD 攝像頭創(chuàng)建了一個(gè)數(shù)據(jù)集,這組數(shù)據(jù)集包含了 8 個(gè)實(shí)驗(yàn)對(duì)象的不同手形和手勢(shì)。

研究人員表示:“我們向?qū)嶒?yàn)對(duì)象展示了一張用手握持物體的圖片,接著記錄實(shí)驗(yàn)對(duì)象執(zhí)行相似動(dòng)作時(shí)的姿勢(shì),記錄時(shí)間為 20 至 60 秒,隨后在整個(gè)圖像序列中標(biāo)出相應(yīng)的人類(lèi)握持類(lèi)別。在記錄期間,實(shí)驗(yàn)對(duì)象的身體和手可以移動(dòng)到不同的位置,以使攝像頭的視角多樣化。我們分別記錄了每名實(shí)驗(yàn)對(duì)象的左手和右手,整個(gè)數(shù)據(jù)集總共包含 151551 張圖像?!?/p>

5 種人類(lèi)握持類(lèi)型與2種空手類(lèi)型涵蓋了人們所習(xí)慣的各種物體握持方式。研究人員將這些動(dòng)作與機(jī)器人的各種典型握持方向相關(guān)聯(lián),最大程度上減少了遞接過(guò)程中人們的負(fù)擔(dān)(以坐標(biāo)系統(tǒng)和黃色箭頭表示)。

在下一階段,研究人員根據(jù)人類(lèi)的握持動(dòng)作調(diào)整了機(jī)器人的握持方向。

鑒于 PointNet ++ 架構(gòu)在許多機(jī)器人應(yīng)用上都取得了極佳效果(如無(wú)標(biāo)記遠(yuǎn)程操作系統(tǒng)和握持生成等),因此為了完成這項(xiàng)任務(wù),研究人員使用該架構(gòu)訓(xùn)練人類(lèi)握持分類(lèi)網(wǎng)絡(luò)。

研究人員表示:“手的周?chē)植贾c(diǎn)云,該網(wǎng)絡(luò)可以根據(jù)定義的握持類(lèi)別對(duì)手的動(dòng)作進(jìn)行分類(lèi)。定義的握持類(lèi)別也可以被用于進(jìn)一步的機(jī)器人握持動(dòng)作設(shè)計(jì)?!?/p>

遞接框架概述。該框架采用以手部檢測(cè)中心的點(diǎn)云,然后使用基于 PointNet ++ 的模型,根據(jù) 7 種握持類(lèi)別對(duì)手的動(dòng)作進(jìn)行分類(lèi)。這七種握持類(lèi)別涵蓋了人們所習(xí)慣的各種物體握持方式。然后,該任務(wù)模型據(jù)此調(diào)整機(jī)器人握持動(dòng)作的設(shè)計(jì)。

在該步驟中,團(tuán)隊(duì)為機(jī)器人設(shè)計(jì)了典型的握持方向,減少了機(jī)器人抓住人手的可能性,使機(jī)器人的運(yùn)動(dòng)和軌跡盡可能自然。

研究人員使用一個(gè)內(nèi)置 CUDA 10.2 和 PyTorch 框架的 NVIDIA TITAN X GPU 對(duì)該系統(tǒng)進(jìn)行了訓(xùn)練,并通過(guò) 1 個(gè) NVIDIA RTX 2080 Ti GPU 完成了測(cè)試。

研究人員總結(jié)道:“與兩種基礎(chǔ)方法相比,這種方法能夠不斷提高握持的成功率,縮短總執(zhí)行時(shí)間和試驗(yàn)時(shí)間。這證明了該方法的有效性和可靠性?!?/p>

(a)人手握持分類(lèi)的準(zhǔn)確性。(b)人類(lèi)手部狀態(tài)分類(lèi)和 PoseCNN 之間的物體遺漏檢出率比較。在很多情況下,手會(huì)遮擋物體,因此很難獲得準(zhǔn)確的物體姿態(tài)估計(jì)值。

在未來(lái)的測(cè)試中,研究人員計(jì)劃訓(xùn)練該系統(tǒng)掌握更多握持類(lèi)型,進(jìn)一步增強(qiáng)他們的數(shù)據(jù)集。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1215

    瀏覽量

    55465
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28618

    瀏覽量

    207922
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1209

    瀏覽量

    24777

原文標(biāo)題:NVIDIA 研究人員變身機(jī)器人 AI 訓(xùn)練師 ,改善人機(jī)交互

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    次生成深度信息。 自主機(jī)器人定位任務(wù)的本質(zhì)是對(duì)機(jī)器人自身狀態(tài)的估計(jì)問(wèn)題,包括位置,朝向,速度等問(wèn)題。 路徑規(guī)劃旨在找到從起點(diǎn)到目標(biāo)區(qū)域的路徑,確保路徑的可行性和最優(yōu)性。路徑規(guī)劃方法
    發(fā)表于 01-04 19:22

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    。 多模態(tài)融合的創(chuàng)新與突破 機(jī)器人控制技術(shù)的另個(gè)重要突破在于多模態(tài)大模型的應(yīng)用。相比于僅通過(guò)文字進(jìn)行人機(jī)交互的傳統(tǒng)方法,現(xiàn)代機(jī)器人
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    、家庭服務(wù)機(jī)器人等。具身智能機(jī)器人技術(shù)與市場(chǎng)的融合閉環(huán)是自主經(jīng)濟(jì)中重要的發(fā)展方向之。 具身智能機(jī)器人一種
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.全書(shū)概覽與第章學(xué)習(xí)

    系統(tǒng),包括環(huán)境感知、行為控制和人機(jī)交互等;“小腦”就是機(jī)器人的運(yùn)動(dòng)控制系統(tǒng);“軀干”就是機(jī)器人及肢體,包括機(jī)械臂、輕量化骨骼和高精度傳感等。這些關(guān)鍵技術(shù)還存在許多難題待攻克。 此外,數(shù)據(jù)瓶頸也使我感受頗豐
    發(fā)表于 12-27 14:50

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    嵌入式人工智能(EAI)將人工智能集成到機(jī)器人等物理實(shí)體中,使它們能夠感知、學(xué)習(xí)環(huán)境并與之動(dòng)態(tài)交互。這種能力使此類(lèi)機(jī)器人能夠在人類(lèi)社會(huì)中有效
    發(fā)表于 12-24 00:33

    《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    意味著在“具身智能”領(lǐng)域,還沒(méi)有哪個(gè)玩家能像O社那樣能站在AGI的制高點(diǎn)。 具身智能從字面上拆解為“具身+智能”,指的是一種機(jī)器學(xué)習(xí)算法適配至物理實(shí)體,從而與物理世界交互的AI范式
    發(fā)表于 12-19 22:26

    具身智能對(duì)人機(jī)交互的影響

    地提高了人機(jī)交互的效率和自然度。而具身智能的出現(xiàn),更是將人機(jī)交互推向了個(gè)新的高度。 1. 具身智能的定義與特點(diǎn) 具身智能是指人工智能系統(tǒng)不僅能夠理解人類(lèi)的語(yǔ)言和行為,還
    的頭像 發(fā)表于 10-27 09:58 ?410次閱讀

    國(guó)內(nèi)外部分人形機(jī)器人企業(yè)

    人形機(jī)器人的定義人形機(jī)器人一種仿生機(jī)器人,指形狀及尺寸與人體相似,能夠仿人類(lèi)運(yùn)動(dòng)、表情、互動(dòng)及
    的頭像 發(fā)表于 10-22 17:05 ?782次閱讀
    國(guó)內(nèi)外部分人形<b class='flag-5'>機(jī)器人</b>企業(yè)<b class='flag-5'>一</b>覽

    基于傳感器的人機(jī)交互技術(shù)

    基于傳感器的人機(jī)交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之,它極大地推動(dòng)了人機(jī)交互的便捷性、自然性和智能性。本文將詳細(xì)探討基于傳感器的人機(jī)交互技術(shù),包括其基本原理、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域以及未來(lái)
    的頭像 發(fā)表于 07-17 16:52 ?981次閱讀

    機(jī)器人視覺(jué)技術(shù)中常見(jiàn)的圖像分割方法

    機(jī)器人視覺(jué)技術(shù)中的圖像分割方法個(gè)廣泛且深入的研究領(lǐng)域。圖像分割是將圖像劃分為多個(gè)區(qū)域或?qū)ο蟮倪^(guò)程,這些區(qū)域或?qū)ο缶哂心撤N共同的特征,如顏色、紋理、形狀等。在機(jī)器人視覺(jué)中,圖像分割對(duì)
    的頭像 發(fā)表于 07-09 09:31 ?841次閱讀

    人機(jī)交互界面是什么_人機(jī)交互界面的功能

    終端(OT),是指與計(jì)算機(jī)系統(tǒng)之間的通信媒體或手段,是與計(jì)算機(jī)之間進(jìn)行各種符號(hào)和動(dòng)作的雙向信息交換的平臺(tái)。   人機(jī)交互界面的主要作用是將人類(lèi)的意圖轉(zhuǎn)化為計(jì)算機(jī)能夠理解和處理
    的頭像 發(fā)表于 06-22 11:03 ?2773次閱讀

    碼垛工業(yè)機(jī)器人的基本原理

    ?碼垛工業(yè)機(jī)器人一種能夠自動(dòng)堆疊產(chǎn)品的機(jī)器人系統(tǒng)。它通過(guò)搬運(yùn)和堆疊產(chǎn)品,將貨物按照特定的模式堆疊在起,以達(dá)到節(jié)省空間、提高運(yùn)輸效率的目的
    的頭像 發(fā)表于 06-21 16:57 ?340次閱讀
    碼垛工業(yè)<b class='flag-5'>機(jī)器人</b>的基本原理

    人機(jī)交互與人機(jī)界面的區(qū)別與聯(lián)系

    隨著信息技術(shù)的飛速發(fā)展,人機(jī)交互(Human-Computer Interaction,HCI)已成為現(xiàn)代社會(huì)不可或缺的部分。人機(jī)交互技術(shù),作為實(shí)現(xiàn)與計(jì)算機(jī)之間有效通信的橋梁,不僅
    的頭像 發(fā)表于 06-07 15:29 ?1113次閱讀

    AI陪伴機(jī)器人市場(chǎng)需求快速增長(zhǎng),情感交互成重要布局方向

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI陪伴機(jī)器人一種基于人工智能技術(shù)的智能機(jī)器人,它能夠與人類(lèi)進(jìn)行交互
    的頭像 發(fā)表于 04-20 00:19 ?3663次閱讀

    人機(jī)交互的三個(gè)階段 人機(jī)交互的常用方式

    機(jī)交互經(jīng)歷的三個(gè)階段:命令行界面交互階段、圖形用戶(hù)界面交互階段、自然和諧的人機(jī)交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?3288次閱讀