智東西1月20日消息,近日,麻省理工學(xué)院(MIT)的研究人員進(jìn)行了一項(xiàng)研究,旨在在機(jī)器人身上,復(fù)制人類觸摸獲取物體位置的能力。
研究人員將他們的論文預(yù)先發(fā)表在arXiv上,強(qiáng)調(diào)他們的研發(fā)成果可以讓機(jī)器人僅通過觸摸,而無需通過視覺和音頻處理,就能與其周圍環(huán)境進(jìn)行交互,甚至可以在第一次接觸物體時(shí)對(duì)物體進(jìn)行準(zhǔn)確定位。
一、不依賴外部傳感方式,僅通過模擬訓(xùn)練實(shí)現(xiàn)物體行為
研究人員之一Maria Bauza 在接受外媒Tech Xplore采訪時(shí)說:“我們此次研究的方法相比以往的觸覺定位工作取得了重要飛躍,因?yàn)槲覀兛梢圆灰蕾嚴(yán)缫曈X等其他任何外部傳感方式,也不依賴以前收集的與被操縱物體相關(guān)的觸覺數(shù)據(jù)?!?/p>
“相反,我們的技術(shù)是直接在模擬中訓(xùn)練出來的,機(jī)器人能在第一次觸摸時(shí)就定位物體,這在機(jī)器人領(lǐng)域的應(yīng)用中是至關(guān)重要的?!?/p>
在現(xiàn)實(shí)情況中,數(shù)據(jù)收集價(jià)格高昂,甚至有些數(shù)據(jù)無法被收集。而由于這個(gè)新技術(shù)是經(jīng)過模擬訓(xùn)練的,也就是說,無需真實(shí)的機(jī)器人訓(xùn)練,只需在計(jì)算機(jī)上訓(xùn)練就可完成操作。因此,Bauza和她的同事在設(shè)計(jì)的時(shí)候就不用進(jìn)行復(fù)雜的數(shù)據(jù)收集工作了。
研究人員最初開發(fā)了一個(gè)框架,模擬給定物體和觸覺傳感器之間的接觸,從而假設(shè)機(jī)器人可以訪問與其交互的物體的數(shù)據(jù)(例如,物體的三維形狀、特征等)。這些接觸行為以深度圖像的形式呈現(xiàn),它顯示了物體擠壓觸覺傳感器的程度。
隨后,Bauza和她的同事們使用最先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)進(jìn)行計(jì)算機(jī)視覺和表示學(xué)習(xí)(representation learning),觀察機(jī)器人收集的真實(shí)觸覺數(shù)據(jù),并將這些數(shù)據(jù)與模擬生成的觸點(diǎn)數(shù)據(jù)集進(jìn)行匹配。
▲研究人員使用的觸覺傳感器
Bauza說:“我們的方法是,將表示為深度圖像的接觸編碼到一個(gè)嵌入式空間中,這極大地簡(jiǎn)化了計(jì)算成本,使任務(wù)能夠?qū)崟r(shí)執(zhí)行?!?/p>
“在我們的工作中,我們?cè)诙嘟佑|場(chǎng)景中對(duì)這一點(diǎn)進(jìn)行了演示,其中在多個(gè)觸覺傳感器同時(shí)接觸一個(gè)物體的情況下,我們必須將所有觀察結(jié)果整合到對(duì)物體姿態(tài)的估計(jì)中。”
從本質(zhì)上講,這個(gè)研究小組設(shè)計(jì)的方法可以簡(jiǎn)單基于物體的三維形狀來模擬接觸信息。因此,它不需要在仔細(xì)檢查物體時(shí)收集任何以前的觸覺數(shù)據(jù)。這使得該技術(shù)能夠通過機(jī)器人的觸覺傳感器,在它第一次接觸到物體時(shí),就對(duì)物體產(chǎn)生姿態(tài)估計(jì)。
Bauza說:“我們意識(shí)到觸覺傳感具有很強(qiáng)的鑒別力,并可以產(chǎn)生高度精確的姿勢(shì)估計(jì)。視覺有時(shí)候會(huì)受到遮擋的影響,但觸覺不會(huì)。因此,如果一個(gè)機(jī)器人接觸到一個(gè)少見且獨(dú)特物體的某一部分,那么我們的算法可以輕易識(shí)別出機(jī)器人接觸的物體,從而識(shí)別物體的姿態(tài)?!?/p>
二、“多手指”感觸提高操作精度,適用工業(yè)領(lǐng)域
許多物體不同側(cè)面的觸感相似,而Bauza和她的同事開發(fā)的方法可以預(yù)測(cè)姿勢(shì)分布,而不止對(duì)單個(gè)姿態(tài)進(jìn)行估計(jì)。這一特征非常特殊,與此前只收集單一姿態(tài)估計(jì)的目標(biāo)姿態(tài)估計(jì)方法形成鮮明對(duì)比。此外,麻省理工學(xué)院研究小組的框架所預(yù)測(cè)的分布可以直接與外部信息整合,以進(jìn)一步減少物體姿態(tài)的不確定性。
Bauza說:“值得注意的是,我們還觀察到,像用幾個(gè)手指接觸一個(gè)物體一樣同時(shí)進(jìn)行多個(gè)接觸行為,可以很大程度上減少對(duì)物體姿勢(shì)判斷的不確定性。這證實(shí)了我們的預(yù)測(cè),即在一個(gè)對(duì)象上添加接觸會(huì)限制其姿態(tài)并簡(jiǎn)化姿態(tài)檢測(cè)過程?!?/p>
▲方法運(yùn)作流程:接觸→ 觸覺觀察→觸覺深度→匹配使用研究人員的最佳算法→結(jié)果姿勢(shì)
為了輔助人類進(jìn)行日?;顒?dòng),機(jī)器人必須能夠高精度、高可靠性地完成任務(wù)。由于對(duì)物體的操縱意味著機(jī)器人需要直接接觸物體,因此開發(fā)能有效使機(jī)器人進(jìn)行觸覺傳感的技術(shù)至關(guān)重要。
另一位參與這一項(xiàng)目的研究人員Alberto Rodriguez在接受媒體采訪時(shí)說,觸覺能力最近受到了工業(yè)領(lǐng)域的極大關(guān)注,我們通過對(duì)三個(gè)因素的結(jié)合實(shí)現(xiàn)了觸覺能力技術(shù)的突破:
1、 使用具有高分辨率的小型攝像機(jī),捕捉觸摸表面變形的狀態(tài),這一傳感技術(shù)成本較低。例如:GelSight 傳感。
2、 將上述第一點(diǎn)中提到的傳感技術(shù)與機(jī)器人手指進(jìn)行結(jié)合。例如:GelSlim 手指。
3、 一種基于深度學(xué)習(xí)的計(jì)算框架,它可以有效處理高分辨率觸覺圖像,實(shí)現(xiàn)已知部位的觸覺定位。例如:本文提到的研究。
Rodriguez說:“這類技術(shù)正在逐漸成熟,行業(yè)正在看到自動(dòng)化任務(wù)的價(jià)值。比如,在裝配自動(dòng)化領(lǐng)域,觸摸任務(wù)的實(shí)施就對(duì)精確度有要求?!?/p>
這組研究人員設(shè)計(jì)的技術(shù),使機(jī)器人能實(shí)時(shí)估計(jì)他們正在操縱的物體的姿態(tài),而且精確度很高。這使工作人員有機(jī)會(huì)對(duì)機(jī)器人的動(dòng)作或行為影響做出更準(zhǔn)確的預(yù)測(cè),從而提高機(jī)器人在操作任務(wù)中的表現(xiàn)。
這一研究或許能夠證明其在工業(yè)領(lǐng)域應(yīng)用中的價(jià)值。在工業(yè)領(lǐng)域,制造商可以依此根據(jù)產(chǎn)品形狀的清晰模型組裝產(chǎn)品。
未來,研究人員計(jì)劃擴(kuò)展他們的框架,使其同時(shí)包含有關(guān)物體的視覺信息。他們希望將現(xiàn)有的技術(shù)轉(zhuǎn)化為一個(gè)視覺-觸覺傳感系統(tǒng),可以更精準(zhǔn)地估計(jì)物體的姿態(tài)。
此外,他們還將研發(fā)讓機(jī)器人進(jìn)行精確拾取和放置操作的技術(shù)。他們的目標(biāo)是,讓機(jī)器人能進(jìn)行穩(wěn)定抓取任務(wù)的同時(shí),還能幫助其進(jìn)行感知,提高其觸覺定位能力。
結(jié)語:為機(jī)器人提供更多感官
視覺、音頻技術(shù)是機(jī)器人定位常用的方式,這次,MIT的研究人員從觸覺方面為機(jī)器人確認(rèn)物體位置的方式提供了一個(gè)新的切口。
人類通過各種感官確認(rèn)物體的形狀和位置,未來,機(jī)器人或許也能像人類一樣,通過眼睛鎖定,耳朵聽見,皮膚觸摸,鼻子嗅聞來準(zhǔn)確鎖定物體位置、形狀及狀態(tài)。
責(zé)任編輯:xj
原文標(biāo)題:MIT新研究:讓機(jī)器人像人一樣有觸覺,觸摸可識(shí)別姿態(tài)位置
文章出處:【微信公眾號(hào):天津機(jī)器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28423瀏覽量
207141 -
觸覺
+關(guān)注
關(guān)注
0文章
19瀏覽量
9460
原文標(biāo)題:MIT新研究:讓機(jī)器人像人一樣有觸覺,觸摸可識(shí)別姿態(tài)位置
文章出處:【微信號(hào):tjrobot,微信公眾號(hào):天津機(jī)器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論