人類能夠通過觸摸找到周圍的物體并明確其某些屬性,這一技能對盲人來說尤其重要,而沒有視覺障礙的人同樣在日常生活中頻繁用到這一點(diǎn),例如在口袋中摸索并抓住一樣?xùn)|西。
近日,麻省理工學(xué)院(MIT)的研究人員進(jìn)行了一項(xiàng)技術(shù)研究,旨在將這種人類能力復(fù)制到機(jī)器人上,從而使其通過觸摸即可了解對象的位置并可實(shí)時(shí)估計(jì)對象的姿態(tài)。該研究成果預(yù)先發(fā)表在 arXiv 上,論文著重強(qiáng)調(diào)了不再局限于視覺、音頻處理而只需通過觸摸就能與其周圍的環(huán)境進(jìn)行交互的機(jī)器人的優(yōu)勢。
圖 | 幫助機(jī)器人通過觸覺感知來定位物體
“我們的研究目標(biāo)是想證明,機(jī)器人通過高分辨率的觸覺感應(yīng),甚至首次接觸就可以準(zhǔn)確定位已知的對象。與以前在觸覺定位方面的工作相比,我們的方法有了重要的飛躍,因?yàn)槲覀儾灰蕾囉谌魏纹渌獠扛袘?yīng)方式(例如視覺)或以前收集的與被操縱對象有關(guān)的觸覺數(shù)據(jù)。恰恰相反,我們的技術(shù)是在模擬中直接訓(xùn)練的,它第一次觸摸就可以定位已知對象,這在實(shí)際的機(jī)器人應(yīng)用中至關(guān)重要,因?yàn)樵谡鎸?shí)的機(jī)器人中,實(shí)時(shí)數(shù)據(jù)收集成本很高或根本不可行?!?進(jìn)行該項(xiàng)研究的研究人員之一 Maria Bauza 表示。
由于這項(xiàng)技術(shù)是在模擬中得到過訓(xùn)練,因此 Bauza 及其同事不再需要大量的數(shù)據(jù)收集。這些研究人員最初開發(fā)了一個(gè)框架,該框架可模擬給定對象與觸覺傳感器之間的接觸,因此假設(shè)機(jī)器人有權(quán)訪問與其交互的對象有關(guān)的數(shù)據(jù)(例如其 3-D 形狀、特性等)。這些接觸會被描繪為深度圖像,可顯示出對象穿透觸覺傳感器的程度。
隨后,他們使用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)進(jìn)行計(jì)算機(jī)視覺和表征學(xué)習(xí),將機(jī)器人收集的真實(shí)觸覺觀察結(jié)果與模擬生成的一組接觸信息進(jìn)行匹配。根據(jù)模擬數(shù)據(jù)集中的每次接觸與實(shí)際或觀察到的接觸的匹配可能性,對其進(jìn)行加權(quán),最終框架會獲得對象的可能姿勢的概率分布。
Bauza 說道:“我們的方法將被繪為深度圖像的接觸編碼到一個(gè)嵌入式空間中,這極大地簡化了計(jì)算成本,可以做到實(shí)時(shí)執(zhí)行。由于它可以產(chǎn)生有意義的姿勢分布,因此可以輕松地與其他感知系統(tǒng)結(jié)合使用。例如,在多觸點(diǎn)場景中,多個(gè)觸覺傳感器同時(shí)觸摸一個(gè)對象,我們必須將所有的觀察結(jié)果都整合到對象的姿態(tài)估計(jì)中?!?/p>
本質(zhì)上,這種方法可以根據(jù)對象的 3D 形狀模擬出接觸信息。但他們發(fā)現(xiàn),在利用這種技術(shù)仔細(xì)觸摸對象時(shí)并不需要收集任何以前的觸覺數(shù)據(jù)。也就是說,有了這項(xiàng)技術(shù),機(jī)器人的觸覺傳感器可以在首次觸摸到對象時(shí)就生成可能的姿勢判斷。
Bauza 表示,他們意識到觸覺感知具有高度鑒別性,并能產(chǎn)生高度精確的姿勢估計(jì)?!耙暳τ袝r(shí)會受到遮擋的影響,但觸覺感應(yīng)卻不會。因此,如果機(jī)器人觸碰到了某個(gè)獨(dú)特對象的一部分,且這種接觸與其他的不同,那么我們的算法可以輕松識別出這一接觸及對象的姿態(tài)?!?/p>
由于許多接觸對象不具備的獨(dú)特區(qū)域(即它們的放置方式可能導(dǎo)致最終的接觸極其類似),因此 Bauza 及其同事開發(fā)的方法可以預(yù)測的是姿勢分布,而不是單個(gè)姿勢估計(jì)。這與此前開發(fā)的只收集單個(gè)姿勢估計(jì)的對象姿態(tài)估計(jì)方法形成了鮮明的對比。而且,該框架預(yù)測的分布信息可以直接與外部信息進(jìn)行合并,從而能夠進(jìn)一步減少對象姿態(tài)預(yù)測的不確定性。
值得注意的是,他們還觀察到,同時(shí)使用多個(gè)手指接觸對象,并同時(shí)對多個(gè)接觸進(jìn)行組合,也可以迅速減少對象姿態(tài)估計(jì)的不確定性。
參與這項(xiàng)研究的另一位研究員 Alberto Rodriguez 表示,“感應(yīng)觸摸能力最近在業(yè)界引起了極大了研究興趣,而我們主要是通過結(jié)合三個(gè)因素來實(shí)現(xiàn)這一點(diǎn)的:(1)一種分辨率高但并不昂貴的感應(yīng)技術(shù),該技術(shù)使用小型相機(jī)來捕獲觸摸表面的變形(例如 GelSight 感應(yīng));(2)將此傳感技術(shù)緊密結(jié)合到機(jī)器人手指(例如 GelSlim 手指)中;(3)基于深度學(xué)習(xí)的計(jì)算框架,來有效處理高分辨率觸覺圖像,從而通過已知零件完成觸覺定位?!?/p>
總之,該研究小組設(shè)計(jì)的這項(xiàng)技術(shù)可以讓機(jī)器人實(shí)時(shí)、高水平地估計(jì)其正在操作的對象的姿態(tài),這樣一來,就讓機(jī)器人能夠?qū)ζ渚唧w動作的影響做出更準(zhǔn)確的預(yù)測,從而可以提高其在操作任務(wù)時(shí)的表現(xiàn)。這對工業(yè)當(dāng)中根據(jù)物品形狀的模型進(jìn)行組裝的制造商來說極具價(jià)值。
在未來的工作中,Bauza 團(tuán)隊(duì)計(jì)劃擴(kuò)展這一框架,使其能夠涵蓋有關(guān)對象的視覺信息。理想情況下,他們還希望將其技術(shù)轉(zhuǎn)變?yōu)橐环N視覺 - 觸覺傳感系統(tǒng),從而能夠以更高的精度來估算對象的姿態(tài)。
“我們正在進(jìn)行的另一項(xiàng)研究與這種方法密切相關(guān),目的是探索觸覺感知方法在復(fù)雜操作任務(wù)中的運(yùn)用?,F(xiàn)在我們正在學(xué)習(xí)能讓機(jī)器人執(zhí)行精確地抓放操作的模型,以實(shí)現(xiàn)穩(wěn)定地抓握,幫助提高感知水平,改善觸覺定位?!?Bauza 表示。
原文標(biāo)題:不再局限于視覺!MIT研發(fā)新技術(shù)讓機(jī)器人通過觸摸即可與周圍環(huán)境進(jìn)行交互
文章出處:【微信公眾號:DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28582瀏覽量
207818
原文標(biāo)題:不再局限于視覺!MIT研發(fā)新技術(shù)讓機(jī)器人通過觸摸即可與周圍環(huán)境進(jìn)行交互
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論