0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

伯克利的研究人員提出了一種通用的自適應(yīng)感知方法AdaSearch

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-11-24 09:14 ? 次閱讀

編者按:在自適應(yīng)搜索問題中,經(jīng)常會需要機器人在很強的背景干擾情況下定位目標位置。在本文中,伯克利的研究人員提出了一種通用的自適應(yīng)感知方法AdaSearch,能快速定位目標點。以下是論智對該成果的編譯。

機器學(xué)習(xí)的很多任務(wù)中,常見的有根據(jù)固定、預(yù)先收集好的數(shù)據(jù)集回答問題。但是在一些應(yīng)用中,我們沒有先驗數(shù)據(jù),必須自己收集回答問題所需要的數(shù)據(jù),例如在環(huán)境污染監(jiān)控和人口普查過程中常出現(xiàn)這種情況。自己收集數(shù)據(jù)則要求我們將注意力放在最相關(guān)的信息源上,但是想確定哪些信息源會得到有用的結(jié)果則是很困難的。另外,當實體收集數(shù)據(jù)時(例如機器人、衛(wèi)星或人類),我們必須對測量方法進行規(guī)劃,盡量減少智能體隨時間移動所造成的成本增加。我們將這種抽象的問題稱為“具身自適應(yīng)感知(embodied adaptive sensing)”。

針對這一問題,我們提出了新的解決方法,其中機器人必須穿越它所在的環(huán)境后確定位置或目標物體。自適應(yīng)感知涵蓋了機器人研究中的很多問題,例如快速定位污染物或放射性資源的泄漏、在搜救中找尋被困者。在這些情況下,設(shè)計一種能盡快返回正確結(jié)果的感知軌跡是很重要的。

本文我們以放射物泄漏問題(RSS)為例,無人機需要確定環(huán)境中k-最大的放射性輻射源,k是用戶定義的參數(shù)。RSS是自適應(yīng)感知問題中非常有趣的案例,因為其中會遇到多種復(fù)雜的背景噪聲(放射源周圍有很多放射性物質(zhì))。

于是,我們提出了AdaSearch,這是一種用于通用自適應(yīng)感知問題的連續(xù)消除式的框架,我們在放射源尋找的環(huán)境下測試它。AdaSearch在環(huán)境中的每一點都能將泄漏率控制在置信區(qū)間中。利用這些置信區(qū)間,算法經(jīng)過迭代確定了一系列可能泄漏點,最終選出唯一的一個,清除掉其他的。

將具身搜索看作多重假設(shè)的測試場景

傳統(tǒng)上,機器人領(lǐng)域?qū)⒕呱硭阉鳎╡mbodied search)看作持續(xù)的運動計劃問題,其中機器人必須平衡環(huán)境探索和對高效軌跡的選擇。這就催生了既可以進行路線優(yōu)化,又可以進行環(huán)境探索的方法,可以用滾動時域控制(receding horizon control)進行優(yōu)化。而我們通過假設(shè)檢驗測試,將該問題看作序列最佳動作定義。

在假設(shè)檢驗測試中,它的目標是在多種分散問題上得出結(jié)論。給定智能體一系列測量動作N,每個都能根據(jù)固定分布生成觀察結(jié)果。

智能體的目標是學(xué)習(xí)這些N個觀察分布中的預(yù)指定特征。例如,我們以向新客戶展示產(chǎn)品A或產(chǎn)品B為例,記錄他們對該產(chǎn)品的評價,從而表示統(tǒng)計學(xué)中的A/B測試。這里的N=2,因為只有兩個動作:展示A和展示B。而我們要研究的目標特征就是哪個產(chǎn)品更受歡迎。根據(jù)我們收集到的偏好信息,對這些樣本以及置信區(qū)間進行跟蹤記錄,分別用置信下限和上限對產(chǎn)品進行定義。隨著收集的評價越多,我們對每個產(chǎn)品的偏好估計就越準確。最終可以用一個結(jié)論來定義B比A更受歡迎:如果B的置信下限比A的置信上限還要高,那么我們可以認為B比A更受歡迎。

而在環(huán)境感知的情況下,每個動作都要從一定位置和方向讀取傳感器。通常來說,智能體的目標是確定哪個方向能測量出最多的觀測信號,或者哪一系列的k動作能得到最大的平均觀測。為了這一目標,智能體可能會按順序選擇動作,通過此前的觀察選擇信息量更多的動作。

乍一看,序列最佳動作確定可能對移動的具身感知智能體來說太抽象了。智能體完全可以不考慮潛在成本隨機選擇動作。但是,抽象的動作確定是非常強大的。通過精準的統(tǒng)計語言實現(xiàn)具身搜索問題,我們提出了與每種感知動作非常相關(guān),且置信度很高的觀察方法,確定了未來要做的一系列動作。

我們提出的AdaSearch用序列最佳動作定義得到的置信區(qū)間和全局軌跡規(guī)劃,實現(xiàn)了漸進最優(yōu)的測量復(fù)雜度,并能有效的分攤運動成本。

放射源尋找

為了驗證它的效果,我們會用AdaSearch尋找放射性元素唯一一個泄漏點。我們將環(huán)境模擬成一個平面網(wǎng)格,如下所示。其中的紅點是放射性元素集中的區(qū)域。但是定位這一點非常難,因為傳感器會被其他紫色的點(背景輻射)干擾。信息的收集由配有傳感器的無人機進行,目標就是設(shè)計一個路線,我們能通過傳感器收集來的觀測信息,盡快定位放射點的位置。

AdaSearch

我們的AdaSearch算法結(jié)合了全局收斂計劃和自適應(yīng)感知。在無人機第一次通過網(wǎng)格時,會先均勻地收集環(huán)境信息。

第一次觀察后,我們能取消一些明顯不合適的區(qū)域。如果在平均值周圍的置信上限小于任何區(qū)間的最大下限,該點則會被消除,表示該點不是目標區(qū)域。

在下一次探索,AdaSearch會更仔細地搜索剩余點,直到找到目標。

Baseline

我們將AdaSearch和經(jīng)過相同案例訓(xùn)練的信息最大化方法——InfoMax進行比較。但不幸的是,對于大型空間的搜索,實時計算無法支持路線規(guī)劃或者參數(shù)化。這可能導(dǎo)致算法變得非常貪婪,會花大量時間找尋錯誤的原因。

為了區(qū)分我們的置信區(qū)間所帶來的影響和全局規(guī)劃啟發(fā)法,我們用簡單的全局規(guī)劃方法——NaiveSearch作為第二種baseline。這種方法統(tǒng)一地對網(wǎng)格采樣,在每個單元格上都花費同樣時間。

結(jié)果

我們在64×64米的網(wǎng)格上,用4米的分辨率實現(xiàn)了三種算法,模擬了放射性源尋找的實例。結(jié)果我們觀察到,AdaSearch通常比NaiveSearch和InfoMax更快完成。隨著不斷增加背景輻射的水平,NaiveSearch的運行時間越來越慢,但AdaSearch的變化卻不大。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    211

    文章

    28472

    瀏覽量

    207385
  • 無人機
    +關(guān)注

    關(guān)注

    230

    文章

    10455

    瀏覽量

    180876
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    152

    瀏覽量

    10592

原文標題:AdaSearch:用連續(xù)消除法實現(xiàn)自適應(yīng)感知,快速精準定位

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    美中聯(lián)合研制出最小半導(dǎo)體激光器

    【摘要】:<正>美國加州大學(xué)伯克利分校和北京大學(xué)的研究人員聯(lián)合研制出世界最小的半導(dǎo)體激光器。研究人員研制了款高增益硫化鎘納米線,然后將納米線與銀金屬相隔5 nm,激光
    發(fā)表于 04-24 10:11

    一種使用鄰接信息的自適應(yīng)膚色檢測方法

    本文提出了一種使用鄰接信息的自適應(yīng)膚色檢測方法。先在HSV 空間對圖像使用SPDH 方法以尋找最優(yōu)的膚色閾值并以此對進行初步膚色分割;然后再
    發(fā)表于 08-15 11:41 ?8次下載

    伯克利博士論文:DC-DC轉(zhuǎn)換器

    伯克利博士的論文,關(guān)于DC-DC轉(zhuǎn)換器的理解介紹和應(yīng)用分析。
    發(fā)表于 09-29 18:13 ?103次下載
    <b class='flag-5'>伯克利</b>博士論文:DC-DC轉(zhuǎn)換器

    一種基于智能終端的環(huán)境與接近度感知方法

    提出一種基于智能終端的環(huán)境與接近度感知方法。首先,基于智能終端多種內(nèi)置傳感器采集的環(huán)境數(shù)據(jù),提出一種環(huán)境
    發(fā)表于 11-16 11:17 ?7次下載
    <b class='flag-5'>一種</b>基于智能終端的環(huán)境與接近度<b class='flag-5'>感知方法</b>

    研究人員開發(fā)出一種可監(jiān)測消化系統(tǒng)和胃部活動的物聯(lián)網(wǎng)可穿戴系統(tǒng)

    來自加利福尼亞大學(xué)伯克利分校和加州大學(xué)圣地亞哥分校的研究小組開發(fā)了一種可監(jiān)測消化系統(tǒng)和胃部活動的物聯(lián)網(wǎng)可穿戴系統(tǒng)。 研究人員聲稱,這種新系統(tǒng)在診斷某些胃腸疾病方面與傳統(tǒng)
    發(fā)表于 05-02 15:51 ?1795次閱讀

    研究人員借鑒蟑螂靈活的外骨骼結(jié)構(gòu),制造出款機器人雛形

    加州伯克利大學(xué)的研究人員借鑒蟑螂靈活的外骨骼結(jié)構(gòu),制造出款機器人雛形,更加適應(yīng)狹窄崎嶇的地面環(huán)境。
    的頭像 發(fā)表于 06-01 11:18 ?3929次閱讀
    <b class='flag-5'>研究人員</b>借鑒蟑螂靈活的外骨骼結(jié)構(gòu),制造出<b class='flag-5'>一</b>款機器人雛形

    OpenAI提出了一種回報設(shè)置方法RND

    在開發(fā)RND之前,OpenAI的研究人員和加州大學(xué)伯克利分校的學(xué)者進行了合作,他們測試了在沒有環(huán)境特定回報的情況下,智能體的學(xué)習(xí)情況。因為從理論上來說,好奇心提供了一種更簡單的方法來教
    的頭像 發(fā)表于 11-05 15:15 ?3188次閱讀

    個用于自適應(yīng)感知問題的連續(xù)剔除框架AdaSearch,幫助機器人實現(xiàn)高效自適應(yīng)感知

    機器人研究領(lǐng)域般將具象搜索問題看做是連續(xù)的運動規(guī)劃問題,機器人必須平衡好探索環(huán)境和路徑選擇效率之間的關(guān)系。這使得軌跡優(yōu)化和探索融合到了同目標函數(shù)中來優(yōu)化。在這
    的頭像 發(fā)表于 11-18 09:59 ?4566次閱讀

    UC伯克利新機器人成果:靈活自由地使用工具

    之前我們剛剛介紹了加州大學(xué)伯克利分校 Pieter Abbeel 教授領(lǐng)導(dǎo)伯克利機器人學(xué)習(xí)實驗室(UC Be
    的頭像 發(fā)表于 04-15 09:03 ?2478次閱讀

    加州大學(xué)伯克利分校的團隊給予跳躍機器人更高目標

    美國加州大學(xué)伯克利分校的研究人員,研發(fā)出款能不斷跳躍的機器人:Salto-1P。
    的頭像 發(fā)表于 06-13 17:52 ?3454次閱讀

    研究人員開發(fā)出了一種稱為LB-WayPtNav-DH的機器人導(dǎo)航新框架

    加州大學(xué)伯克利分校的研究人員最近開發(fā)了一種新的框架,該框架可以增強辦公室,房屋或博物館等室內(nèi)環(huán)境中人類的機器人導(dǎo)航能力。他們的模型在arXiv上預(yù)先發(fā)表的篇論文中
    發(fā)表于 04-09 11:18 ?941次閱讀

    研究人員開源RAD以改進及強化智能學(xué)習(xí)算法

    加州大學(xué)伯克利分校的研究人員本周開放了使用增強數(shù)據(jù)進行強化學(xué)習(xí)(RAD)的資源。
    發(fā)表于 05-11 23:09 ?1366次閱讀

    研究人員探索出了用不同相變材料隱藏紅外輻射的方法

    燈光有時會在我們的眼睛上?;ㄕ?。如果您看著發(fā)亮的表面,則看到的圖像將很大程度上取決于周圍的環(huán)境和照明條件。 伯克利研究人員現(xiàn)在已經(jīng)將眼畸變更進步,找到了一種將視覺誘餌嵌入物體表面的
    發(fā)表于 08-12 10:24 ?883次閱讀

    研究人員發(fā)明全新AI感應(yīng)設(shè)備

    12月23日消息,據(jù)國外媒體報道,加州大學(xué)伯克利分校的研究人員發(fā)明了一種裝置,利用可穿戴傳感器和人工智能軟件來確定個人想要做出的手勢。
    的頭像 發(fā)表于 12-23 16:51 ?2729次閱讀

    美國伯克利市考慮2027年出臺汽油車禁售令

    據(jù)外媒報道,六年后,美國加州伯克利或?qū)⒔燮蛙嚒?伯克利市考慮到2027年出臺項汽油車禁售令,旨在應(yīng)對氣候變化。 伯克利市議會計劃在下周二發(fā)起可行性調(diào)查請求,計劃出臺
    的頭像 發(fā)表于 01-19 11:25 ?1467次閱讀