編者按:在自適應(yīng)搜索問題中,經(jīng)常會需要機器人在很強的背景干擾情況下定位目標位置。在本文中,伯克利的研究人員提出了一種通用的自適應(yīng)感知方法AdaSearch,能快速定位目標點。以下是論智對該成果的編譯。
在機器學(xué)習(xí)的很多任務(wù)中,常見的有根據(jù)固定、預(yù)先收集好的數(shù)據(jù)集回答問題。但是在一些應(yīng)用中,我們沒有先驗數(shù)據(jù),必須自己收集回答問題所需要的數(shù)據(jù),例如在環(huán)境污染監(jiān)控和人口普查過程中常出現(xiàn)這種情況。自己收集數(shù)據(jù)則要求我們將注意力放在最相關(guān)的信息源上,但是想確定哪些信息源會得到有用的結(jié)果則是很困難的。另外,當實體收集數(shù)據(jù)時(例如機器人、衛(wèi)星或人類),我們必須對測量方法進行規(guī)劃,盡量減少智能體隨時間移動所造成的成本增加。我們將這種抽象的問題稱為“具身自適應(yīng)感知(embodied adaptive sensing)”。
針對這一問題,我們提出了新的解決方法,其中機器人必須穿越它所在的環(huán)境后確定位置或目標物體。自適應(yīng)感知涵蓋了機器人研究中的很多問題,例如快速定位污染物或放射性資源的泄漏、在搜救中找尋被困者。在這些情況下,設(shè)計一種能盡快返回正確結(jié)果的感知軌跡是很重要的。
本文我們以放射物泄漏問題(RSS)為例,無人機需要確定環(huán)境中k-最大的放射性輻射源,k是用戶定義的參數(shù)。RSS是自適應(yīng)感知問題中非常有趣的案例,因為其中會遇到多種復(fù)雜的背景噪聲(放射源周圍有很多放射性物質(zhì))。
于是,我們提出了AdaSearch,這是一種用于通用自適應(yīng)感知問題的連續(xù)消除式的框架,我們在放射源尋找的環(huán)境下測試它。AdaSearch在環(huán)境中的每一點都能將泄漏率控制在置信區(qū)間中。利用這些置信區(qū)間,算法經(jīng)過迭代確定了一系列可能泄漏點,最終選出唯一的一個,清除掉其他的。
將具身搜索看作多重假設(shè)的測試場景
傳統(tǒng)上,機器人領(lǐng)域?qū)⒕呱硭阉鳎╡mbodied search)看作持續(xù)的運動計劃問題,其中機器人必須平衡環(huán)境探索和對高效軌跡的選擇。這就催生了既可以進行路線優(yōu)化,又可以進行環(huán)境探索的方法,可以用滾動時域控制(receding horizon control)進行優(yōu)化。而我們通過假設(shè)檢驗測試,將該問題看作序列最佳動作定義。
在假設(shè)檢驗測試中,它的目標是在多種分散問題上得出結(jié)論。給定智能體一系列測量動作N,每個都能根據(jù)固定分布生成觀察結(jié)果。
智能體的目標是學(xué)習(xí)這些N個觀察分布中的預(yù)指定特征。例如,我們以向新客戶展示產(chǎn)品A或產(chǎn)品B為例,記錄他們對該產(chǎn)品的評價,從而表示統(tǒng)計學(xué)中的A/B測試。這里的N=2,因為只有兩個動作:展示A和展示B。而我們要研究的目標特征就是哪個產(chǎn)品更受歡迎。根據(jù)我們收集到的偏好信息,對這些樣本以及置信區(qū)間進行跟蹤記錄,分別用置信下限和上限對產(chǎn)品進行定義。隨著收集的評價越多,我們對每個產(chǎn)品的偏好估計就越準確。最終可以用一個結(jié)論來定義B比A更受歡迎:如果B的置信下限比A的置信上限還要高,那么我們可以認為B比A更受歡迎。
而在環(huán)境感知的情況下,每個動作都要從一定位置和方向讀取傳感器。通常來說,智能體的目標是確定哪個方向能測量出最多的觀測信號,或者哪一系列的k動作能得到最大的平均觀測。為了這一目標,智能體可能會按順序選擇動作,通過此前的觀察選擇信息量更多的動作。
乍一看,序列最佳動作確定可能對移動的具身感知智能體來說太抽象了。智能體完全可以不考慮潛在成本隨機選擇動作。但是,抽象的動作確定是非常強大的。通過精準的統(tǒng)計語言實現(xiàn)具身搜索問題,我們提出了與每種感知動作非常相關(guān),且置信度很高的觀察方法,確定了未來要做的一系列動作。
我們提出的AdaSearch用序列最佳動作定義得到的置信區(qū)間和全局軌跡規(guī)劃,實現(xiàn)了漸進最優(yōu)的測量復(fù)雜度,并能有效的分攤運動成本。
放射源尋找
為了驗證它的效果,我們會用AdaSearch尋找放射性元素唯一一個泄漏點。我們將環(huán)境模擬成一個平面網(wǎng)格,如下所示。其中的紅點是放射性元素集中的區(qū)域。但是定位這一點非常難,因為傳感器會被其他紫色的點(背景輻射)干擾。信息的收集由配有傳感器的無人機進行,目標就是設(shè)計一個路線,我們能通過傳感器收集來的觀測信息,盡快定位放射點的位置。
AdaSearch
我們的AdaSearch算法結(jié)合了全局收斂計劃和自適應(yīng)感知。在無人機第一次通過網(wǎng)格時,會先均勻地收集環(huán)境信息。
第一次觀察后,我們能取消一些明顯不合適的區(qū)域。如果在平均值周圍的置信上限小于任何區(qū)間的最大下限,該點則會被消除,表示該點不是目標區(qū)域。
在下一次探索,AdaSearch會更仔細地搜索剩余點,直到找到目標。
Baseline
我們將AdaSearch和經(jīng)過相同案例訓(xùn)練的信息最大化方法——InfoMax進行比較。但不幸的是,對于大型空間的搜索,實時計算無法支持路線規(guī)劃或者參數(shù)化。這可能導(dǎo)致算法變得非常貪婪,會花大量時間找尋錯誤的原因。
為了區(qū)分我們的置信區(qū)間所帶來的影響和全局規(guī)劃啟發(fā)法,我們用簡單的全局規(guī)劃方法——NaiveSearch作為第二種baseline。這種方法統(tǒng)一地對網(wǎng)格采樣,在每個單元格上都花費同樣時間。
結(jié)果
我們在64×64米的網(wǎng)格上,用4米的分辨率實現(xiàn)了三種算法,模擬了放射性源尋找的實例。結(jié)果我們觀察到,AdaSearch通常比NaiveSearch和InfoMax更快完成。隨著不斷增加背景輻射的水平,NaiveSearch的運行時間越來越慢,但AdaSearch的變化卻不大。
-
機器人
+關(guān)注
關(guān)注
211文章
28472瀏覽量
207385 -
無人機
+關(guān)注
關(guān)注
230文章
10455瀏覽量
180876 -
智能體
+關(guān)注
關(guān)注
1文章
152瀏覽量
10592
原文標題:AdaSearch:用連續(xù)消除法實現(xiàn)自適應(yīng)感知,快速精準定位
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論