一支陸軍研究人員小組發(fā)現(xiàn)了人腦如何處理明亮和對比強烈的光線,他們說這是改善機器人感知能力和使自主代理與人類合作的關(guān)鍵。
研究人員說,為了使自主權(quán)的發(fā)展成為陸軍的頭等大事,機器感測必須在不斷變化的環(huán)境中具有彈性。
美國陸軍作戰(zhàn)能力發(fā)展司令部陸軍研究中心的研究員安德烈·哈里森說:“當我們開發(fā)機器視覺算法時,現(xiàn)實世界中的圖像通常會像手機攝像頭一樣被壓縮到較窄的范圍內(nèi),這稱為色調(diào)映射?!睂嶒炇?。“這可能會增加機器視覺算法的脆弱性,因為它們基于人工圖像,這些圖像與我們在現(xiàn)實世界中看到的模式完全不匹配?!?/p>
哈里森說,通過開發(fā)一種具有100,000比1的顯示能力的新系統(tǒng),該團隊發(fā)現(xiàn)了大腦在更多真實世界條件下的計算能力,從而可以將生物適應(yīng)力構(gòu)建到傳感器中。
當前的視覺算法基于對人和動物的研究,并使用計算機監(jiān)視器,其亮度范圍在約100比1(最亮像素與最暗像素之間的比率)的范圍內(nèi)。在現(xiàn)實世界中,這種變化可能是100,000比1的比率,這種情況稱為高動態(tài)范圍或HDR。
“光線的變化和顯著變化可能會挑戰(zhàn)陸軍系統(tǒng)-在樹冠下飛行的無人機可能會因風吹過樹葉而受到反射率變化的困擾,或者在崎rough地形上行駛的自動駕駛汽車可能無法識別坑洼或其他障礙,因為光照條件與訓(xùn)練視覺算法的算法略有不同?!标戃娧芯繂T周寶雄博士說。
研究團隊試圖了解大腦如何自動從現(xiàn)實世界中獲取100,000比1的輸入并將其壓縮到更窄的范圍,從而使人類能夠解釋形狀。該小組研究了HDR下的早期視覺處理,研究了諸如HDR亮度和邊緣之類的簡單功能如何相互作用,以此來揭示潛在的大腦機制。
洪說:“大腦有30多個視覺區(qū)域,對這些區(qū)域如何將眼睛的圖像處理成3D形狀,我們?nèi)匀恢挥谢镜牧私狻!薄拔覀兓谌祟愋袨楹皖^皮記錄進行的HDR亮度研究的結(jié)果表明,我們對如何彌合實驗室與現(xiàn)實環(huán)境之間的鴻溝真正了解甚少。但是,這些發(fā)現(xiàn)使我們脫離了常規(guī),表明我們以前來自標準計算機監(jiān)視器的假設(shè)對現(xiàn)實世界的概括能力有限,并且它們揭示了可以指導(dǎo)我們的建模朝正確機制的原則?!?/p>
該雜志的愿景發(fā)表了團隊的研究發(fā)現(xiàn),突然變暗在高動態(tài)范圍(HDR)的亮度所調(diào)用便利的高對比度目標和亮度相似的分組。
研究人員說,發(fā)現(xiàn)光和對比度邊緣在大腦的視覺表示中如何相互作用的發(fā)現(xiàn),將通過校正從2D信息估計3D形狀時不可避免的歧義,有助于提高在真實世界的亮度下重建真實3D世界的算法的有效性。
洪說:“經(jīng)過數(shù)百萬年的進化,我們的大腦已經(jīng)進化出了從2D信息重建3D的有效捷徑。”“這是一個有著數(shù)十年歷史的問題,即使在AI的最新發(fā)展中,它也繼續(xù)挑戰(zhàn)著機器視覺科學(xué)家?!?/p>
除了實現(xiàn)自主愿景之外,這一發(fā)現(xiàn)還將有助于開發(fā)依賴于廣泛動態(tài)范圍的感知的其他具有AI功能的設(shè)備,例如雷達和遠程語音理解。
研究人員將利用他們的結(jié)果與學(xué)術(shù)界的合作伙伴一起開發(fā)計算模型,特別是尖峰神經(jīng)元,這些神經(jīng)元可能對HDR計算和更節(jié)能的視覺處理均具有優(yōu)勢-這都是低功率無人機的重要考慮因素。
洪說:“動態(tài)范圍的問題不僅僅是感知問題?!薄霸诖竽X計算中,這也可能是一個更普遍的問題,因為單個神經(jīng)元有成千上萬的輸入。您如何構(gòu)建可在不同情況下偵聽正確輸入的算法和體系結(jié)構(gòu)?我們希望通過解決這一問題,在感官層面上,我們可以確認我們處在正確的軌道上,以便在構(gòu)建更復(fù)雜的AI時可以使用正確的工具?!?/p>
-
傳感器
+關(guān)注
關(guān)注
2552文章
51366瀏覽量
755715 -
機器人
+關(guān)注
關(guān)注
211文章
28627瀏覽量
207945 -
機器視覺
+關(guān)注
關(guān)注
162文章
4405瀏覽量
120562
發(fā)布評論請先 登錄
相關(guān)推薦
評論