西西大胆午夜人体视频,虎白女粉嫩在线观看免费,欧美黑人巨大videos精品巨肥

一般來(lái)說(shuō)，在行人間行進(jìn)的智能體在進(jìn)行導(dǎo)航時(shí)，需要能夠?qū)Ξ?dāng)前的環(huán)境做出相應(yīng)的觀察，以避免碰撞，進(jìn)行下一步動(dòng)作。在本文中，麻省理工學(xué)院航空航天控制實(shí)驗(yàn)室的Michael Everett和 Jonathan P. How教授，以及Oculus Research的Yu Fan Chen教授，提出一種新型避免碰撞的算法—GA3C-CADRL，通過(guò)深度強(qiáng)化學(xué)習(xí)進(jìn)行模擬訓(xùn)練，而不需要智能體對(duì)其他智能體的動(dòng)態(tài)行為有所了解，并通過(guò)在網(wǎng)絡(luò)的輸入端使用LSTM，使得算法能夠依據(jù)對(duì)相鄰智能體的觀察結(jié)果來(lái)做出決策，進(jìn)而選擇下一個(gè)動(dòng)作。

一般來(lái)說(shuō)，在行人之間進(jìn)行導(dǎo)航的機(jī)器人是使用避免碰撞算法（collision avoidance algorithms）來(lái)實(shí)現(xiàn)安全且高效的操作的。在最近的一些研究中，提出了將深度強(qiáng)化學(xué)習(xí)算法作為對(duì)復(fù)雜的交互和協(xié)作進(jìn)行建模的框架。然而，當(dāng)環(huán)境中智能體的數(shù)量增加時(shí)，該操作的實(shí)現(xiàn)是通過(guò)對(duì)其他智能體偏離現(xiàn)實(shí)的行為的關(guān)鍵性假設(shè)來(lái)實(shí)現(xiàn)的。這項(xiàng)研究對(duì)我們以往的研究方法進(jìn)行了擴(kuò)展，開(kāi)發(fā)出一種算法，該算法可以在各種類(lèi)型的動(dòng)態(tài)智能體中學(xué)習(xí)避免碰撞，而不必假設(shè)它們遵循任何特定的行為規(guī)則。此外，這項(xiàng)研究還引入了一種使用長(zhǎng)短期記憶網(wǎng)絡(luò)（LSTM）的策略，該策略使得算法能夠使用任意數(shù)量的其他智能體的觀測(cè)值，而不是像以往那些需要具有固定觀測(cè)值大小的方法。當(dāng)智能體的數(shù)量增加時(shí)，我們所提出的算法在模擬中的性能表現(xiàn)要優(yōu)于我們以往的方法，并且該算法是在一個(gè)沒(méi)有使用3D激光雷達(dá)的、以人類(lèi)行走速度行駛的全自動(dòng)機(jī)器車(chē)輛上運(yùn)行得以證明的。

可以這樣說(shuō)，在行人之間進(jìn)行導(dǎo)航的機(jī)器人將能夠觀察到許多人類(lèi)行為，例如合作或遺忘。行人不僅能夠移動(dòng)障礙物，而且還可以不斷地做出機(jī)器人只能部分觀察的決策。這項(xiàng)研究解決了在存在其他決策智能體的世界中運(yùn)行的智能體所面對(duì)的避免碰撞問(wèn)題，特別是考慮到機(jī)器人—行人領(lǐng)域。分散式避免碰撞算法的一個(gè)基本問(wèn)題是：智能體所知道和假定的其他智能體的信念狀態(tài)、策略和意圖是什么？如果沒(méi)有智能體之間的溝通，這些屬性不是可以直接進(jìn)行衡量的，但它們可以通過(guò)推理得到。

圖1：機(jī)器人在行人之間進(jìn)行導(dǎo)航。機(jī)器人使用機(jī)載傳感器來(lái)感知環(huán)境并運(yùn)行避免碰撞算法以保持安全和有效的操作。

智能體對(duì)其他智能體行為的假設(shè)將會(huì)影響其決定采取何種行動(dòng)。在最簡(jiǎn)單的情況下，智能體假設(shè)其他智能體是靜態(tài)的，并且足夠快地進(jìn)行重新規(guī)劃以避免碰撞。另一種方法是，假定其他智能體是動(dòng)態(tài)障礙，但速度保持不變。此外，智能體可以假定其智能體是決策制定者，其中，它們的速度可能會(huì)隨時(shí)根據(jù)已知或未知的策略（決策規(guī)則）進(jìn)行改變。即使機(jī)器人知道行人的決策規(guī)則，但因?yàn)槠渌悄荏w的意圖是未知的（例如目標(biāo)目的地），所以也不可能完全預(yù)測(cè)其他非溝通的決策智能體（例如行人）將如何響應(yīng)智能體所作出的決策。因此，與其試圖明確預(yù)測(cè)其他智能體的行為，最近的研究方法已經(jīng)使用強(qiáng)化學(xué)習(xí)（RL）來(lái)對(duì)智能體之間復(fù)雜的相互作用和協(xié)作進(jìn)行建模。

圖2：LSTM展開(kāi)以顯示每個(gè)輸入。在每個(gè)決策步驟中，智能體將一個(gè)可觀察的狀態(tài)向量，即每個(gè)附近的智能體，依次送入LSTM單元。LSTM單元將相關(guān)信息存儲(chǔ)在隱藏狀態(tài)中，hi。最終隱藏狀態(tài)hn，將其他智能體的整個(gè)狀態(tài)編碼成固定長(zhǎng)度的向量，然后饋送到網(wǎng)絡(luò)的前饋部分。智能體的順序是通過(guò)減少到自我智能體的距離來(lái)進(jìn)行排序的，以便最近的智能體對(duì)hn有近因效應(yīng)（recent effect）。

雖然基于學(xué)習(xí)的方法已被證明在這個(gè)領(lǐng)域內(nèi)具有良好的性能表現(xiàn)，但現(xiàn)有方法對(duì)其他智能體，如同質(zhì)性或短時(shí)間尺度上的特定運(yùn)動(dòng)模型做了細(xì)微的假設(shè)。在這項(xiàng)研究中，我們對(duì)以往的研究方法進(jìn)行了擴(kuò)展以學(xué)習(xí)避免碰撞策略，而不假設(shè)其他智能體遵循任何特定的行為模型。

圖3：網(wǎng)絡(luò)架構(gòu)。附近智能體的的可觀察狀態(tài)被按順序饋送到LSTM中。

避免碰撞的另一項(xiàng)關(guān)鍵挑戰(zhàn)是環(huán)境中其他智能體的數(shù)量有所不同，而在這一領(lǐng)域中使用的前饋神經(jīng)網(wǎng)絡(luò)需要固定維度的輸入?，F(xiàn)有的策略明確了網(wǎng)絡(luò)可觀察到的智能體的最大數(shù)量，或使用原始傳感器數(shù)據(jù)作為輸入。本次研究采用自然語(yǔ)言處理的思想，通過(guò)在網(wǎng)絡(luò)輸入端使用長(zhǎng)短期記憶網(wǎng)路（LSTM）單元，將現(xiàn)實(shí)世界中不同的大小狀態(tài)（例如：其他智能體的位置）編碼成固定長(zhǎng)度的向量。這使得該算法可以根據(jù)機(jī)器人周?chē)我鈹?shù)量的智能體，來(lái)做出相應(yīng)的決策。

本次研究的主要貢獻(xiàn)在于：

?我們對(duì)避免碰撞的算法做了擴(kuò)展，使其不必假定其他智能體的行為。

?我們提出了一種策略，使得算法能夠利用任意數(shù)量智能體的觀察結(jié)果。

?我們通過(guò)模擬結(jié)果證明了新框架的優(yōu)點(diǎn)。

?在不使用3D激光雷達(dá)的情況下，通過(guò)在行人間運(yùn)行的機(jī)器人進(jìn)行了算法演示。

目前，該軟件已經(jīng)作為開(kāi)源ROS軟件包c(diǎn)adrl_ros發(fā)布。

圖4：機(jī)器人硬件。這款緊湊、低成本（<1000美元）的感測(cè)套件使用單個(gè)2D激光雷達(dá)和3個(gè)Intel RealSense R200攝像頭。總傳感器和計(jì)算組件的高度小于3英寸，為貨物留出足夠的空間。

本次研究提出了一種避免碰撞的算法—GA3C-CADRL，該算法僅通過(guò)深度強(qiáng)化學(xué)習(xí)進(jìn)行模擬訓(xùn)練，而不需要對(duì)其他智能體的動(dòng)態(tài)有所了解。此外，我們還提出了一種策略，通過(guò)在網(wǎng)絡(luò)的輸入端使用LSTM，使得算法能夠依據(jù)對(duì)任意數(shù)量的相鄰智能體的觀察結(jié)果來(lái)做出決策進(jìn)而選擇下一個(gè)動(dòng)作。隨著環(huán)境中智能體數(shù)量的增加，新方法的性能將優(yōu)于現(xiàn)有方法。研究結(jié)果表明，該算法能夠在不被明確執(zhí)行（explicity enforced）的情況下學(xué)習(xí)問(wèn)題結(jié)構(gòu)，并支持使用LSTM將大量智能體在現(xiàn)實(shí)世界中的狀態(tài)編碼為固定長(zhǎng)度的表征。新算法在一個(gè)小型真實(shí)機(jī)器人上成功運(yùn)行，該機(jī)器人在不使用3D激光雷達(dá)的情況下，可以在保持人類(lèi)行走速度的同時(shí)，在行人之間進(jìn)行導(dǎo)航。今后的研究將利用本文全新的、更為通用的公式，借助智能體的行為選擇，更為明確地研究信號(hào)意圖所帶來(lái)的影響。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
212

文章
29200

瀏覽量
210720
算法

算法

+關(guān)注

關(guān)注
23

文章
4677

瀏覽量
94263
導(dǎo)航

導(dǎo)航

+關(guān)注

關(guān)注
7

文章
542

瀏覽量
42894
激光雷達(dá)

激光雷達(dá)

+關(guān)注

關(guān)注
970

文章
4127

瀏覽量
191482

原文標(biāo)題：MIT提出使用「深度強(qiáng)化學(xué)習(xí)」幫助智能體在運(yùn)動(dòng)中做出「動(dòng)作決策」

文章出處：【微信號(hào)：IV_Technology，微信公眾號(hào)：智車(chē)科技】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

電機(jī)控制器出現(xiàn)的一種偶發(fā)故障排查與分析

通信方式傳輸信息，控制器接收總控系統(tǒng)發(fā)出的電機(jī)啟動(dòng)和轉(zhuǎn)速指令，同時(shí)向總控系統(tǒng)反饋電機(jī)的工作狀態(tài)，包括電壓、電流、轉(zhuǎn)速、轉(zhuǎn)向等信息。純分享帖，需要者可點(diǎn)擊附件獲取完整資料~~~*附件：電機(jī)控制器出現(xiàn)的一種

發(fā)表于 04-14 21:32

一種基于分?jǐn)?shù)階 PID 直流電機(jī)調(diào)速的 AGV 控制系統(tǒng)

為設(shè)計(jì)一種低成本、抗干擾、穩(wěn)定可靠的 AGV，提出一種基于磁帶導(dǎo)航的 AGV 系統(tǒng)。采用 Megawin 公司的80C51單片機(jī)為控制核心，以并排對(duì)稱(chēng)設(shè)計(jì)的霍爾傳感器實(shí)現(xiàn)循跡和糾偏，紅外光

發(fā)表于 03-25 15:10

一種以圖像為中心的3D感知模型BIP3D

在具身智能系統(tǒng)中，3D感知算法是一個(gè)關(guān)鍵組件，它在端側(cè)幫助可以幫助智能體理解環(huán)境信息，在云端可以用來(lái)輔助生成3D場(chǎng)景和3D標(biāo)簽，具備重要的研

發(fā)表于 03-17 13:44 ?238次閱讀

<b class='flag-5'>一種</b>以圖像為中心的<b class='flag-5'>3</b>D感知模型BIP<b class='flag-5'>3</b>D

上海光機(jī)所在n型β-Ga2O3單晶光電性能調(diào)控方面取得進(jìn)展

圖1?W:β-Ga2O3晶體的透射光譜(a)及光學(xué)帶隙(b) 近期，中國(guó)科學(xué)院上海光學(xué)精密機(jī)械研究所先進(jìn)激光與光電功能材料部研究團(tuán)隊(duì)聯(lián)合高功率激光元件技術(shù)與工程部研究團(tuán)隊(duì)在n型β-Ga2O3單晶光電

發(fā)表于 02-28 06:22 ?243次閱讀

上海光機(jī)所在n型β-<b class='flag-5'>Ga2O3</b>單晶光電性能調(diào)控方面取得進(jìn)展

國(guó)睿安泰信 GA4063-TG 帶信號(hào)源 GA4033 數(shù)字頻譜分析儀

國(guó)睿安泰信 GA4063-TG 帶信號(hào)源 GA4033 數(shù)字頻譜分析儀 GA40XX系列3G頻譜分析

發(fā)表于 02-21 17:56 ?262次閱讀

一種基于MASt3R的實(shí)時(shí)稠密SLAM系統(tǒng)

精心設(shè)計(jì)的集成式硬件與軟件堆棧，實(shí)現(xiàn)穩(wěn)健且精準(zhǔn)的視覺(jué)SLAM已成為可能。然而，SLAM尚未能成為一種即插即用的算法，因其需要硬件方面的專(zhuān)業(yè)知識(shí)以及校準(zhǔn)操作。即便對(duì)于僅配備單個(gè)攝像頭且無(wú)諸如IMU等額外傳感器的最簡(jiǎn)設(shè)置而言，也不存在一種

發(fā)表于 12-27 15:25 ?989次閱讀

一種混合顏料光譜分區(qū)間識(shí)別方法

古代彩繪顏料的分析是科技考古與文物保護(hù)研究的重要內(nèi)容,高光譜是近年來(lái)發(fā)展迅速的新興技術(shù),在物質(zhì)識(shí)別上具有廣泛應(yīng)用,提出一種基于高光譜分區(qū)間的混合顏料識(shí)別方法。一種混合顏料光譜分區(qū)間識(shí)別方法古代

發(fā)表于 12-02 16:22 ?280次閱讀

?ISP算法及架構(gòu)分析介紹

一、ISP算法及架構(gòu)分析介紹 ISP即Image Signal Processor，是一種圖像處理架構(gòu)，不是我們用的下載器。 ISP其實(shí)算是圖像處理的

發(fā)表于 11-26 10:05 ?1310次閱讀

一種基于深度學(xué)習(xí)的二維拉曼光譜算法

近日，天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實(shí)驗(yàn)室提出了一種基于深度學(xué)習(xí)的二維拉曼光譜算法，成果以“Rapid and accurate bacteria identification

發(fā)表于 11-07 09:08 ?551次閱讀

一種利用CSD16327Q3實(shí)現(xiàn)企業(yè)固態(tài)硬盤(pán)鉭電容短路保護(hù)的方法

電子發(fā)燒友網(wǎng)站提供《一種利用CSD16327Q3實(shí)現(xiàn)企業(yè)固態(tài)硬盤(pán)鉭電容短路保護(hù)的方法.pdf》資料免費(fèi)下載

發(fā)表于 10-25 10:22 ?0次下載

一種完全分布式的點(diǎn)線(xiàn)協(xié)同視覺(jué)慣性導(dǎo)航系統(tǒng)

在本文中，我們提出了一種完全分布式的點(diǎn)線(xiàn)協(xié)同視覺(jué)慣性導(dǎo)航系統(tǒng)。我們通過(guò)蒙特卡羅模擬和真實(shí)環(huán)境數(shù)據(jù)集，在稠密特征或稀疏特征環(huán)境下將所提出的算法與其他四種算法進(jìn)行了比較。所有結(jié)果表明，我們

發(fā)表于 09-30 14:45 ?667次閱讀

GA-Z77-DS3H主板電路圖

技嘉GA-Z77-DS3H主板電路圖583304 GA-Z77-DS3H-R10.pdf

發(fā)表于 07-29 13:18 ?21次下載

GA-Z77X-UD3H主板電路圖

電子發(fā)燒友網(wǎng)站提供《GA-Z77X-UD3H主板電路圖.pdf》資料免費(fèi)下載

發(fā)表于 07-29 13:17 ?7次下載

rup是一種什么模型

RUP（Rational Unified Process，統(tǒng)一建模語(yǔ)言）是一種軟件開(kāi)發(fā)過(guò)程模型，它是一種迭代和增量的軟件開(kāi)發(fā)方法。RUP是由Rational Software公司（現(xiàn)為IBM的

發(fā)表于 07-09 10:13 ?1898次閱讀

一種手掌大小的氣體傳感器和分析儀，可實(shí)時(shí)檢測(cè)多種有毒氣體

據(jù)麥姆斯咨詢(xún)報(bào)道，歐洲的一個(gè)研究項(xiàng)目正在開(kāi)發(fā)一種手掌大小的氣體傳感器和分析儀，能夠安裝在燈柱上實(shí)時(shí)檢測(cè)多種有毒氣體。

發(fā)表于 05-07 09:06 ?983次閱讀