0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用對抗性深度強(qiáng)化學(xué)習(xí)來衡量自動駕駛汽車的運(yùn)動規(guī)劃和碰撞避免機(jī)制的可靠性

ml8z_IV_Technol ? 來源:未知 ? 作者:李倩 ? 2018-06-08 09:54 ? 次閱讀

現(xiàn)如今,隨著人工智能技術(shù)的迅速發(fā)展,人們普遍認(rèn)為,未來的交通系統(tǒng)將由自動駕駛汽車(AV)所主導(dǎo)??梢哉f,對于更為安全的交通設(shè)施的需求是引起人們對自動駕駛汽車感興趣并推動其發(fā)展的一個主要推動力。但不可否認(rèn),就現(xiàn)在而言,可靠和具有魯棒性的自動駕駛汽車技術(shù)的發(fā)展仍然是一個持續(xù)的挑戰(zhàn),對可靠的運(yùn)動規(guī)劃和碰撞避免機(jī)制的研究尤其重要。最近,堪薩斯州立大學(xué)(Kansas State University,KSU)的科學(xué)家了提出了一種基于深度強(qiáng)化學(xué)習(xí)的新框架,用于對自動駕駛汽車的碰撞避免機(jī)制的行為進(jìn)行基準(zhǔn)測試。

現(xiàn)如今,隨著人們對自主導(dǎo)航的興趣日益增長,關(guān)于運(yùn)動規(guī)劃和碰撞避免技術(shù)(collision avoidance techniques)的研究已經(jīng)加速了全新提議和新進(jìn)展的速度。然而,新技術(shù)的復(fù)雜性及其安全性要求使得當(dāng)前的大部分基準(zhǔn)測試框架不充分,因此對高效的比較技術(shù)的需求沒有得到滿足。這項(xiàng)研究提出了一種基于深度強(qiáng)化學(xué)習(xí)的新框架,用于在處理最佳對抗性智能體的最壞情況下對碰撞避免機(jī)制的行為進(jìn)行基準(zhǔn)測試,該最佳對抗性智能體進(jìn)行訓(xùn)練從而將系統(tǒng)驅(qū)動到不安全狀態(tài)。我們將這個框架的體系結(jié)構(gòu)和流程描述為一個基準(zhǔn)測試解決方案,并通過一個比較兩種碰撞避免機(jī)制的可靠性的實(shí)際案例研究來證明其有效性,從而對有意識的碰撞嘗試做出回應(yīng)。

人們普遍認(rèn)為,未來的交通系統(tǒng)將由自動駕駛汽車(AV)所主導(dǎo)。隨著近年來這一領(lǐng)域的迅速發(fā)展,許多人預(yù)測這種轉(zhuǎn)變將在未來十年內(nèi)發(fā)生。對更為安全的交通運(yùn)輸?shù)男枨?,是引起人們興趣和推動自動駕駛汽車發(fā)展的一個主要動機(jī)。一般認(rèn)為,用專家計(jì)算模型代替人類駕駛員的內(nèi)在缺陷,可以顯著減少由駕駛員的誤差所導(dǎo)致的事故數(shù)量。然而,可靠和具有魯棒性的自動駕駛汽車技術(shù)的發(fā)展仍然是一個持續(xù)的挑戰(zhàn),并且人們正在積極從各個研究和發(fā)展方向來追求這一目標(biāo)。

圖1:對抗性目標(biāo)的圖釋

對可靠的運(yùn)動規(guī)劃和碰撞避免機(jī)制的研究尤其重要。在過去數(shù)十年的時(shí)間里,科學(xué)家們已經(jīng)提出了許多解決這個問題的方法,從控制理論形式化和最優(yōu)控制方法到潛在的基于場和規(guī)則的技術(shù)(field- and rule-based techniques),等等。最近,機(jī)器學(xué)習(xí)的進(jìn)步使得基于諸如模仿學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)(RL)等技術(shù)的全新數(shù)據(jù)驅(qū)動的碰撞避免方法成為可能。然而,隨著其部署環(huán)境和機(jī)制日益復(fù)雜,為這些解決方案提供安全保障的挑戰(zhàn)變得越來越困難。一個值得注意的例子是交通碰撞避免系統(tǒng)(TCAS),在它廣泛部署到NextGen商用飛機(jī)之前,它就已經(jīng)滿足了聯(lián)邦航空局(FAA)的嚴(yán)格安全要求。然而,最近的一些表現(xiàn)表明它在現(xiàn)代高密度空域中非常不可靠,在一定程度上,它可能會導(dǎo)致不可避免的碰撞狀態(tài)(ICS)——不管未來的軌跡如何,最終都會發(fā)生碰撞。此外,最近的研究表明,自動感知和避免機(jī)制可以被對抗性地加以利用以操縱自動駕駛車輛的運(yùn)動軌跡。

作為回應(yīng),科學(xué)家們提出了越來越多的緩解技術(shù)和全新的安全運(yùn)動規(guī)劃方法,但每一種都有特定的特定于案例的假設(shè)和驗(yàn)證程序。因此,對這些方法進(jìn)行定量比較變得非常困難。當(dāng)前最為先進(jìn)的方法包括在運(yùn)動規(guī)劃和碰撞避免中對安全行為進(jìn)行基準(zhǔn)測試的幾次嘗試,但是許多現(xiàn)有的框架未能滿足基于機(jī)器學(xué)習(xí)的新自適應(yīng)技術(shù)的要求。而且,目前的基準(zhǔn)測試框架并不能提供全面的和具有魯棒性的探測機(jī)制,用于在不理想狀態(tài)和軌跡的復(fù)雜空間中進(jìn)行探索。這種框架中的突出方法是基于隨機(jī)化或基于情景的障礙產(chǎn)生,這些障礙很容易丟失特定于被測機(jī)制的關(guān)鍵ICS或其他不需要的狀態(tài)。這些框架中的另一種方法依賴于計(jì)算上昂貴的碰撞狀態(tài)可達(dá)性分析技術(shù),而這也無法為安全運(yùn)行的關(guān)鍵邊界提供具體的保證。

圖2:實(shí)驗(yàn)環(huán)境設(shè)置

為了彌補(bǔ)以安全為中心的基準(zhǔn)測試的缺陷,本文提出了一種基于機(jī)器學(xué)習(xí)的新框架,用于在與最優(yōu)對抗性智能體進(jìn)行交互的最壞情況下對新技術(shù)的可靠性進(jìn)行基準(zhǔn)測試。該框架采用深度強(qiáng)化學(xué)習(xí)的強(qiáng)大的探索和優(yōu)化性能來訓(xùn)練對抗性自主智能體,而該智能體的目標(biāo)是學(xué)習(xí)旨在將系統(tǒng)驅(qū)動到ICS和其他不安全狀態(tài)的最佳導(dǎo)航策略。根據(jù)分析的參數(shù)和目標(biāo),這些目標(biāo)可能包括對抗性智能體與自動駕駛汽車的直接碰撞,或利用避免碰撞機(jī)制來操縱自動駕駛汽車的軌跡以改變和控制其路徑,或間接誘發(fā)自動駕駛汽車和環(huán)境中的其他物體之間的碰撞。

在此基礎(chǔ)上,這項(xiàng)研究的主要貢獻(xiàn)包括:

1)提出碰撞避免算法的最壞情況基準(zhǔn)測試的計(jì)算框架和處理流程,且獨(dú)立于其復(fù)雜性、隨機(jī)性以及自適應(yīng)動力學(xué)。

2)提出深度強(qiáng)化學(xué)習(xí)過程流程以無縫地適應(yīng)于被測系統(tǒng),并克服完全隨機(jī)或基于情景的探索機(jī)制的缺點(diǎn)。

3)提出關(guān)于碰撞避免算法標(biāo)準(zhǔn)化比較的全新的衡量指標(biāo)。

4)通過一個比較兩種碰撞避免機(jī)制應(yīng)對故意碰撞企圖的可靠性的實(shí)際案例研究,來證明所提出框架的實(shí)際應(yīng)用和效果。

圖3:實(shí)驗(yàn)結(jié)果——平均超過100次運(yùn)行

總而言之,在本文中,我們提出了一個流程和框架,它利用對抗性深度強(qiáng)化學(xué)習(xí)來衡量自動駕駛汽車的運(yùn)動規(guī)劃和碰撞避免機(jī)制的可靠性。我們已經(jīng)確立了這一框架的優(yōu)勢,要超過當(dāng)前的基準(zhǔn)測試規(guī)劃,其中包括靈活性和通用性、通過針對特定系統(tǒng)下測試、樣本效率和自定義探索機(jī)制對對抗性策略進(jìn)行訓(xùn)練獲得的適用性探測,以及為不同系統(tǒng)之間的基準(zhǔn)測試和比較提供基線(例如,最壞的情況)測量。

可以這樣說,本文所提出框架的直接架構(gòu)為進(jìn)一步研究提供了一些潛在的研究領(lǐng)域。緊隨而來的下一個步驟就是將此框架應(yīng)用于顯著的和最近發(fā)布的運(yùn)動規(guī)劃和碰撞避免技術(shù)中,目的是為相關(guān)研究項(xiàng)目創(chuàng)建參考基準(zhǔn)。另一個有發(fā)展前景的研究領(lǐng)域是檢查近期發(fā)布技術(shù)的適用性,這些已發(fā)布的技術(shù)聲稱在對抗性干擾下進(jìn)行訓(xùn)練可以增強(qiáng)策略的適應(yīng)力和魯棒性。因此,通過對對抗性策略和碰撞避免的強(qiáng)化學(xué)習(xí)模型的結(jié)合性訓(xùn)練進(jìn)行調(diào)查,可能會出現(xiàn)潛在的緩解和防御技術(shù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1793

    文章

    47590

    瀏覽量

    239472
  • 自動駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13915

    瀏覽量

    166767

原文標(biāo)題:對抗強(qiáng)化學(xué)習(xí)最新研究:可用于自動駕駛汽車「碰撞避免機(jī)制」檢測

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    一個使用傳統(tǒng)DAS和深度強(qiáng)化學(xué)習(xí)融合的自動駕駛框架

    本文提出了一個使用傳統(tǒng)DAS和深度強(qiáng)化學(xué)習(xí)融合的自動駕駛框架。該框架在DAS功能(例如車道變換,巡航控制和車道保持等)下,以最大限度地提高平均速度和最少車道變化為規(guī)則,確定超車次數(shù)。
    的頭像 發(fā)表于 06-14 09:41 ?8945次閱讀

    什么是深度強(qiáng)化學(xué)習(xí)?深度強(qiáng)化學(xué)習(xí)算法應(yīng)用分析

    什么是深度強(qiáng)化學(xué)習(xí)? 眾所周知,人類擅長解決各種挑戰(zhàn)的問題,從低級的運(yùn)動控制(如:步行、跑步、打網(wǎng)球)到高級的認(rèn)知任務(wù)。
    發(fā)表于 07-01 10:29 ?1502次閱讀
    什么是<b class='flag-5'>深度</b><b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>?<b class='flag-5'>深度</b><b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>算法應(yīng)用分析

    FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?

    低,適合用于實(shí)現(xiàn)高效的圖像算法,如車道線檢測、交通標(biāo)志識別等。 雷達(dá)和LiDAR處理:自動駕駛汽車通常會使用雷達(dá)和LiDAR(激光雷達(dá))等多種傳感器獲取環(huán)境信息。FPGA能夠協(xié)助完成這些傳感器
    發(fā)表于 07-29 17:09

    AI/自動駕駛領(lǐng)域的巔峰會議—國際AI自動駕駛高峰論壇

    已經(jīng)滲透到了社會生活的方方面面。人工智能在自動駕駛領(lǐng)域?qū)φ麄€汽車出行領(lǐng)域產(chǎn)生顛覆變革。汽車的人工智能技術(shù)和數(shù)據(jù)后端的最新突破使自動駕駛
    發(fā)表于 09-13 13:59

    人工智能深度學(xué)習(xí)發(fā)展迅速,智能科技公司都已經(jīng)涉足人工智能產(chǎn)品的研發(fā)!

    發(fā)表于 09-05 10:22

    如何讓自動駕駛更加安全?

    要有可靠性、安全做保證。現(xiàn)在一些企業(yè)往往以市場推廣宣傳為主,真正技術(shù)上能達(dá)到安全可靠的還是比較少。實(shí)現(xiàn)真正意義上的自動駕駛是個系統(tǒng)工程需要汽車
    發(fā)表于 05-13 00:26

    深度學(xué)習(xí)DeepLearning實(shí)戰(zhàn)

    內(nèi)容2:課程一: Tensorflow入門到熟練:課程二:圖像分類:課程三:物體檢測:課程四:人臉識別:課程五:算法實(shí)現(xiàn):1、卷積神經(jīng)網(wǎng)絡(luò)CNN2、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN3、強(qiáng)化學(xué)習(xí)DRL4、對抗性生成
    發(fā)表于 01-09 17:01

    深度強(qiáng)化學(xué)習(xí)實(shí)戰(zhàn)

    內(nèi)容2:課程一: TensoRFlow入門到熟練:課程二:圖像分類:課程三:物體檢測:課程四:人臉識別:課程五:算法實(shí)現(xiàn):1、卷積神經(jīng)網(wǎng)絡(luò)CNN2、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN3、強(qiáng)化學(xué)習(xí)DRL4、對抗性生成
    發(fā)表于 01-10 13:42

    存儲如何提升自動駕駛汽車可靠性看了就知道

    更智能的存儲如何提升自動駕駛汽車可靠性
    發(fā)表于 03-10 07:01

    基于強(qiáng)化學(xué)習(xí)的飛行自動駕駛儀設(shè)計(jì)

    針對強(qiáng)化學(xué)習(xí)在連續(xù)狀態(tài)連續(xù)動作空間中的維度災(zāi)難問題,利用BP神經(jīng)網(wǎng)絡(luò)算法作為值函數(shù)逼近策略,設(shè)計(jì)了自動駕駛儀。并引入動作池機(jī)制,有效避免飛行
    發(fā)表于 06-25 16:27 ?27次下載
    基于<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>的飛行<b class='flag-5'>自動駕駛</b>儀設(shè)計(jì)

    強(qiáng)化學(xué)習(xí)自動駕駛的應(yīng)用

    自動駕駛汽車首先是人工智能問題,而強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個重要分支,是多學(xué)科多領(lǐng)域交叉的一個產(chǎn)物。今天人工智能頭條給大家介紹強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 07-10 09:00 ?5009次閱讀
    <b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>在<b class='flag-5'>自動駕駛</b>的應(yīng)用

    探討深度學(xué)習(xí)自動駕駛中的應(yīng)用

    深度強(qiáng)化學(xué)習(xí)的理論、自動駕駛技術(shù)的現(xiàn)狀以及問題、深度強(qiáng)化學(xué)習(xí)自動駕駛技術(shù)當(dāng)中的應(yīng)用及基于
    的頭像 發(fā)表于 08-18 10:19 ?5190次閱讀

    深度學(xué)習(xí)技術(shù)與自動駕駛設(shè)計(jì)的結(jié)合

    在過去的十年里,自動駕駛汽車技術(shù)取得了越來越快的進(jìn)步,主要得益于深度學(xué)習(xí)和人工智能領(lǐng)域的進(jìn)步。作者就自動駕駛中使用的
    發(fā)表于 10-28 16:07 ?2043次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>技術(shù)與<b class='flag-5'>自動駕駛</b>設(shè)計(jì)的結(jié)合

    強(qiáng)化學(xué)習(xí)與智能駕駛決策規(guī)劃

    本文介紹了強(qiáng)化學(xué)習(xí)與智能駕駛決策規(guī)劃。智能駕駛中的決策規(guī)劃模塊負(fù)責(zé)將感知模塊所得到的環(huán)境信息轉(zhuǎn)化成具體的
    的頭像 發(fā)表于 02-08 14:05 ?1909次閱讀

    鑒源實(shí)驗(yàn)室·如何通過雷達(dá)攻擊自動駕駛汽車-針對點(diǎn)云識別模型的對抗性攻擊的科普

    非常精確,它們也面臨一種新興的威脅——對抗性攻擊。 對抗性攻擊是一種通過微小但精心設(shè)計(jì)的擾動,旨在欺騙機(jī)器學(xué)習(xí)模型的攻擊方式。對于自動駕駛系統(tǒng)而言,這意味著通過對傳感器輸入的數(shù)據(jù)進(jìn)行極
    的頭像 發(fā)表于 11-05 15:44 ?330次閱讀
    鑒源實(shí)驗(yàn)室·如何通過雷達(dá)攻擊<b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>-針對點(diǎn)云識別模型的<b class='flag-5'>對抗性</b>攻擊的科普