0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于ML-Agents v0.4,在Unity 2018搭建的虛擬城市環(huán)境中訓(xùn)練了一輛自動(dòng)駕駛車(chē)輛

ml8z_IV_Technol ? 來(lái)源:未知 ? 作者:李倩 ? 2018-07-09 16:33 ? 次閱讀

本文基于ML-Agents v0.4,在Unity 2018搭建的虛擬城市環(huán)境中訓(xùn)練了一輛自動(dòng)駕駛車(chē)輛。Unity自帶傳感器,而且考慮到場(chǎng)景中所有物體的狀態(tài),例如:分類、尺寸、速度等都是可以提取的,所以在Unity場(chǎng)景中訓(xùn)練模型可以節(jié)省大量的人工標(biāo)記圖片的工作,經(jīng)濟(jì)性較好。

2018年3月20 日,美國(guó)亞利桑那州一位女士推著一輛自行車(chē)突然闖入機(jī)動(dòng)車(chē)道,被一輛處于自動(dòng)駕駛模式的Uber無(wú)人汽車(chē)撞倒并且喪生。根據(jù)科技媒體The Information的報(bào)道,行人從陰影中出現(xiàn),而且自行車(chē)擋在行人身前,導(dǎo)致車(chē)輛判斷失誤。

這表明:Uber的自動(dòng)駕駛車(chē)輛還沒(méi)能完成充分的訓(xùn)練,只能識(shí)別較為明顯的障礙物,而且對(duì)于邊界場(chǎng)景考慮存在不足。

問(wèn)題思考

如果想讓一輛Level 5級(jí)別的自動(dòng)駕駛車(chē)輛正式上路,到底需要經(jīng)過(guò)多少里程的測(cè)試訓(xùn)練呢?2016年蘭德智庫(kù)曾給出答案:110億英里。

作為自動(dòng)駕駛?cè)Φ念I(lǐng)頭羊,Waymo在2017年底對(duì)自動(dòng)駕駛測(cè)試?yán)锍掏黄?00萬(wàn)英里進(jìn)行了慶祝,然而這個(gè)里程離110億英里還差很遠(yuǎn)。相對(duì)的,谷歌虛擬車(chē)輛每天可以跑800萬(wàn)英里。

虛擬仿真可以很可觀的加速測(cè)試過(guò)程,尤其是比較危險(xiǎn)邊界場(chǎng)景只能在虛擬場(chǎng)景中測(cè)試。而且受限于政策與法規(guī),目前可供自動(dòng)駕駛路測(cè)的城市可謂是少之又少,針對(duì)于大部分地區(qū)無(wú)法進(jìn)行自動(dòng)駕駛路測(cè)的問(wèn)題,可以通過(guò)仿真測(cè)試來(lái)得到解決。

工具選擇

為什么選擇使用了Unity 2018,而不是 ADAS 仿真的商業(yè)工具,來(lái)制作道路環(huán)境建模和傳感器建模?主要原因:來(lái)自世界各地的用戶都可以參與到虛擬環(huán)境的評(píng)估測(cè)試中。

這個(gè)概念被稱為“游戲化和大眾參與的虛擬測(cè)試”。一般來(lái)說(shuō),為了評(píng)估自動(dòng)駕駛車(chē)輛的實(shí)施情況,例如:駕駛員輸入,其它車(chē)輛行為,道路幾何形狀等,需要考慮許多情況。通過(guò)使用由人類和虛擬用戶組成的游戲環(huán)境,相比于傳統(tǒng)靜態(tài)測(cè)試場(chǎng)景,自動(dòng)駕駛代碼可以進(jìn)行更廣泛地測(cè)試。

除了支持多用戶平臺(tái)外,Unity還擁有界面友好的GUI編輯器、3D物理引擎、動(dòng)畫(huà)引擎、 3D模型導(dǎo)入以及C或JavaScript腳本。這些功能可以幫助設(shè)計(jì)和模擬包含道路模型和車(chē)輛、行人、摩托車(chē)和自行車(chē)等其它動(dòng)態(tài)對(duì)象的模型城市。Unity擁有龐大的資源庫(kù)和社區(qū)支持,我們可以訪問(wèn)Unity Asset Store資源商店獲取大量資源,加快開(kāi)發(fā)速度,這是其它引擎和軟件所不具備的。

Unity機(jī)器學(xué)習(xí)代理工具M(jìn)L-Agents,可以使用游戲和模擬的環(huán)境作為訓(xùn)練智能代理的環(huán)境。 可以進(jìn)行強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)或其它機(jī)器學(xué)習(xí)方法, 通過(guò)簡(jiǎn)單易用的Python API對(duì)代理進(jìn)行訓(xùn)練。

TensorFlow是一個(gè)開(kāi)源的機(jī)器學(xué)習(xí)框架,可以運(yùn)行在臺(tái)式機(jī)、服務(wù)器、手機(jī)移動(dòng)端設(shè)備上。因?yàn)槭褂玫墓P記本沒(méi)有NIVIDA的顯卡,所以安裝的運(yùn)行環(huán)境是基于CPU運(yùn)算的,訓(xùn)練時(shí)間大概是使用GPU加速的4~5倍。

環(huán)境搭建

1

創(chuàng)建城市模型

我們可以從Assets Store資源商店中下載已經(jīng)搭建好的城市模型或者道路模型組件,自行設(shè)計(jì)道路系統(tǒng)。

Assets Store 資源商店中有很多已經(jīng)搭建好的城市模型,所以沒(méi)有必要花費(fèi)大量的時(shí)間從零開(kāi)始設(shè)計(jì)城市模型。如果對(duì)道路和城市模型的自定義程度要求較高的話,也可以下載城市建筑物和道路的組建,自己組裝城市和道路。

2

使用NavMesh設(shè)計(jì)城市中的車(chē)流

NavMesh是Unity中控制游戲角色進(jìn)行空間探索和尋路的一個(gè)類。我們使用NavMesh設(shè)計(jì)了行駛在虛擬環(huán)境中的AI車(chē)流。

車(chē)輛整體的運(yùn)行路線固定,但是因?yàn)镹avMesh會(huì)避開(kāi)道路上的障礙物重新選擇路線,所以環(huán)境AI車(chē)輛的具體行駛路線會(huì)有差別。將NavMeshSurface附到道路平面,并選擇可以行駛和不可以行駛的路面,下圖中藍(lán)色的部分是車(chē)輛可以行駛的路面。

將NavMeshAgent附到環(huán)境AI車(chē)輛上,并通過(guò)在道路上埋下一系列的目標(biāo)點(diǎn),來(lái)規(guī)劃車(chē)輛行駛的大致路徑。在NavMesh下運(yùn)行的物體會(huì)在當(dāng)前位置和目標(biāo)位置之間選擇最短路徑,并且避開(kāi)障礙物,如同樣是NavMeshAgent的物體,所以相同二點(diǎn)之間的路線選擇會(huì)隨路況不同而改變。最短路徑選擇示意如下圖。

3

使用Particle System設(shè)計(jì)環(huán)境變量

Particle System粒子系統(tǒng)可以用來(lái)創(chuàng)建難以模擬的現(xiàn)象。例如:火、爆炸、雨、雪等。我們使用Particle System模擬了雨和風(fēng)二種天氣,增加了訓(xùn)練環(huán)境的復(fù)雜性。效果如下圖。

機(jī)器學(xué)習(xí)訓(xùn)練

1

訓(xùn)練模型

基于ML-Agents可以將自動(dòng)駕駛車(chē)輛攝像頭獲取道路的圖片信息,發(fā)送給Python的訓(xùn)練模型,利用圖像識(shí)別提取圖片中的參數(shù)信息。例如:前方障礙物的分類,距離以及運(yùn)動(dòng)方向的判斷,發(fā)送給PPO訓(xùn)練模型,并將模型輸出的命令發(fā)送回車(chē)輛,控制車(chē)輛在虛擬環(huán)境中行駛。

汽車(chē)沒(méi)有預(yù)編程知道如何駕駛或?qū)W習(xí)如何駕駛的步驟。事實(shí)上,除了與模擬中的軌道邊界和其它汽車(chē)碰撞對(duì)象的距離外,它并不知道整個(gè)世界是怎么樣的。它只能不斷地試錯(cuò),根據(jù)代理對(duì)隨機(jī)命令輸出的獎(jiǎng)懲總結(jié)經(jīng)驗(yàn),最終得到一個(gè)可以滿足設(shè)計(jì)需要的模型。

2

Tensorboard觀測(cè)和超參數(shù)調(diào)整

為了提取訓(xùn)練的狀態(tài)參數(shù),實(shí)時(shí)監(jiān)控訓(xùn)練的狀態(tài),方便訓(xùn)練超參數(shù)的調(diào)節(jié),我們使用了TensorBoard。TensorBoard是TensorFlow提供的一組可視化工具,可以幫助開(kāi)發(fā)者方便的理解、調(diào)試、優(yōu)化TensorFlow程序。

3

訓(xùn)練設(shè)備和過(guò)程

處理器Intel(R) Core i7-6500U @2.5GHz 2.59GHz

內(nèi)存:8.00GB(7.87 GB usable)

GPU:Inter(R) HD Graphics 520 (無(wú)GPU加速)

系統(tǒng):64-bit, in10

訓(xùn)練時(shí)間:25小時(shí)

4

成果展示

可以使用TFSharpPlugin將訓(xùn)練好的模型導(dǎo)入U(xiǎn)nity,并在在Unity中觀察訓(xùn)練的結(jié)果。訓(xùn)練完成的模型可以控制車(chē)輛在虛擬環(huán)境中比較平順的行駛,并且可以保持在車(chē)道線內(nèi),能夠應(yīng)對(duì)十字路口和前方車(chē)輛障礙的情況。

總結(jié)

我們基于ML-Agents v0.4,在Unity 2018搭建的虛擬城市環(huán)境中訓(xùn)練了一輛自動(dòng)駕駛車(chē)輛。Unity自帶傳感器,而且考慮到場(chǎng)景中所有物體的狀態(tài),例如:分類、尺寸、速度等都是可以提取的,所以在Unity場(chǎng)景中訓(xùn)練模型可以節(jié)省大量的人工標(biāo)記圖片的工作,經(jīng)濟(jì)性較好。

我們?cè)谝院罂梢允褂肕L-Agents的模仿學(xué)習(xí),加速訓(xùn)練過(guò)程。當(dāng)然還要進(jìn)一步完善城市環(huán)境和訓(xùn)練模型,提高環(huán)境的真實(shí)度和模型訓(xùn)練的質(zhì)量。更重要的是,引入車(chē)輛的動(dòng)力學(xué)模型,進(jìn)行聯(lián)合仿真訓(xùn)練,訓(xùn)練一個(gè)真正可以應(yīng)用于實(shí)際自動(dòng)駕駛車(chē)輛的控制模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4771

    瀏覽量

    100777
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30898

    瀏覽量

    269130
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13816

    瀏覽量

    166470
  • Unity
    +關(guān)注

    關(guān)注

    1

    文章

    127

    瀏覽量

    21830

原文標(biāo)題:使用Unity機(jī)器學(xué)習(xí)代理工具M(jìn)L-Agents進(jìn)行自動(dòng)駕駛訓(xùn)練

文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車(chē)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【話題】特斯拉首起自動(dòng)駕駛致命車(chē)禍,自動(dòng)駕駛的冬天來(lái)了?

    自動(dòng)駕駛致死的車(chē)禍。該車(chē)禍?zhǔn)墙衲?月7日美國(guó)弗羅里達(dá)洲位名叫Joshua Brown的40歲大哥開(kāi)著一輛自動(dòng)駕駛模式行駛的Model S
    發(fā)表于 07-05 11:14

    [科普] 谷歌自動(dòng)駕駛汽車(chē)發(fā)展簡(jiǎn)史,都來(lái)了解下吧!

    在內(nèi)的多名高管今年初成立了自動(dòng)駕駛卡車(chē)創(chuàng)業(yè)公司。  9月份谷歌一輛自動(dòng)駕駛汽車(chē)與其他車(chē)輛相撞,司機(jī)受傷住院。
    發(fā)表于 10-25 11:08

    【威雅利 汽車(chē)】蘋(píng)果最新專利曝光,要把VR和AR帶進(jìn)自動(dòng)駕駛汽車(chē)

    負(fù)責(zé),乘客可以把真實(shí)環(huán)境替換成不同城市的街景,讓旅程變得更加有趣。3年前,有報(bào)道稱蘋(píng)果正在開(kāi)發(fā)代號(hào)為Project Titan的自動(dòng)駕駛汽車(chē),隨后也有多名高管隱約證實(shí)了這
    發(fā)表于 04-24 17:05

    UWB主動(dòng)定位系統(tǒng)自動(dòng)駕駛的應(yīng)用實(shí)踐

    3萬(wàn)美元以上,相當(dāng)于一輛中級(jí)車(chē)的價(jià)格。自動(dòng)駕駛四大核心技術(shù)分別為環(huán)境感知、高精度定位、路徑規(guī)劃、控制執(zhí)行。其中環(huán)境感知技術(shù)是最基礎(chǔ)、最重要的
    發(fā)表于 12-14 17:30

    自動(dòng)駕駛汽車(chē)時(shí)代:天線測(cè)量與模擬比任何時(shí)候都來(lái)得關(guān)鍵

    的其他車(chē)輛、行人或基礎(chǔ)設(shè)施進(jìn)行互動(dòng)。V2X技術(shù)測(cè)試可以根據(jù)不同的參數(shù)進(jìn)行模擬,例如不同的路面(柏油路、土路、濕滑路面、結(jié)冰路面、干燥路面)或國(guó)家、城市區(qū)域(市區(qū)、鄉(xiāng)鎮(zhèn))。舉例來(lái)講,
    發(fā)表于 01-08 10:53

    【PYNQ-Z2試用體驗(yàn)】基于PYNQ的神經(jīng)網(wǎng)絡(luò)自動(dòng)駕駛小車(chē) - 項(xiàng)目規(guī)劃

    ,訓(xùn)練并測(cè)試神經(jīng)網(wǎng)絡(luò);5. 軟硬件聯(lián)合調(diào)試。 準(zhǔn)備好手邊的開(kāi)發(fā)板和開(kāi)發(fā)環(huán)境,從下篇帖子開(kāi)始,跟我動(dòng)手制作一輛屬于自己的自動(dòng)駕駛小車(chē)吧!`
    發(fā)表于 03-02 23:10

    自動(dòng)駕駛零排放汽車(chē)讓世界更加綠色

    速度的城市環(huán)境。近期舉辦的巴黎車(chē)展上,行業(yè)專家們也宣稱,自動(dòng)駕駛車(chē)輛的安全性更高,并可以大幅降低交通事故數(shù)量,減少人員傷亡。到2020年
    發(fā)表于 03-11 06:45

    車(chē)聯(lián)網(wǎng)對(duì)自動(dòng)駕駛的影響

    技能的自動(dòng)駕駛汽車(chē),可以通過(guò)對(duì)上海市所有車(chē)主的上下班時(shí)間收集,通過(guò)導(dǎo)航來(lái)統(tǒng)籌規(guī)劃每輛車(chē)合適的出發(fā)時(shí)間,行駛路徑,從而達(dá)到交通效率的最優(yōu)解。再或者人類駕駛員無(wú)法看到的視野盲區(qū),突然有一輛車(chē)竄出來(lái),不僅人類
    發(fā)表于 03-19 06:20

    為何自動(dòng)駕駛需要5G?

    嗎?由于易受雨、雪、霧、強(qiáng)光等環(huán)境影響,攝像頭能始終準(zhǔn)確識(shí)別指示牌和紅綠燈嗎?再舉個(gè)例子。當(dāng)自動(dòng)駕駛高速路上以130公里/小時(shí)行駛時(shí),攝像機(jī)/雷達(dá)融合無(wú)法安全地檢測(cè)到前方超過(guò)120
    發(fā)表于 06-08 07:00

    轉(zhuǎn)發(fā):聊聊邊緣計(jì)算在自動(dòng)駕駛的應(yīng)用場(chǎng)景

    了全世界第一輛真正意義上的自動(dòng)駕駛車(chē)輛,該車(chē)輛利用激光雷達(dá)、計(jì)算機(jī)視覺(jué)及自動(dòng)控制技術(shù)完成對(duì)周邊環(huán)境
    發(fā)表于 07-21 14:12

    如何保證自動(dòng)駕駛的安全?

    自動(dòng)駕駛技術(shù)為人們勾勒出了副美好的未來(lái)出行的畫(huà)面:坐上沒(méi)有方向盤(pán)的汽車(chē),覺(jué)睡到公司門(mén)口;甚至我們可能不再擁有一輛汽車(chē),需要出門(mén)時(shí)共享自動(dòng)駕駛
    發(fā)表于 10-22 07:45

    UWB定位可以用在自動(dòng)駕駛

    的技術(shù)可以實(shí)現(xiàn)真正意義上的自動(dòng)駕駛,目前來(lái)看成本還是非常高的。若干車(chē)企宣布了2020-2021年左右實(shí)現(xiàn)L3自動(dòng)駕駛車(chē)輛量產(chǎn)計(jì)劃,從目前來(lái)看,整套自動(dòng)駕駛系統(tǒng)最便宜也要3萬(wàn)美元以上,相
    發(fā)表于 11-18 14:15

    網(wǎng)聯(lián)化自動(dòng)駕駛的含義及發(fā)展方向

    、其他車(chē)輛等的感知信息進(jìn)行共享,通信技術(shù)可以幫助自動(dòng)駕駛車(chē)輛獲得全方位的道路交通信息,做出最有利的行駛規(guī)劃和決策,降低車(chē)輛行駛能耗,這一點(diǎn)在車(chē)輛
    發(fā)表于 01-12 15:42

    自動(dòng)駕駛車(chē)輛AI面臨的挑戰(zhàn)

    自動(dòng)駕駛車(chē)輛采用的AI算法自動(dòng)駕駛車(chē)輛AI面臨的挑戰(zhàn)
    發(fā)表于 02-22 06:39

    如何開(kāi)發(fā)Arm博士的Boss戰(zhàn)演示功能的

    Arm 上的 Windows 11 上運(yùn)行的代理訓(xùn)練ML-Agents 進(jìn)行一對(duì)一的戰(zhàn)斗UnityML-Agents 允許游戲開(kāi)發(fā)人
    發(fā)表于 08-15 15:49