0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習算法在自動駕駛規(guī)控中的應用解讀

jf_C6sANWk1 ? 來源:阿寶1990 ? 作者:阿寶1990 ? 2022-11-16 09:57 ? 次閱讀

引言

進入文章正題之前,我們需要先簡單講清楚本文中所提到的“規(guī)控”究竟是什么。

相信凡是自動駕駛行業(yè)的人,一定都知道感知、定位、決策、規(guī)劃、控制這幾大模塊——盡管大家日常溝通時如此區(qū)分,但具體工作中如果還這么分類就有點問題了。

這里的問題出在決策上,廣義地說,決策包含預測,而預測的劃分非常尷——預測本身與感知高度相關,但預測又是決策的前置階段,只有先預測之后才能進行決策。

所有已經發(fā)生的既定事實我們可以稱之為T0+,感知就是已經發(fā)生過的既定事實。例如車輛未來應該怎么走、別人可能會怎么等都屬于未來將要發(fā)生的事情,我們可以稱之為T0-。

以T0為分水嶺劃分會有一個好處:感知環(huán)節(jié)只需關心路面上已經發(fā)生的既定事實即可,此后基于這個既定事實的任何推斷都可以直接放到決策部分。

如此分類可以將預測的結果與決策部分更加緊密地結合,從而人為“弱化”預測與感知的關系,“增強”預測與決策的關系。反映到實際工作中,這么劃分就可以更好地確定到底該預測哪些內容、如何更好地用預測的結果服務于決策。(以上內容是筆者在跟領駿科技CEO楊文利博士交流后總結的)

基于以上邏輯,自動駕駛公司內部通常都會有一個PNC組,PNC組的主要任務就是負責規(guī)控方面的工作。大家在PNC組干時間長了就會把預測、決策、規(guī)劃、控制統(tǒng)一稱呼為“規(guī)控”。

那么此“規(guī)控”,即為本文中所稱的“規(guī)控”。

接下來,我們再將“數據驅動”與“規(guī)控”結合起來講。

盡管“數據驅動”早成為自動駕駛產業(yè)的基本共識,但事實上,直到現(xiàn)在,數據驅動的深度學習算法仍主要應用在感知模塊,而在規(guī)控中應用的卻很少——目前,行業(yè)內的規(guī)控相關算法主要還是基于規(guī)則驅動。

雖然目前公開的自動駕駛規(guī)控算法相關資料大都是針對基于規(guī)則的算法的,但筆者打開招聘軟件卻經常能看到自動駕駛企業(yè)招聘規(guī)控算法工程師時會要求候選人懂深度學習算法,這在某種程度上也說明了目前很多企業(yè)也正在向混合決策算法“進軍”。

9942e472-654b-11ed-8abf-dac502259ad0.png

(圖片來源于某自動駕駛公司的招聘要求)

目前還鮮有文章完整細致地闡述過深度學習算法在自動駕駛規(guī)控中的應用情況。因此,本文將從規(guī)則的局限性與深度學習算法的潛在優(yōu)勢、為什么現(xiàn)階段深度學習算法尚不能被大規(guī)模應用于規(guī)控算法、未來的規(guī)控算法以規(guī)則為主還是以深度學習為主這三個方面來詳述。

一.規(guī)則的局限性與深度學習算法的潛在優(yōu)勢

1.基于規(guī)則的算法有局限性

目前,規(guī)控相關算法主要還是基于規(guī)則,但隨著自動駕駛等級的提升及應用場景的不斷拓展,基于規(guī)則的規(guī)控算法在實際測試中就會暴露出它的局限性。

使基于規(guī)則的規(guī)控算法暴露出短板的,主要是非確定性場景、強交互場景、強主觀場景這三個大類的corner case:

(1)非確定性場景

非確定性場景是相對于確定性場景而言的,最簡單的確定性場景就是紅燈停綠燈行、可以在白色虛線變道、不能在白色實線變道,除此類的場景則都可視為“非確定性場景”。

例如,大部分情況下車都在有車道線的道路開,但有一種情況是當前的道路是三條干道加一條輔路,而輔路與干道間只有車道線沒有綠化帶,這也就意味著輔路的車輛在任何情況下都有可能并線進入主路,這就是一個典型的非確定性場景。因為大多數司機根本不會管實線虛線,你根本不知道周邊什么時候會突然出現(xiàn)一輛車,它有多大的概率會直接變道。

因為道路中其他車輛的軌跡帶有概率,基于規(guī)則的算法很難處理。

(2)強交互場景

最典型的場景就是十字路口,多個物體在一個場景下的路線會發(fā)生交互而互相影響,所以交互的時候是有一定博弈在里面。

在非常復雜的一個道路場景里,不斷地對周圍車做預測,然后基于交互的結果去調規(guī)劃,這不是能夠用人的規(guī)則描述清楚的。

(3)強主觀場景

簡單說就是在不同路況下,人會無意識地根據環(huán)境去調節(jié)自車跟前車的距離。因為人腦中可能有一套規(guī)則在驅動,但這些規(guī)則又很抽象、不能明確,只可意會不可言傳的,例如變道的時機、在路口對其他車輛的反應等等。

有的場景下,雖然可以用規(guī)則算法來模仿車主的一些行為和駕駛風格,但人的主觀習慣很難用規(guī)則解決,即使能解決也需要大量的人力。

用基于規(guī)則的算法應對corner case,最難的是預測環(huán)節(jié)。因為,除了要預測自車軌跡外,自動駕駛車輛還需要預測“其他道路使用者”的軌跡,而道路中往往不只有一個“其他道路使用者”,他們彼此間會產生交互,所以預測他們的軌跡很難。

人類駕駛員在做預測時會通過觀察車的歷史軌跡、駕駛員的駕駛風格,根據“經驗”和“直覺”來做決策,即可以根據其他車輛是否保守來選擇自車的策略,然而,基于規(guī)則的算法很難達到和人類類似的預測效果。

此外,當車輛遇到一些corner case需要制動時,基于規(guī)則的規(guī)控系統(tǒng)很難保證曲線時刻平滑。

舉個例子,如果前方有輛車正以很低的速度行駛,此時自動駕駛系統(tǒng)下達“向右變道超車”的指令,但剛變道至一半時突然旁邊有一輛車正在向右側車道飛速超車,決策系統(tǒng)隨即取消變道決策,并重新生成一條平滑曲線讓車輛返回原來的車道中。

這里的難點在于,如何平衡好舒適性、安全、效率、動力模型的可實現(xiàn)性等元素,并保證此時生成的軌跡規(guī)劃路徑是光滑的?

依舊以上文為例,如果無法保證此時生成的路徑是平滑的,那么車輛開起來會很“硬”,行駛途中會變得很不舒適。如果駕駛員/乘客此時能看到周圍出現(xiàn)緊急情況,而系統(tǒng)及時幫他避免了事故,他就會認為系統(tǒng)很靠譜,哪怕是急剎車乘客也會認為自動駕駛系統(tǒng)“幫我避免了一次事故”。

但現(xiàn)實情況卻是,多數情況下,系統(tǒng)早就發(fā)現(xiàn)了問題并做出了決策,直接“防患于未然”。可問題在于,大多數駕駛員/乘客不會知道一次“看起來很普通”的變道在剛剛“差點釀成事故”,甚至可能都沒發(fā)現(xiàn)后方有來車。所以,如果此時規(guī)控系統(tǒng)無法生成一條光滑的曲線,駕駛員/乘客不會非但不會認為系統(tǒng)“幫我避免了一次事故”,反而會怪系統(tǒng)“太生硬”,變道“甩來甩去”的。

這類問題雖然也可以用基于規(guī)則的算法解決,但解決的過程卻非常麻煩。

除此之外,盡管從理論上講,有一些長尾場景也可以用基于規(guī)則的算法來解決,但在實際工作中,工程師很難保證這些復雜的代碼在解決問題的同時還能不占用太多計算資源。這些代碼放在離線系統(tǒng)上可以很輕松地跑起來,但上車后,車載芯片是否能支撐起這么龐大的算力消耗?解決這些問題非常考驗工程師的代碼水平和工程能力。

而且,可能有的工程師寫了幾千行代碼,他自己都忘記自己寫過什么了。規(guī)則越來越多、邏輯越來越亂,當“未來”某個時刻又新加了一個需求的時候,系統(tǒng)也將會變得難以維護。

2.深度學習算法可以在合適的場景提升系統(tǒng)的擬人性

上文說了很多規(guī)則算法的局限性,但實際上規(guī)則算法的局限性不止于此。如果把所有問題綜合來看,我們可以統(tǒng)稱為規(guī)則算法的“擬人性低”。

所謂擬人性,就是系統(tǒng)在行駛過程中像不像一個“老司機”。毫末智行的一位規(guī)控算法專家說:

“擬人化老司機的核心能力是隨機應變,而用基于規(guī)則的系統(tǒng)就得設定一大堆規(guī)則來區(qū)分場景,設定大量的環(huán)境參數和代價函數,不停地尋找最優(yōu)解,從數學上很難做到實時。”

目前,能夠上路測試的自動駕駛車輛在多數情況下更像一個“新手司機”,而“老司機”與“新手司機”最大的差別是:“老司機”的預測能力更強,并且對長尾場景隨機應變的能力更強。

兩相比較,多數“新手司機”雖然也很安全,但“新手司機”在路上開車會很“傻”,而“老司機”則可以在保證安全的前提下各種操作都會更加順滑、效率更高。這個差別叫做“假釋經驗”。

本質上,“新手司機”在路上更多依靠的是“基于駕校的教材”,決策規(guī)劃方式更像if else(規(guī)則算法),而“老司機”決策時依靠的是經驗和主觀判斷,決策規(guī)劃的方式相對抽象,更像是“深度學習算法”。

綜上,在規(guī)控環(huán)節(jié)引入深度學習算法,盡可能多地學習人類司機的經驗,自動提煉特征找規(guī)律,就可以提升規(guī)控算法的“擬人性”。

特斯拉在本屆 AI Day 上提到的數據引擎,就是將通過將數據輸入到神經網絡,提高確定性,以更好地去解決現(xiàn)實世界的預測問題。

輕舟智航規(guī)控算法負責人認為,預測(判斷其他車輛的未來軌跡)是最適合也是率先大規(guī)模應用深度學習算法的環(huán)節(jié)。他說:“輕舟智航的預測算法就使用了深度學習?!?/p>

具體到場景方面,他認為,那些高度依賴人的主觀判斷的場景,更需要用深度學習算法做指導。

小馬智行的規(guī)控算法專家稱,小馬已將AI模型可以應用在多個層次。

“比如可以用傳統(tǒng)分類AI模型(可以是深度學習,也可以是傳統(tǒng)的機器學習分類模型)來做decision making,用深度學習做軌跡生成來指導path planning,用端到端強化學習給出當前應該執(zhí)行的action來指導motion planning(最終軌跡的規(guī)劃)。”

這位專家還認為,結構化的高速場景可能更容易由傳統(tǒng)算法解決,而非結構化的城區(qū)場景則可能有更大空間發(fā)揮AI模型的優(yōu)勢。

而摯途則是高速匝道口場景的決策環(huán)節(jié)用到了強化學習算法。

領駿科技CEO楊文利博士認為,在自動駕駛的不同模塊上,深度學習算法的重要性及適用性不完全相同。

“從感知-融合-預測-決策-規(guī)劃-控制,這個流程來看,越靠前的部分,深度學習算法的效果越好?!?/p>

楊文利博士說:

“感知系統(tǒng)數據處理量大,但允許出錯,對準確率和召回率有一定容忍度(因為后續(xù)的融合和決策可以對感知糾錯),所以,深度學習方法比較合適。

“決策這部分,規(guī)則和學習各有所長,所以我們用的混合架構,用深度學習方法提升性能,用規(guī)則方法保證安全。

控制系統(tǒng)數據量小,對可靠性要求強,絕對不允許出錯,而使用深度學習算法非但不能提升性能,還有可能引入不確定性和不可靠因素,因此不適合采用深度學習算法。并且,控制這種底層技術,已經有200年歷史了,數學證明上很完美了,也沒必要再用深度學習?!?/p>

況且,在規(guī)劃算法出錯的情況下,控制算法還需要為安全兜底。在經典控制算法的PID中,控制層為了保證安全,就可以拒絕執(zhí)行規(guī)劃層發(fā)出的“錯誤指令”。例如,規(guī)劃下達指令讓車輛開到120公里/小時,但車輛本身的硬件并不能支持120公里/小時的車速,這個時候,控制算法就可以做一個校驗,直接拒絕執(zhí)行指令,保證車輛能正常行駛,不會開翻。

而控制算法要想為一切失誤兜底,就必須要用基于規(guī)則的算法來保證可靠性。

據此看,通常在提到“深度學習算法應用于規(guī)控”時,大家所說的“規(guī)控”,其實主要指預測、決策和規(guī)劃,而不包括控制。

除去解決實際技術難題外,深度學習算法還有一個不可忽視的巨大優(yōu)勢,即充分利用GPU或神經網絡專用處理器,降低CPU算力消耗。

為了實現(xiàn)某些功能,自動駕駛發(fā)展初期使用的復雜規(guī)則代碼會消耗大量CPU算力,但車載芯片的設計一般傾向于提高深度學習算力,而CPU部分的算力有限,工程師必須想方設法節(jié)省。而通過深度學習算法替換大量復雜的基于規(guī)則的算法,便可以節(jié)省不少CPU算力。

輕舟智航規(guī)控算法專家認為,城區(qū)NOA量產車上一般使用嵌入式芯片,CPU都是基于ARM架構,CPU算力資源沒法跟基于X86架構的L4 Demo車比,因此,如果要實現(xiàn)接近于L4的駕乘體驗,供應商們有必要嘗試在規(guī)控環(huán)節(jié)引入深度學習算法,把計算負載放到深度學習專用處理器上去。

二.現(xiàn)階段,深度學習算法還不能大規(guī)模應用于規(guī)控算法

既然深度學習算法聽上去這么“?!?,那為什么實踐中的規(guī)控算法仍以規(guī)則為主,而不是深度學習算法呢?

這是因為,深度學習算法同樣有不少短板,正是這些短板導致,在短期內,深度學習算法的效果還不如規(guī)則。

1.很難斷定人類司機的駕駛行為是否“值得學習”

在理想的情況下,用于訓練的數據越多,深度學習算法的效果就越好,但在某些情況下,隨著數據量的增加,算法的效果卻可能下降。這是為何?

深度學習算法首先要學習大量人類司機的駕駛行為,然后才有可能被應用于規(guī)控算法,但問題在于,不同司機的駕駛風格不一樣,同一個司機在不同情況下的駕駛風格也不完全一致,那如何確保人類司機的駕駛行為就是值得學習的良好數據?

比如說在路口里面的一些變道行為,我們在正常行駛的時候不能壓實線變道,但經常很多司機特別喜歡壓實線去變。

小馬智行的規(guī)控算法專家說:

“人類司機駕駛也有很多壞習慣,如果只是盲目追求擬人性而忽視了安全、舒適和高效這三個自動駕駛系統(tǒng)的主要優(yōu)化目標,那就本末倒置了。實際上,即便用AI模型來彌補傳統(tǒng)算法方面的不足,也應該是圍繞著這3個維度來改進的?!?/p>

因此,在許多情況下,只有預先對數據做個“清洗”,深度學習算法的效果才會好。然而,大規(guī)模的即時數據清洗,效率和質量如何保證?這是個問題。

針對這一問題,有一些公司的做法是,人為地去設定一些規(guī)則,評價司機開得好還是不好,然后把看起來不好都得過濾掉,但這便是用規(guī)則來“約束”深度學習了;并且,這種做法過于簡單粗暴,有可能是“倒洗澡水的時候連孩子一起倒掉”,把一些有用的駕駛行為數據給誤刪。

2.深度學習算法比規(guī)則更難應對需求變更

某家自動駕駛企業(yè)的算法規(guī)定,在路上行駛時與前車的安全距離應不小于五米。某一天,產品經理提出了一個新需求:在路上正常行駛時與前車的安全距離從不小于五米更改到不小于十米。

這種情況就會暴露深度學習算法的一個問題:工程師如果想根據需求更改模型,則需要對模型重新訓練,成本很高。但如果用的是基于規(guī)則的算法,此時就非常簡單,幾行代碼即可解決問題。

并且,如果出現(xiàn)事故,深度學習算法很難像規(guī)則算法那樣在最短的時間里快速排查出問題究竟出在哪兒。

3.深度學習算法的效果可能不如規(guī)則

輕舟智航規(guī)控算法專家說:

如果在各項數據基礎設施不完善的情況下就引入AI模型,AI模型的表現(xiàn)很難達到預期。

比如,通過簡單的測試標定就可以確定的ACC跟車距離,通過AI模型卻可能很難達到相同效果。其主要原因是,許多公司的數據基礎設施不完善,沒有辦法找到不同跟車場景下的多樣的數據,導致很難訓練出一個達到或者超過規(guī)則表現(xiàn)的模型。

毫末智行的規(guī)控算法專家也說:

“現(xiàn)在AI模型效果還沒有完全打敗規(guī)則,試圖擬人但效果還不夠好,因為這類認知網絡的模型架構、輸入輸出定義、,數據準備都還沒有完全做好,并沒有達到感知模型的程度,大家還在探索(但我覺得一年之內就會有重大突破)?!?/p>

4.深度學習算法仍需要規(guī)則來兜底

在車輛上路行駛的過程中,決策算法出錯其實是無法徹底避免的。因為哪怕是人在開車,再厲害的老司機也不可能保證自己的決策永遠完全正確,基于深度學習模型的決策算法也一樣。

因此,在系統(tǒng)設計時,開發(fā)者們應當考慮到“決策算法會出錯”這一可能性,并做好“接受”決策出錯這一潛在事實的“心理準備”。

對此,領駿科技采用了混合決策架構,該公司CEO楊文利博士的說法是“深度學習算法由于善于學習人類的駕駛經驗,因此主要用于提升性能,而由程序員設計的規(guī)則已進行過充分測試論證的,用來保證安全,擁有更高的優(yōu)先級。”

再往下層看,規(guī)劃層也能拒絕來自決策的“錯誤指令”。例如,輸入的障礙物速度及尺寸應該在某一個范圍之內(比如不能出現(xiàn)時速100m/s如同“起飛”的小轎車);再比如,決策層給出指令“向左換道”,但此時左邊都是車,因為此時變道則空間規(guī)劃無完全解,此時,規(guī)劃就可以直接“拒絕執(zhí)行指令”。

這里提到的拒絕來自上一環(huán)的“錯誤指令”的規(guī)劃算法,只能是基于規(guī)則的。

根據以上,我們可以看到,在那些可以使用深度學習算法的場景中,扮演“兜底”角色的規(guī)則依舊是必不可少的。

5.引入深度學習算法,意味著大量代碼需要被替換

還有一個非常考驗自動駕駛公司的問題:如果要用混合式規(guī)控算法,就必然面臨大量代碼需要被替換的問題,而這么做又必然需要“堆人”。

輕舟規(guī)控算法專家說,傳統(tǒng)基于規(guī)則的系統(tǒng)在設計的時候沒有考慮加入與深度學習相關接口,而且代碼庫經過多年發(fā)展已經相對固化,為引入深度學習而對代碼進行重構成本很高,

“但輕舟智航在2019年開始構建決策規(guī)劃算法棧時就考慮到了AI的廣泛使用,并在各個接口層面都事先考慮到了模型引入后的情況,針對性地做了架構調整”。

據一位曾在某頭部Robotaxi公司擔任規(guī)控算法負責人的資深專家說,在規(guī)控中引入深度學習后,代碼重寫的工作量非常大,因為涉及在線、離線、仿真等多個系統(tǒng)的改造。

筆者曾經在互聯(lián)網行業(yè)多次聽過用戶抱怨,為什么某某軟件的程序員面對臃腫的系統(tǒng)一直選擇打補丁而不是重構。這個例子在某種程度上與用混合式規(guī)控算法替代基于規(guī)則的規(guī)控算法時所面臨的問題相同——重構的效益很低。

你重寫了,系統(tǒng)運行水平的改進是有限的,但你卻要為此付出巨大的成本,這種“吃力不一定討好”的事情對任何一家企業(yè)都是“無法承受之重”。這一顧慮也讓自動駕駛公司對混合式規(guī)控算法內心產生“只想遠觀,不愿褻玩”的心理。

事實上,筆者在跟多家自動駕駛公司的規(guī)控算法負責人/工程師交流后發(fā)現(xiàn),不同于2014—2015年深度學習神經網絡被應用于感知時的“場面”,目前,大家普遍對深度學習算法在規(guī)控環(huán)節(jié)的應用“不著急”。

可以說,大家更多地還是以一種“可有可無”的心態(tài)來開展預研和實際應用。

更具體一點說,自動駕駛公司知道在采用規(guī)則+深度學習算法的“混合式規(guī)控算法”是未來,但目前能用到混合式規(guī)控算法的場景也不多,那干脆招幾個人“讓他們自己慢慢預研去”。

所以,現(xiàn)階段,多數自動駕駛公司對混合式規(guī)控算法的態(tài)度是:只在應對匝道、十字路口等極少數場景時采用混合式規(guī)控算法;而過去用基于規(guī)則的算法已經解決的corner case,只要沒發(fā)現(xiàn)“令人無法容忍”的問題就“不動”。

還有規(guī)控算法專家很直白地說,具體用不用混合式規(guī)控算法還得看需求,這是個工程性的問題。

根據以上邏輯,目前自動駕駛公司對混合式規(guī)控算法的態(tài)度是“可有可無”,而未來混合式規(guī)控算法的應用范圍也需要“打一個問號”。

三、規(guī)則為主or 深度學習算法為主?

我們接著上一節(jié)的邏輯繼續(xù)探討。

有不少專家都認為,無論深度學習算法、混合框架發(fā)展的多么成熟,規(guī)控算法永遠是規(guī)則代碼占多數,深度學習算法僅扮演輔助角色。

他們給出的關鍵理由是:深度學習算法具有“不可解釋性”的特點,用深度學習算法去做預測和決策,遵循的是概率,而不是嚴格意義上的因果關系,因此,讓它去承擔規(guī)控的“第一責任人”,難免讓人“不放心”。

如領駿科技CEO楊文利博士說:

“深度學習是黑箱,人理解的‘場景’和深度學習理解的‘場景’可能不一樣。之前有個diss人工智能的例子,在圖像上改幾個像素,人工智能就認錯了;在交通標記上貼幾個黑膠布,特斯拉就認不出來了。除非是像素級的‘一致’,否則人們認為的‘同一場景’,在深度學習看來,極有可能是‘不同場景’。

“深度學習算法是基于輸入輸出的擬合,從輸入輸出特性上可以獲得更好的擬人性,但其實它很難理解駕駛的內部邏輯關系?!搬槍τ蒙疃葘W習算法做決策出錯的可能性,我們采用了混合決策架構。”

某商用車無人駕駛公司CTO和某造車新勢力規(guī)控算法專家也持類似觀點。

在9月底的一場技術交流活動上,地平線CTO黃暢博士也談到了這個問題,但黃暢認為,在混合式規(guī)控算法中,深度學習將是主流,而規(guī)則僅作為“必要的輔助”——以免出現(xiàn)明顯的、在語義上都可以解釋的錯誤?!?

黃暢解釋說,根據他的經驗,對于一個已經雕琢了很多年、調得很好的一套基于規(guī)則的系統(tǒng),僅在某一個局部模塊引入深度學習,改善是非常有限的,甚至沒有改善?!耙驗槠渌哪K還是基于規(guī)則去設計,在這種大框架下,你用深度學習算法替換一個模塊,那其他模塊跟這邊個新模塊適配的成本很高。整個驗證的周期很長,長到你沒有耐心去完成。”

某Robotaxi公司規(guī)控算法負責人和輕舟規(guī)控算法專家同樣認為,未來的規(guī)控算法是以深度學習為主,規(guī)則為輔。

輕舟規(guī)控算法專家說,在輕舟智航,目前在預測環(huán)節(jié),深度學習算法相關運算(包括前處理,模型推理和后處理)占整體模塊運行時間的比例已接近95%,在決策和規(guī)劃環(huán)節(jié),深度學習算法運算占比也已達到了30%左右。

“不太容易量化,但總的算下來,在規(guī)控算法中,深度學習算法占比應該有50%-60%?!?/p>

他認為,最終,規(guī)控算法80%-90%的運算時間會花在深度學習算法上。并且,不同于楊文利博士在前面提到的“底層控制算法中沒必要用到AI”,他認為,控制算法是以規(guī)則為主,但也可以使用深度學習模型優(yōu)化控制的參數,增加算法的適應性。

他指出:

“如果說之前產業(yè)里對‘AI為主’還是‘規(guī)則為主’存在爭議,是可以理解的,但特斯拉最近一次AI DAY上公布出的信息已經顯示,特斯拉大量使用深度學習的規(guī)控算法表現(xiàn)非常亮眼,這從側面反映了馬斯克的‘第一性原理’在某種意義上也可以適用于基于深度學習的規(guī)控算法:如果人類的大腦作為一個復雜的神經網絡,能夠通過大量的經驗學會駕駛,那規(guī)控算法也可以利用深度學習去獲得更好的性能和表現(xiàn)。”

深度學習算法存在一個很大的爭議即它的“不可解釋性”,那么,如果某個場景從“未知”變成“已知”了,我們是否需要再在算法里面加一個規(guī)則把它“確定下來”?

對筆者的這一問題,某Robotaxi公司規(guī)控算法專家認為,通過規(guī)則將AI對場景辯識的不確定性確定化,“具有可行性”;但黃暢和輕舟規(guī)控算法專家則認為“不可行”“也沒必要”。

黃暢說:

“我們不能強求這個系統(tǒng)一定要‘可解釋’——因為,所謂‘可解釋’就是拿規(guī)則去約束它,甚至完全依賴規(guī)則,像專家系統(tǒng)一樣,結果就是,在A城市跑得很溜的系統(tǒng),到B城市去跑時還需要大量的工程師做調試才行;并且,它會讓那些復雜的、無法用人為規(guī)則描述的corner case‘無解’了?!?/p>

可見,強求系統(tǒng)一定要“可解釋”,這就又回到了本文第一節(jié)所提到的“規(guī)則的局限性”上了。

黃暢認為,在將深度學習算法引入規(guī)控時,我們不必過分糾結于系統(tǒng)是否“可解釋”。

“我跟你交流,我們之間,我能夠充分理解你,并能推理你的整套邏輯,但對你底層的一些直覺、一些隱藏的特質,我卻是不知道的(甚至你自己也未必知道),但這并不影響我們能建立起信任感、能順暢地交流。同理,我們也不必用是否‘可解釋’去限制去探索深度學習算法的應用邊界。

“我前段時間看了一篇帖子,說深度學習和經典的統(tǒng)計學之間的區(qū)別在于經典統(tǒng)計學依然嘗試用規(guī)則模型的方式讓整個系統(tǒng)變得‘可解釋’,但深度學習突破了這一點,它甚至非常極端去優(yōu)化最終的目標。

“人會犯錯,規(guī)則系統(tǒng)會犯錯,數據系統(tǒng)也會犯錯,但是如果在廣泛統(tǒng)計學意義上,當數據規(guī)模足夠大的時候,深度學習算法會比規(guī)則系統(tǒng)強一個數量級,因此,我們可以放心地使用它。

“在這個基礎上,把環(huán)境模型這樣的東西可視化,讓人可以理解,再在規(guī)劃的最后一個階段引入少量的必要的規(guī)則去約束深度學習算法,這樣就足夠了。”

黃暢認為,在算法2.0時代,AI有能力去完成自適應,因此,自動駕駛公司可能要設計一些“在算法之上的算法”,使得它能夠幫助基礎的算法更好地在應用場景中去迭代、去適應。

輕舟規(guī)控算法專家認為,筆者提到的“當一個場景從未知變成已知的時候,就用規(guī)則把應對方案給‘確定’下來”的設想在實踐中很難行得通,因為,現(xiàn)實中的場景往往是動態(tài)調整的——起初可能是清晰的,但變著變著,就“模糊不清”了,因而很難用規(guī)則將其描述清楚。

關于深度學習算法的“不可解釋性”,他的回應是:“有好多人會說深度學習‘不可解釋’,但其實如果你仔細地去設計你的深度學習算法,它可也以實現(xiàn)‘可解釋性’的效果,甚至,這種可解釋性可能會比規(guī)則還強?!?/p>

他舉了這樣一個例子:自動駕駛車輛在十字路口右轉彎,需要避讓直行而來的車,這個時候,很難用規(guī)則窮舉在直行車輛的車速是多少、兩車之間的距離是多少時自動駕駛系統(tǒng)應該采取什么措施,但如果是用深度學習算法,只要給出自車和潛在障礙物(直行車輛)的位置和狀態(tài),以及一些相關的環(huán)境和歷史信息,經過訓練的神經網絡能夠就能夠算出“你讓我”或“我讓你”的概率分別是多少,這跟人開車做決策的思路是一樣的。“概率,比規(guī)則更容易解釋?!?/p>

說到這里,筆者想到一個看似跟本文主題不直接相關、但又有很深的關聯(lián)的話題——什么是人的“直覺”?

之前經常看到一些做企業(yè)管理研究的人說,企業(yè)家們在重大事項決策的關鍵時刻,依賴的往往不是調研,而是直覺。很少有人能解釋清楚這個直覺究竟是什么,但筆者覺得,這個“直覺”,其實就是數據驅動的“深度學習算法”。

所謂的“直覺準”,并不是什么天分,其背后都是日積月累的信息及在此基礎上形成的認知。類似于大數據分析,結論和信息之間有相關性,但沒有因果關系,或者是因果關系不夠直接、不夠明顯,人很難用邏輯解釋清楚,便說這是“直覺”。

從這個意義上說,我們確實不必強求深度學習算法一定要“可解釋”。

不過,毫末智行的規(guī)控算法專家認為,即使上了大量AI模型做認知,那也一定是場景化的,必須有顯式的、可解釋的“意圖和意義”,“這是我們的原則”。

這位專家說:

“深度學習的強項在于可以隨機應變,各種復雜環(huán)境都能快速給出一個解,但它的黑盒特質導致有時候給的解會出錯,而基于規(guī)則的算法其實都是‘我知道我知道’以及‘我知道我不知道’,它對‘未知’的復雜場景給出一個正確解的可能性比深度學習方法要低,但‘我做不出正確答案并不影響我在看到答案之后評判它是對是錯啊’。因此,AI為做題主力,規(guī)則負責校驗是我們使用的方式。”

小馬智行的規(guī)控算法專家認為,現(xiàn)階段,深度學習算法很難保證安全,所以在,未來很長時間內都一定是傳統(tǒng)算法和深度學習相結合。

這位規(guī)控算法專家說:

“我們認為,L2很可能可以達到AI為主的狀態(tài),因為AI無需應對好所有的corner case——畢竟還有司機可以做最后的安全保證,特斯拉在AI Day上的分享也說明了這一點。

“但L4的算法在未來很長一段時間內都不太可能做到以AI為主,主要原因還是它的可解釋性和對有安全風險的corner case處理能力的問題;不過,隨著技術的進步,我們相信算法中AI的部分會越來越多。

“事實上,傳統(tǒng)規(guī)控算法絕不是規(guī)則的堆砌,好的傳統(tǒng)規(guī)控算法更多是對場景歸納總結后抽象出來的數學模型——借助不同的數學工具對規(guī)劃問題建模并通過優(yōu)化方式求解,它有能力刻畫問題的本質,從根本上保證理論范圍內的安全性。

“因此,所以引入深度學習,并不會涉及到大量的代碼重寫,更多應該是如何結合好傳統(tǒng)算法和深度學習,用傳統(tǒng)算法保證行車的安全性。可以說,傳統(tǒng)規(guī)控算法和AI模型并不是一個簡單的替代關系,算法研發(fā)也是逐步迭代的,不存在要花很大成本一下子把規(guī)則代碼替換成AI模型的需求,而是循序漸進的?!?/p>

而一位主機廠的架構師則提出這樣一個建議:在主系統(tǒng)里跑基于規(guī)則的算法,在影子模式里跑深度學習算法,等深度學習算法的訓練效果超過規(guī)則的時候,再將深度學習算法部署到主系統(tǒng)中去。

附. 兩個關于深度學習算法應用于自動駕駛規(guī)控中的案例

7月底,九章智駕在蘇州高鐵新城舉辦過一場主題為“數據驅動的規(guī)控算法”的技術沙龍,在這次沙龍上,輕舟智航和智加的專家通過簡單的例子給與會者們分享了一下深度學習算法如何應用于自動駕駛規(guī)控。我們在經過專家當事人同意后將這兩個案例分享如下——

1.智加:通過深度學習算法降低油耗

智加對數據驅動的決策的應用,也經歷了以規(guī)則為主過度到規(guī)則+數據混合決策的過程。智加科技首席科學家崔迪瀟曾說,他們認為換道時機很適合用深度學習算法來做輔助做決策。

因為干線物流對時效和油耗要求非常高,一方面不合適的換道時機會導致司機使用自動換道功能比例降低,另一方面以規(guī)則為主的換道算法偏保守,如果僅僅在前車車速過低時才觸發(fā)“換道”指令,會導致更多的后續(xù)剎車,進而帶來整個時效和油耗的損耗。為了降低油耗,自動駕駛系統(tǒng)通過收集數據來觀察司機如何做決策,再去研究更類人的換道決策。

這一方案經歷過兩個階段。

第一階段為換道決策由司機“自觸發(fā)”形式變?yōu)椤跋到y(tǒng)建議”。在這個階段,工程師會不斷去研究為什么司機在某個點會做出換道決策,進而形成換道建議的規(guī)則。在系統(tǒng)給出換道建議后,如果司機允許換道,則系統(tǒng)認為此時的決策是合適的,如果司機認為此時不應該換道,則司機可不采納換道建議。

第二階段是,工程師還會在不同場景采集人工換道的數據,并結合第一階段收集的系統(tǒng)換道決策和司機換道決策不一致場景的數據(如司機觸發(fā)換道,系統(tǒng)未觸發(fā);或系統(tǒng)觸發(fā)換道,但司機未采納)進行標注和模型訓練,得到換道決策模型,改進系統(tǒng)原本的規(guī)控算法,進一步提高節(jié)油性能。

2.輕舟智航:用深度學習算法提升系統(tǒng)的“擬人性”

據輕舟智航預測和規(guī)控專家還介紹,現(xiàn)階段,輕舟規(guī)控算法給深度學習預留了大量的接口,并積極研發(fā)深度學習規(guī)控算法。輕舟智航的整體規(guī)控算法架構的最終目標是實現(xiàn)AI First(深度學習算法優(yōu)先),讓模型做大部分行為的輸出,然后再用規(guī)則去做互補(規(guī)則主要處理安全相關的問題)。

輕舟智航認為,規(guī)控能力將是城市NOA功能差異化的重要體現(xiàn)。目前,輕舟智航已開始嘗試在城市NOA方案的規(guī)控環(huán)節(jié)盡可能多運用AI來處理,讓系統(tǒng)在多數情況下的決策“接近人”、在極端情況下的決策“超越人”。

例如,對變道時機選擇、匝道m(xù)erge時機選擇、路口博弈等在使用城市NOA會遇到的某些規(guī)劃關鍵場景,輕舟已經有專門的深度學習算法來進行處理。

為保證深度學習算法的可預見性和可控性,輕舟智航會通過對輸入和輸出設置校驗的方式,來確保輸入數據是否符合當前設計的需求。在輸入層面會使用規(guī)則的方式來選擇深度學習算法適用的場景,確保模型的輸入的合理性,限定模型運行在設計的問題范圍之內,在輸出層面也會使用規(guī)則進行輸出的校驗,保證輸出達到預設的效果。同時,如果遇到模型處理不好的場景,也可以自動記錄時間點和場景相關信息,后續(xù)通過數據閉環(huán)來更新模型,讓模型泛化能力更強,適應更多場景。

目前,在輕舟智航,通過深度學習(比如模仿學習或者強化學習)來生成自車“未來可能的軌跡”這一技術已經比較成熟,通過收集大量專家駕駛的軌跡來訓練模型,現(xiàn)在模型生成的軌跡在90%情況下都無需做后續(xù)的修飾;但在10%的情況下,深度學習生成的軌跡效果可能不好,甚至有安全風險,這時候就需要一個框架能夠去修正/修改它。輕舟使用其國內在首創(chuàng)的時空聯(lián)合算法(一種基于數值優(yōu)化的算法)對深度學習生成的軌跡進行微調。

輕舟規(guī)控算法專家說,時空聯(lián)合規(guī)劃算法相比傳統(tǒng)的橫向縱向分離更適合與深度學習算法協(xié)同使用。因為,用深度學習算法生成的軌跡本身其實就是一個時空聯(lián)合的軌跡,這個軌跡上面不僅有位置、速度、方向信息,還有時間信息。因此,時空聯(lián)合規(guī)劃算法就能較好地跟模型出來的結果結合到一起,進而能夠無縫地給深度學習算法加上安全防護。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4612

    瀏覽量

    92910
  • 自動駕駛
    +關注

    關注

    784

    文章

    13816

    瀏覽量

    166470
  • 深度學習
    +關注

    關注

    73

    文章

    5503

    瀏覽量

    121175

原文標題:萬字長文解讀深度學習算法在自動駕駛規(guī)控中的應用

文章出處:【微信號:阿寶1990,微信公眾號:阿寶1990】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Perforce SAST專家詳解:自動駕駛汽車的安全與技術挑戰(zhàn),Klocwork、Helix QAC等靜態(tài)代碼分析成必備合規(guī)性工具

    自動駕駛汽車的未來已來,你怎么看?期待還是擔憂?本文從自動駕駛技術、法律法規(guī)、合規(guī)性工具等多個角度,解讀自動駕駛汽車的安全與挑戰(zhàn),歡迎一讀!
    的頭像 發(fā)表于 11-26 13:53 ?902次閱讀
    Perforce SAST專家詳解:<b class='flag-5'>自動駕駛</b>汽車的安全與技術挑戰(zhàn),Klocwork、Helix QAC等靜態(tài)代碼分析成必備合<b class='flag-5'>規(guī)</b>性工具

    MEMS技術自動駕駛汽車的應用

    MEMS技術自動駕駛汽車的應用主要體現(xiàn)在傳感器方面,這些傳感器為自動駕駛汽車提供了關鍵的環(huán)境感知和數據采集能力。以下是對MEMS技術
    的頭像 發(fā)表于 11-20 10:19 ?356次閱讀

    NPU深度學習的應用

    設計的硬件加速器,它在深度學習的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習
    的頭像 發(fā)表于 11-14 15:17 ?591次閱讀

    Mobileye端到端自動駕駛解決方案的深度解析

    強大的技術優(yōu)勢。 Mobileye的端到端解決方案概述 1.1 什么是端到端自動駕駛? 端到端自動駕駛解決方案是一種新型的智能系統(tǒng)架構,旨在通過AI學習從感知到決策再到操作的全流程。Mobileye的端到端方案依賴于
    的頭像 發(fā)表于 10-17 09:35 ?371次閱讀
    Mobileye端到端<b class='flag-5'>自動駕駛</b>解決方案的<b class='flag-5'>深度</b>解析

    FPGA自動駕駛領域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)自動駕駛領域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術不可或缺的一部分。以下是FP
    發(fā)表于 07-29 17:11

    FPGA自動駕駛領域有哪些應用?

    是FPGA自動駕駛領域的主要應用: 一、感知算法加速 圖像處理:自動駕駛需要通過攝像頭獲取并識別道路信息和行駛環(huán)境,這涉及到大量的圖像處
    發(fā)表于 07-29 17:09

    自動駕駛識別技術有哪些

    自動駕駛的識別技術是自動駕駛系統(tǒng)的重要組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。自動駕駛識別技術主要包括多種傳感器及其融合技術,以及基于這些傳感器數據的處理和識別
    的頭像 發(fā)表于 07-23 16:16 ?664次閱讀

    深度學習算法集成電路測試的應用

    隨著半導體技術的快速發(fā)展,集成電路(IC)的復雜性和集成度不斷提高,對測試技術的要求也日益增加。深度學習算法作為一種強大的數據處理和模式識別工具,集成電路測試領域展現(xiàn)出了巨大的應用潛
    的頭像 發(fā)表于 07-15 09:48 ?1016次閱讀

    深度學習自動駕駛的關鍵技術

    隨著人工智能技術的飛速發(fā)展,自動駕駛技術作為其中的重要分支,正逐漸走向成熟。自動駕駛系統(tǒng),深度學習
    的頭像 發(fā)表于 07-01 11:40 ?768次閱讀

    初級自動駕駛架構師應該學習哪些知識

    是一個新興且不斷發(fā)展的職業(yè)。隨著技術的進步,這一領域將繼續(xù)吸引更多人才,推動自動駕駛技術的發(fā)展。 自動駕駛架構師設計和開發(fā)自動駕駛系統(tǒng)時將面臨一系列挑戰(zhàn),包括:安全關鍵的邊緣情況、領
    的頭像 發(fā)表于 06-20 21:45 ?309次閱讀

    標貝數據采集標注自動駕駛場景中落地應用實例

    AI數據服務作為人工智能和機器學習的基礎,自動駕駛領域中有著重要地位。與其他人工智能應用場景相比,自動駕駛的落地場景相對復雜,想要讓汽車本身的算法
    的頭像 發(fā)表于 05-28 14:22 ?577次閱讀
    標貝數據采集標注<b class='flag-5'>在</b><b class='flag-5'>自動駕駛</b>場景中落地應用實例

    未來已來,多傳感器融合感知是自動駕駛破局的關鍵

    方面表示,這是L4級自動駕駛公司和車企為了打造Robotaxi量產車,國內成立的首個合資公司。首款車型已完成產品定義,正在進行設計造型的聯(lián)合評審,計劃明年實現(xiàn)量產。未來已來,2024年是全球L3
    發(fā)表于 04-11 10:26

    邊緣計算與自動駕駛系統(tǒng)如何結合

    當前自動駕駛,大規(guī)模的人工智能算法模型和大規(guī)模數據集中化分析均放在云端進行。因為,云端擁有大量的計算資源,可以極短的時間內完成數據的處理,但是僅依靠云端為
    發(fā)表于 03-25 09:26 ?558次閱讀
    邊緣計算與<b class='flag-5'>自動駕駛</b>系統(tǒng)如何結合

    FPGA深度學習應用或將取代GPU

    、筆記本電腦或機架式服務器上訓練神經網絡時,這不是什么大問題。但是,許多部署深度學習模型的環(huán)境對 GPU 并不友好,比如自動駕駛汽車、工廠、機器人和許多智慧城市環(huán)境,在這些環(huán)境硬件必
    發(fā)表于 03-21 15:19

    自動駕駛發(fā)展問題及解決方案淺析

    汽車的發(fā)展提供有益的參考。 ? 自動駕駛汽車發(fā)展的現(xiàn)狀與挑戰(zhàn) (一)技術難題 自動駕駛汽車的核心在于通過先進的傳感器、算法和控制系統(tǒng)實現(xiàn)車輛的自主駕駛。然而,
    的頭像 發(fā)表于 03-14 08:38 ?1153次閱讀