經(jīng)典MIT的Deep Learning for Self-driving Car課程上,邀請到了Waymo首席科學(xué)家Drago Anguelov,分享題為“Taming The Long Tail of Autonomous Driving Challenges(馴服自動駕駛的長尾挑戰(zhàn))”,主要是講在現(xiàn)實(shí)世界中的Long Tail現(xiàn)象,各種異常情況該如何收集、融合、發(fā)布和測試。
知乎@黃浴總結(jié)了此課程的一些新看點(diǎn):
1. 題目是“長尾”處理;2. 可以處理道路維修場景;3. 可以識別特殊車輛(警車/救護(hù)車/消防車);4. 可以預(yù)防闖紅燈的車輛;5. 可以對馬路自行車行為軌跡預(yù)測;6. 通過NAS學(xué)習(xí)模型;7. 不完全依賴機(jī)器學(xué)習(xí),可以利用專家知識(domain knowledge);8. 不是E2E學(xué)習(xí)駕駛行為,而是Mid-2-Mid,就是最近的ChauffeurNet;9. 學(xué)習(xí)的行為預(yù)測有自適應(yīng)性,比如激進(jìn)的或者溫和禮貌的;10. 仿真不能解決所有問題,仿真系統(tǒng)需要更多的agent model,要smart。
我畢業(yè)于斯坦福大學(xué)博士學(xué)位,曾研究機(jī)器人相關(guān)領(lǐng)域?,F(xiàn)在Google帶領(lǐng)團(tuán)隊研究3D感知,以此來構(gòu)建一個全新的自動駕駛感知系統(tǒng)。
Waymo這家公司截止上個月已經(jīng)成立了十周年了(2009年成立)它起源于Google X。
2015年,我們研發(fā)的這款自動駕駛汽車進(jìn)行公路路測試驗(yàn),這是世界上第一輛成功實(shí)現(xiàn)自動駕駛的汽車。在這個案例中,坐在車?yán)锏娜耸莻€盲人,我們認(rèn)為這個項目的意義重大。所以我們不僅僅希望這臺車只是一個成功的演示案例,我們更加希望能夠?qū)崿F(xiàn)無人駕駛。
我將給你們展示一個很酷的視頻。你們看,這臺汽車真的在自己行駛在公路上。2018年,自動駕駛商業(yè)化,這臺車學(xué)習(xí)了很多司機(jī)用戶的駕駛習(xí)慣,使它自身擁有強(qiáng)大的自動駕駛能力。它也成功的在公路上自主行駛(無人駕駛狀態(tài))超過10,000,000,000公里。我們的路測實(shí)驗(yàn)幾乎涵蓋了所有的不同城市的駕駛場景,收集了很多駕駛數(shù)據(jù)。
我想解釋一下為什么今天的演講的題目是“項目的長尾問題”。因?yàn)槲覀冊谧詣玉{駛這條路上,我們還有很多問題需要處理和解決,才能使得自動駕駛更加完善。
自動駕駛系統(tǒng)要求有足夠的能力,在沒有人類司機(jī)干預(yù)的情況下,安全地處理所有的突發(fā)情況。
事實(shí)上,突發(fā)的異常情況總是發(fā)生,而且這些異常情況經(jīng)常是比較復(fù)雜且少見的,而自動駕駛就是要安全的解決這些突發(fā)的復(fù)雜且少見的情況。這就是我所說的“長尾巴情況”,它不同于在常見的場景中的自動駕駛,而這種復(fù)雜且少見的駕駛場景在自動駕駛領(lǐng)域確實(shí)非常重要。
我們來看這場景,畫面中騎自行車的人帶著一塊“停止”的標(biāo)志牌。但是我們并不知道他會停在哪里,什么時候停下。
我們再來看這個場景,有東西掉在路上了,周圍的建筑也是一個問題。
現(xiàn)實(shí)中存在很多不同的場景和不同的問題,像這個視頻中,我們的車輛聽到了其他車輛的鳴笛聲音,那么如何處理這個鳴笛的聲音,這些都需要很好的(安全的)解決掉。
那么我們是如何解決這些問題的呢?
首先是,感知。我們利用傳感器感知周圍環(huán)境,并在屏幕上顯示(可以顯示周圍的建筑、環(huán)境等等),以此重新構(gòu)建一個地圖。
感知的復(fù)雜性包括,在路上,有很多不同的物體,他們有不同的形狀、顏色、狀態(tài)。比如,有不同樣式的信號燈,路上有動物和行人,行人還會穿著不同顏色的衣服,有不同的姿勢狀態(tài)。為了清晰的觀察到這些,我們裝置了很多傳感器,來解決這個問題。
感知的復(fù)雜性還包括,很多不同的環(huán)境。比如,一天當(dāng)中不同的時間段(白天/黑夜),不同的季節(jié),不同的天氣下雨或者下雪。這些都需要識別。
感知的復(fù)雜性還包括,不同的場景配置,或者叫物體之間的關(guān)系識別。不同的搭配就有不同的物體之間的關(guān)系,比如圖片中,一個人拿著一塊巨大的板子,第二幅圖中,玻璃中有反光現(xiàn)象,第三幅圖中人騎著馬等等不同的場景和關(guān)系。
這種映射功能是一個非常復(fù)雜的功能,這是由物體、環(huán)境、場景配置共同決定的。
所以這需要我們在觀察周圍環(huán)境的基礎(chǔ)上做出預(yù)判,對周邊人和物體的下一個動作做出預(yù)判,即我們要對短時間內(nèi)發(fā)生的事情做出一個預(yù)測。
那我們?nèi)绾蝸眍A(yù)判呢?
預(yù)測的影響因素有過去的動作、高度的場景語義、物體屬性和出現(xiàn)提示。我們考慮周圍的任何事物,比如有一個自行車想要通過,那么我們需要停下或者放慢速度讓它通過,這就需要提前計劃設(shè)計,做出安全的解決方案。同時,我們也要向周圍的人和物發(fā)出信號。
學(xué)校周圍的場景,這是一個非常復(fù)雜的問題。機(jī)器學(xué)習(xí)是一個非常好的工具用以應(yīng)對復(fù)雜的情況。所以我們要學(xué)習(xí)出一個系統(tǒng),以此優(yōu)化現(xiàn)實(shí)存在的各種場景問題。
傳統(tǒng)的學(xué)習(xí)模式:用工具構(gòu)建,改造和進(jìn)化難以實(shí)現(xiàn)。
機(jī)器學(xué)習(xí):更像是一個工廠,我們僅僅需要把數(shù)據(jù)輸入進(jìn)去,就能得到正確的模型。
關(guān)于如何創(chuàng)建更智能的機(jī)器學(xué)習(xí)模型的周期如圖中所示。
因?yàn)閃aymo隸屬于Google,有用強(qiáng)大的數(shù)據(jù)中心,所以他們用TensorFlow和TPU,做出準(zhǔn)確的標(biāo)注,而且分布均勻。
數(shù)據(jù)收集:這是一個非常重要的環(huán)節(jié),這是解決“長尾巴情況”的重要因素。數(shù)據(jù)收集是激發(fā)主動學(xué)習(xí)的重要環(huán)節(jié),也是是機(jī)器學(xué)習(xí)周期運(yùn)行良好的重要基礎(chǔ)。
Google AI和DeepMind都在關(guān)注自動駕駛。機(jī)器學(xué)習(xí)自動化已經(jīng)部署好,幾乎所有的事情都接近自動化。
NAS cell是一種小網(wǎng)絡(luò),反復(fù)用作構(gòu)建神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)的高級構(gòu)件。
首先是用NAS cell進(jìn)行激光雷達(dá)分割。在這一過程中,延遲也很重要。
穩(wěn)定平衡的體系結(jié)構(gòu)本身也可以自動化,這是很靈捷并且很強(qiáng)大的。
這條藍(lán)色的線,延遲最小且分割情況最好。
解決機(jī)器學(xué)習(xí)限制問題。但是在某些情況下還是存在限制,需要我們增強(qiáng)魯棒性。
這幅圖片描述的問題是存在冗余和互補(bǔ)的傳感器和傳統(tǒng)的邏輯。
混合系統(tǒng):這是將傳統(tǒng)AI和機(jī)器學(xué)習(xí)相結(jié)合的系統(tǒng),這樣可以保證系統(tǒng)魯棒性,保證自動駕駛安全性。
隨著時間的推移,如上圖機(jī)器學(xué)習(xí)的范圍可能會擴(kuò)大,甚至完全掌控。
那么我們?nèi)绾芜M(jìn)行大規(guī)模的路測呢?
因?yàn)樘厥夂币姷漠惓G闆r很少發(fā)生,如果使用真實(shí)情況進(jìn)行路測,我們需要等待很長時間,為了解決這個問題,我們自己構(gòu)建條道路。
因?yàn)槲覀冇蠫oogle的數(shù)據(jù)支持所以這個想法是可行的,所以我們按照如下圖數(shù)據(jù)做出仿真模型。仿真出足夠多的場景供以測試。而我們?yōu)槭裁匆龀鋈绱硕嗟姆抡婺P湍??因?yàn)橛袝r會得出截然相反的結(jié)果,所以我們要加強(qiáng)系統(tǒng)的魯棒性,這就要求我們做出足夠多的仿真模型,確保系統(tǒng)的準(zhǔn)確性。
這是一種抽樣方法。
上圖正在模擬真實(shí)世界可能會發(fā)生的事情。如果想要得到準(zhǔn)確的數(shù)據(jù),我們需要模仿真實(shí)的人類在不同的情形下做出的真實(shí)舉動。
如何評價這個簡單的模型呢?
正面:容易調(diào)整關(guān)鍵參數(shù),如反應(yīng)時間,制動輪廓,橫向加速。有效再現(xiàn)避碰場景中的基本人類行為;反面:無法處理更復(fù)雜的交互行為。
但是定義它本身是一個復(fù)雜的問題,所以我們能做什么呢?那就是從實(shí)際演示中學(xué)習(xí)代理模型。
機(jī)器學(xué)習(xí)仿真的解決辦法就是構(gòu)建另一個機(jī)器學(xué)習(xí)模型。
添加排列可能會出現(xiàn)問題,這是一個眾所周知的問題。
我們使用了非常不同的體系結(jié)構(gòu)去避免碰撞,例如RNN模型。
在一條陌生的路上開著車,需要看到更多的范圍和預(yù)判更多的特殊情況,如掉頭需要處理好。
上圖是人類行為分布,可以看到這是個正態(tài)分布,所以這就是導(dǎo)致了“長尾巴情況”的根本原因。即使圖像兩端的情況很少發(fā)生,我們的測試也要涵蓋進(jìn)去所有的人類行為情況。
需要我們拓寬這個分布,或者仿真出更多的例子。
行為軌跡優(yōu)化模型:反RL用于找到創(chuàng)建所需軌跡的變量。
許多不同的方法來克服“長尾”問題。
“智能”模型對于自動化是至關(guān)重要的。通過模擬更真實(shí)人類行為是非常重要的。
因?yàn)檫€存在很多不同的場景,每天都上演著不同的事情,所以“長尾巴情況”還將會在不同的城市,不同的環(huán)境中持續(xù)下去的。
在一些好的訓(xùn)練步驟如下:對收集的數(shù)據(jù)進(jìn)行培訓(xùn);能夠在不確定或不正確的情況下進(jìn)行量化;能夠采取措施,比如向評分者提問;更好的是,通過因果分析直接自我更新。
總結(jié):Waymo 專家舉出的有人帶著停車標(biāo)志是一個有趣例子,而且對機(jī)器學(xué)習(xí)的一個非?;镜慕榻B,其中提到了AutoML模型,可以測試多達(dá)10K的不同架構(gòu)。然后采用前100個架構(gòu),在更大的模型上進(jìn)行測試。Waymo是一個混合系統(tǒng),使用ML和混合ML(傳統(tǒng)的ML編程)。隨著ML能力的增長,傳統(tǒng)場景越來越少。視頻中也提到了waymo如何測試,結(jié)構(gòu)化測試,是否有封閉的測試環(huán)境。在模擬器方面,他們認(rèn)為代理能夠模擬現(xiàn)實(shí)世界中發(fā)生的事情。不斷擴(kuò)大復(fù)雜模型,來處理長尾問題?;蛘呃脤<翌I(lǐng)域知識,換句話說混合模型或傳統(tǒng)編程。以及逆強(qiáng)化學(xué)習(xí),值得深入研究。
-
自動駕駛
+關(guān)注
關(guān)注
784文章
13864瀏覽量
166594 -
waymo
+關(guān)注
關(guān)注
2文章
312瀏覽量
24690
原文標(biāo)題:Waymo 首席科學(xué)家在MIT自動駕駛課上開講:如何解決自動駕駛的長期挑戰(zhàn)
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論