此文所討論的是指汽車的自動駕駛,不是飛機,也不是輪船。
在英文中我們它會叫做Autonomous Driving,強調(diào)了車具有了自主意識,有自我決策能力甚至可以完全的無人駕駛,也稱為Self-Driving , Driverless 或 Fully Automated Driving ,注意這些不同于Automated Driving,后者還停留在被動性的,沒有自我決策的能力,我們常說的高級輔助駕駛(ADAS-Advanced Driving Assistant System)大約可歸于此。
有不少機構(gòu)對自動駕駛作過等級的劃分,但目前最主流的當屬SAE(Society of Automotive Engineers)的定義。目前最新版是201806的,參考如下鏈接:
SAE J3016_201806
根據(jù)系統(tǒng)參與駕駛的比重,失效時如何響應(yīng),以及它的設(shè)計運行范圍。它把自動駕駛的級別分成了5級,如下圖:
DDT Dynamic driving task 動態(tài)駕駛?cè)蝿?wù),指汽車在道路上行駛所需的所有實時控制操作,主要是一些決策控制類的行為,不包括行程安排、目的地和途徑地的選擇等戰(zhàn)略上的功能。
OEDR Object and event detection and response 是對車輛周邊環(huán)境監(jiān)控和響應(yīng)的意思,是感知和判斷,可以通過對物體和事件檢測、認知歸類和并作出后續(xù)響應(yīng)。
DDT Fallback 動態(tài)駕駛?cè)蝿?wù)支援,比如系統(tǒng)性的失效或者路況過于復(fù)雜超出了系統(tǒng)的判斷決策能力時,如何進行支援??梢钥闯鲈贚evel 2水平時要完全由司機來處理,到了Level 3時系統(tǒng)就有了一定的自主決策能力了。
ODD Operational Design Domain 是設(shè)計運行域的意思,指自動駕駛系統(tǒng)被設(shè)計的起作用的條件及適用范圍,比如行駛區(qū)域范圍,道路情況(直路、彎路的半徑)、車速等,以確保系統(tǒng)的能力在安全的環(huán)境之內(nèi)。
結(jié)合下圖,對五個等級進一步解釋:
Level 1
具有一定的駕駛輔助功能,它在橫向或者縱向控制上二選一,比如加減速或者轉(zhuǎn)向的控制,高速公路上具有定速巡航,車道保持功能的車處于這個級別。但所有的駕駛的操作和決策都還是由人完成。
Level 2
可以同時支持橫向和縱向的控制,但駕駛員仍然需要實時監(jiān)控環(huán)境,手要時刻放在方向盤上,同時要保證出問題時隨時進行接管。此時系統(tǒng)也還不具備決策能力,比如特斯拉的自動駕駛就處于這個級別,目前頂多也只能算是2.5級,如當它要變道時,你要打轉(zhuǎn)向燈告訴系統(tǒng),系統(tǒng)才能啟動變道的功能。
Level 3
它與L2最大的區(qū)別是系統(tǒng)具備了一定的自我決策能力,它能在某些情況下實現(xiàn)完全的自動駕駛,但是駕駛員仍要隨時準備應(yīng)對接管車輛,不同的是系統(tǒng)會在失效前給司機提示和預(yù)留一定的時間,比如當出現(xiàn)復(fù)雜環(huán)境系統(tǒng)無法響應(yīng)時,它會做出反饋,可以預(yù)留十幾秒或者更長的時間等人來接管控制權(quán),并保證在這個時間內(nèi)不出問題。要注意領(lǐng)航和巡航是有很大差距的,L1、 L2只能實現(xiàn)巡航功能,就是跟著別的車后面走,到L3級別是可以實現(xiàn)領(lǐng)航了,就有了自主決策的能力,這個的技術(shù)難度和復(fù)雜度會增加很多。
2018年奧迪A8就達到了這個級別,它們稱為Audi AI 交通擁堵自動駕駛系統(tǒng)TJP(Traffic Jam Pilot)在交通擁堵的路段可以啟動自動駕駛功能,駕駛員就可以完全不用管了,這個還是比較實用的,但在中國由于政策法規(guī)限制,這個功能現(xiàn)在無法用的,比如我們規(guī)定你的手不能長時離開方向盤。因為Level 3時仍需要一個駕駛員,并且要根據(jù)系統(tǒng)提示接管對車輛的控制,但車在路況好的時候人長時間不用關(guān)注車的駕駛,所以司機更容易走神,此時忽然遇到一個復(fù)雜情況系統(tǒng)無法處理,而駕駛員此時可能也無法回過神來。所以有些公司或機構(gòu)在調(diào)研后認為這個級別更不安全不靠譜,直接忽略此級別,直接上更高級別,比如Google的Waymo。而傳統(tǒng)的OEM和一級供應(yīng)商可能會一個級別一個級別的去實現(xiàn),不會采用相對激進的方式,也可能因為市場策略不同。
Level 4
在這個級別已經(jīng)完全不需要人來參與了,但它是有限制的完全自動駕駛,比如在某個園區(qū)或者公園的內(nèi)行駛,另外對速度等也有可能一定要求。百度和金龍客車合作的自動駕駛巴士“阿波龍”就屬于這個級別,并且在車內(nèi)你看不到駕駛位,并且沒有了方向盤。它今年在很多地方都在試運營,這個已然不是PPT,是實實在在的產(chǎn)品了。
Level 5
這個級別是無限制的自動駕駛,可以理解為在一個城市內(nèi),或者城市間,在任何的復(fù)雜交通場景中,自動系統(tǒng)都能夠勝任。這個級別是非常難以實現(xiàn)的。
自動駕駛的技術(shù)
自動駕駛是一個知識密集且科技含量很高的技術(shù),不基于點什么很難把它講的相對清楚。做自動駕駛的公司也很多,而對于學(xué)習研究,百度的Apollo開源平臺是一個很好的選擇,我就根據(jù)這個平臺,結(jié)合個人理解粗略地講下自動駕駛所需技術(shù)。
無論詩和遠方或是閑晃總會有一個目的,為了體驗駕駛樂趣的閑晃這里不討論,對自動駕駛而言,首先需要一個目的地。先告訴汽車讓它知道要去哪里,定位出自己在哪里,然后再解決如何去,如果這些都是由汽車自動完成,就實現(xiàn)了高級別的自動駕駛。
如下圖可以很好地解釋自動駕駛的內(nèi)涵:
據(jù)此我們可大體猜測下要用到的技術(shù):
定位和規(guī)劃
要知道自己在哪兒,要有定位系統(tǒng),就要用到GPS, 對于要厘米級的定位需要RTK技術(shù),要用到IMU來互補GPS更新頻率慢的問題,還需要用到激光雷達點云匹配定位以解決長時間沒有GPS信號的問題,如能過山谷或隧道。我們所說的在哪是汽車要實時知道自己在高精度地圖的坐標,在這個前提下,再有了目的地就可以實時路徑規(guī)劃給出車輛行進的大方向。
感知和預(yù)測
在行進的過程中,車輛要實時感知Perception周圍的環(huán)境,并實時預(yù)測Prediction下一步如何動作,且有各種突發(fā)狀況,這一部分可能是整個自動駕駛技術(shù)里最難的。要對目標進行Detection Classification,要Tracking,還涉及到傳感器的融合Fusions,需要用到各種技術(shù)如CNNs,Machine Learning等等。所需運算量相當大,所有自動駕駛的CPU的運算性能要求特別高,要用到GPU最好是AI芯片。
此處要用到各種傳感器組合使用,如Camera,LiDAR,Radar等,以實現(xiàn)冗余和高可靠性,具體原因參考下圖。
這個是業(yè)界比較主流的做法。
特斯拉(Tesla)老板不信這個,堅決不用激光雷達,全球第一個自動駕駛引發(fā)死亡的案件就由此產(chǎn)生了,當時司機坐在Model S上,聽說是在看哈里·波特,我想可能是西游記,然后系統(tǒng)就把白色的卡車車箱當作了空氣當作了Nothing,全速撞了上去,司機直接和佛祖打牌去了。
控制
預(yù)測出汽車如何動作,還需要平滑的控制汽車的制動,這時又涉及到自動控制算法,對于自動駕駛車輛有個要求是能夠線控的,比如剎車,油門,轉(zhuǎn)向等都是可以計算機發(fā)命令來控制的。
至此自動駕駛所需技術(shù)定位,路徑規(guī)劃,感知,預(yù)測,控制技術(shù)就簡單介紹完。另外我們注意到還有個聯(lián)網(wǎng)功能,常說的Telematics或T-Box,目前的4G因帶寬和延時還無法滿足自動駕駛的要求,主要的功能是影音娛樂的功能,當5G普及后可能實現(xiàn)車輛協(xié)同的自動駕駛,比如超視距感知等功能。
自動駕駛的意義
安全
最主要的原因是安全,因為根據(jù)世界衛(wèi)生組織(World Health Organization)的調(diào)查統(tǒng)計數(shù)據(jù),全世界每年有超過125萬人死于車禍,而80%的原因是司機的人為因素。 人會有疲勞駕駛,注意力不集中,以及情緒問題,如路怒癥,另外還有可能酒駕,人的響應(yīng)速度也遠沒有傳感器的響應(yīng)速度快。
另外其實我們?nèi)祟惖拇竽X的進化還不是非常適應(yīng)現(xiàn)代社會形態(tài),工業(yè)社會只有兩百多年,汽車的出現(xiàn)也就一百多年的歷史,而我們?nèi)祟惔竽X底層是億萬年進化的結(jié)果,大部分的時間又是處在狩獵和農(nóng)耕時期,所以當我們看到一條蛇或者一些其它動物會產(chǎn)生本能的恐懼,而面對危險不知道多少倍的鋼鐵怪獸汽車卻無動于衷,人類大腦其實可能遠沒有進化到符合現(xiàn)代社會的要求。所以人類自己開車可能并不是最安全的選擇,或許再過幾百年后有人駕駛汽車只會出現(xiàn)在汽車博物館里,那時的人們可以會摸著方向盤踩著油門對當時居然是人類自己駕駛汽車這個危險的東西而感到不可思議。
利益
安全是很重要,但對于各大公司來講這應(yīng)當不是他們的驅(qū)動力,真正驅(qū)動他們投入巨大財力進行駕駛駕駛研發(fā)的是因為利益的追求和渴望以及對錯失這個市場的恐懼。資本都是逐利的,都在想著搶占這個很快到來的的萬億級的市場。據(jù)有研究報告顯示至2025年,自動駕駛市場規(guī)模將會達到2000億至 1.9 萬億美元。
顛覆
當然也有可能有人因為更遠大的目標比如改變世界,像喬布斯。
也有可能就是因為愛。
自動駕駛也確實可能成為一個顛覆性的技術(shù)。它可能會改變很多的行業(yè)甚至現(xiàn)在城市的格局。
自動駕駛的挑戰(zhàn)
但是自動駕駛會很順利的成為現(xiàn)實嗎,在我看來很難。我從兩個點簡單講一下:
莫拉維克悖論 (Moravec‘s paradox)
是說對于人工智能和機器人來講,人類所獨有的邏輯推理能力只需要非常少的計算能力就實現(xiàn),比如AlphGo,但是無意識的技能和對機器的控制卻需要極大的運算能力和運算量。
有機構(gòu)做過推算說,要讓完全自動駕駛窮盡所有道路場景,需要100輛車,200年 7*24小時的訓(xùn)練,但這也不一定,可能會窮盡0.99可能的場景,但當仍會有不可預(yù)測性出現(xiàn),那時計算機是束手無策的,遠沒有人類直覺應(yīng)對保險。
舉一個例子,一個人類的小孩從來沒見過貓,你只需要給他一只貓,告訴他這是“貓咪”,下一次,當他見到不管什么顏色,什么樣子的貓,他都知道這是“貓咪”。電腦不一樣,就算你給它上百萬張貓的照片,各種顏色,各種姿勢,各種角度,你拿一只貓擺在它的攝像頭面前,讓它看個一年…… 它仍然不理解貓是什么,不能準確的判斷一個東西是否是貓。比如谷歌訓(xùn)練計算機識別貓,當時Google研究人員利用一千臺電腦的1.6萬核處理器組建了一個機器學(xué)習神經(jīng)網(wǎng)絡(luò)。他們用從YouTube視頻中提取出的1000萬幅200x200縮略圖訓(xùn)練神經(jīng)網(wǎng)絡(luò)來認識什么是貓。
人只需要一雙眼睛去感知周圍,然后靠感覺和經(jīng)驗就可以把車開的很好,不像自動駕駛,要用各種傳感器的組合。人的駕駛目前才是真正的End-to-End ,直覺駕駛。
現(xiàn)在的機器學(xué)習”(machine learning),“深度學(xué)習”(deep learning),人工智能”(AI)其實跟人腦的思維方式有本質(zhì)區(qū)別。
列車難題(Trolley Problem)
假設(shè)當所有的技術(shù)難題因為一些天才般的構(gòu)架或者無數(shù)工程師的日夜努力都解決了,自動駕駛還很有可能遇見道德的審問,比如列車難題,這是一個很著名的哲學(xué)難題。
如圖中所示,當一輛有軌車行駛過來,此時他的剎車失靈了,而速度非常快,但他此時仍可以轉(zhuǎn)動方向盤,當它直行時會傷害到四個人,而轉(zhuǎn)彎的話會傷害到一個人,這列車要不要轉(zhuǎn)向呢,如果是你,你會怎么做呢?我想多數(shù)會選擇轉(zhuǎn)向殺死一個人來挽救四個人的生命。
此時我們在換個場景,假如列車無法轉(zhuǎn)向,只有直直的一條軌道,而在這之上有一個天橋,此時天橋上正好站著一個大胖子,他就站在軌道正上面,如果此時你把他推下去,可以正好卡在軌道中間讓列車停下來,犧牲了一個胖子來挽救四個人的生命,而此時你還會這樣做嗎?此時的選擇可能就困難的多了。哲學(xué)會引發(fā)我們的思考,當你開始思考一些事情時你就再也無法停下來了,它會讓我們對周圍熟悉的事物感到陌生,一切仿佛都沒有改變,但此時一切都已經(jīng)不同了。
比如看過一個真實故事,在南京市的某路段,上班高峰的時段一輛出租車在正常行駛中,突然向路邊的路墩上撞了去,一下整個車就四腳朝天。原因是出租車司機王師傅在路上駕駛中,自己突然覺得眼圈發(fā)黑,身體不適要暈厥,這時路的一側(cè)有很多早上上班的行人,王師傅來不及過多的思考,果斷的把方向盤往另一側(cè)的路邊的石墩撞去,出租車整個的就翻了過來。
當自動駕駛系統(tǒng)遇到此類問題時,它會優(yōu)先如何做了,是優(yōu)先保護車上的乘客還是外面的行人?
自動駕駛將來可能會遇到越來越多這類的問題,它如何決策如何應(yīng)對將是一個很大的難題。
可以預(yù)見自動駕駛面臨的挑戰(zhàn)遠不止這些,但無論如何都不會阻止此技術(shù)前行,因人類前行的步伐永遠不會停止,因此未來才有無限可能。
責任編輯:ct
評論
查看更多