用4級(jí)或5級(jí)來(lái)定義自動(dòng)駕駛很難有一個(gè)明確的標(biāo)準(zhǔn),自動(dòng)駕駛也不應(yīng)該搞得很復(fù)雜。自動(dòng)駕駛實(shí)際包含三個(gè)問(wèn)題:一是我在哪?二是我要去哪?三是如何去?能完整解決這三個(gè)問(wèn)題就是真正的自動(dòng)駕駛。所以特斯拉升級(jí)后的8000美元的Autopilot 2.0只有部分線控功能,不能算真正的自動(dòng)駕駛。福特、百度和谷歌這些公司做的才是真正的自動(dòng)駕駛,遠(yuǎn)在特斯拉之上,兩者云泥之差,天壤之別。
第一個(gè)問(wèn)題是定位,自動(dòng)駕駛需要的是厘米級(jí)定位。
第二個(gè)問(wèn)題是路徑規(guī)劃,自動(dòng)駕駛的路徑規(guī)劃第一層是點(diǎn)到點(diǎn)的非時(shí)間相關(guān)性拓?fù)渎窂揭?guī)劃;第二層是實(shí)時(shí)的毫秒級(jí)避障規(guī)劃;第三層是將規(guī)劃分解為縱向(加速度)和橫向(角速度)規(guī)劃。
第三個(gè)問(wèn)題是車輛執(zhí)行機(jī)構(gòu)執(zhí)行縱向和橫向規(guī)劃,也就是線控系統(tǒng)。
目前自動(dòng)駕駛的技術(shù)基本上都源自機(jī)器人,自動(dòng)駕駛可以看做是輪式機(jī)器人加一個(gè)舒適的沙發(fā)。機(jī)器人系統(tǒng)中定位和路徑規(guī)劃是一個(gè)問(wèn)題,沒(méi)有定位,就無(wú)法規(guī)劃路徑。厘米級(jí)實(shí)時(shí)定位是目前自動(dòng)駕駛最大的挑戰(zhàn)之一。
對(duì)機(jī)器人系統(tǒng)來(lái)說(shuō),定位主要靠SLAM與先驗(yàn)地圖(Prior Map)的交叉對(duì)比。SLAM是Simultaneous Localization and Mapping的縮寫,意為“同時(shí)定位與建圖”。它是指運(yùn)動(dòng)物體根據(jù)傳感器的信息,一邊計(jì)算自身位置,一邊構(gòu)建環(huán)境地圖的過(guò)程。
目前,SLAM的應(yīng)用領(lǐng)域主要有機(jī)器人、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)。其用途包括傳感器自身的定位,以及后續(xù)的路徑規(guī)劃、場(chǎng)景理解。
隨著傳感器種類和安裝方式的不同,SLAM的實(shí)現(xiàn)方式和難度會(huì)有很大差異。按傳感器來(lái)分,SLAM主要分為激光、視覺(jué)兩大類。其中,激光SLAM研究較早,理論和工程均比較成熟。視覺(jué)方案目前(2016)尚處于實(shí)驗(yàn)室研究階段, 應(yīng)用于室內(nèi)且低速的商業(yè)化產(chǎn)品都沒(méi)用出現(xiàn),更何況遠(yuǎn)比室內(nèi)室內(nèi)復(fù)雜的高速運(yùn)動(dòng)室外環(huán)境。單從這點(diǎn)來(lái)說(shuō),激光雷達(dá)是自動(dòng)駕駛必備的傳感器。
SLAM研究自1988年提出以來(lái),已經(jīng)過(guò)了近三十年。早期SLAM研究側(cè)重于使用濾波器理論。21世紀(jì)之后,學(xué)者們開始借鑒SfM(Structure from Motion)中的方式,以優(yōu)化理論為基礎(chǔ)求解SLAM問(wèn)題。這種方式取得了一定的成就,并且在視覺(jué)SLAM領(lǐng)域中取得了主導(dǎo)地位。 人們有時(shí)候會(huì)混淆SLAM和視覺(jué)里程計(jì)的概念。應(yīng)該說(shuō),視覺(jué)里程計(jì)是視覺(jué)SLAM的一個(gè)模塊,其目的在于增量式地估計(jì)相機(jī)運(yùn)動(dòng)。然而,完整的SLAM還包括添加回環(huán)檢測(cè)和全局優(yōu)化,以獲得精確的、全局一致的地圖。
目前開源的視覺(jué)傳感器SLAM算法主要分三大類,稀疏法,又稱特征點(diǎn)法。稠密法,主要是RGB-D。半稠密法,單目和雙目用的多,是目前最火熱的領(lǐng)域。激光SLAM主要方法有Hector、Gmapping、Tiny。
機(jī)器人定位常見三大類,相對(duì)定位,絕對(duì)定位和組合定位。自動(dòng)駕駛一般用組合定位,首先本體感受傳感器如里程計(jì)(Odometry)、陀螺儀(Gyroscopes)等,通過(guò)給定初始位姿,來(lái)測(cè)量相對(duì)于機(jī)器人初始位姿的距離和方向來(lái)確定當(dāng)前機(jī)器人的位姿,也叫做航跡推測(cè)。然后用激光雷達(dá)或視覺(jué)感知環(huán)境,用主動(dòng)或被動(dòng)標(biāo)識(shí)、地圖匹配、GPS、或?qū)Ш叫艠?biāo)進(jìn)行定位。位置的計(jì)算方法包括有三角測(cè)量法、三邊測(cè)量法和模型匹配算法等。從這個(gè)角度而言,IMU也是自動(dòng)駕駛必備的部件。
同時(shí),機(jī)器人的自主定位實(shí)際上是個(gè)概率問(wèn)題,因此機(jī)器人定位算法也出現(xiàn)兩大流派,一類是卡爾曼濾波器,一類是貝葉斯推理。卡爾曼濾波器有Extended Kalman Filter(EKF),Kalman Filter (KF),Unscented Kalman Filter (UKF)定位方法。另一類是基于貝葉斯推理的定位方法。運(yùn)用柵格和粒子來(lái)描述機(jī)器人位置空間,并遞推計(jì)算在狀態(tài)空間上的概率分布,比如Markov Localization (MKV),Monte Carlo Localization (MCL)定位方法。
在地圖匹配上,必須有一幅Prior Map與之對(duì)比。這幅地圖不一定是厘米級(jí)高精度地圖。這就需要說(shuō)說(shuō)地圖了,地圖可以分為四大類,分別是Metric、Topologic、Sensor、Semantic。我們最常見的地圖是語(yǔ)義級(jí)地圖,無(wú)人駕駛不是導(dǎo)彈,一般輸入目的地應(yīng)該是語(yǔ)義級(jí)的,畢竟人類的交通模式還是語(yǔ)義級(jí)的,而非地理坐標(biāo)。這也是機(jī)器人和無(wú)人駕駛的區(qū)別之一,機(jī)器人一般不考慮語(yǔ)義級(jí)意義,它只需要知道自己在坐標(biāo)體系中的位置。
GPS提供的則是全球坐標(biāo)系的Metric。將來(lái)的V2X會(huì)提供也會(huì)提供一幅雷達(dá)和視覺(jué)探測(cè)距離之外(NLOS)的特定物體(移動(dòng)的行人和車)的地圖,或者可以叫V2X地圖。目前國(guó)內(nèi)研究階段的無(wú)人車大都是用GPS RTK定位,GPS RTK必須配合厘米級(jí)高精度地圖才能得到語(yǔ)義信息,所以是不可能真正無(wú)人駕駛的。
目前定位的方法主要由五種,一是用激光雷達(dá)的SLAM,二是用激光雷達(dá)的強(qiáng)度掃描圖像,三是用合成圖像,四是用高斯混合地圖,最后一種是Mobileye提出的REM。
第一種,激光雷達(dá)的SLAM,利用車輛自帶的GPS和IMU做出大概位置判斷,然后用預(yù)先準(zhǔn)備好的高精度地圖(Prior Map)與激光雷達(dá)SLAM云點(diǎn)圖像與之對(duì)比,或者說(shuō)Registration,放在一個(gè)坐標(biāo)系內(nèi)做配準(zhǔn)。配對(duì)(Matching)成功后確認(rèn)自車位置。這是目前最成熟,準(zhǔn)確度最高的方法。
激光雷達(dá)的SLAM
第二種,利用激光雷達(dá)的強(qiáng)度掃描圖像。激光雷達(dá)有兩種最基本的成像方式,一是3D距離成像,可以近似地理解為點(diǎn)云;二是強(qiáng)度掃描成像,激光經(jīng)物體反射,根據(jù)反射強(qiáng)度值的不同,可以得到一副強(qiáng)度成像圖像。強(qiáng)度值是包括在點(diǎn)云里的,光強(qiáng)分離核心技術(shù)之一。這種定位方法需要預(yù)先制作一個(gè)特殊的SLAM系統(tǒng),稱之為位姿圖像SLAM(Pose-GraphSLAM),勉強(qiáng)可看作激光雷達(dá)制造的高清地圖。
有三個(gè)約束因素(Constraints),一是掃描匹配約束(Z),二是里程計(jì)約束(Odometry Constraints,U),GPS先驗(yàn)約束(PriorConstraints)。激光雷達(dá)的3D云點(diǎn)地圖抽出強(qiáng)度值和真實(shí)地面(Ground Plane),轉(zhuǎn)化為2D的地面強(qiáng)度掃描圖像。與位姿圖像SLAM配對(duì)后即可定位。
第三種也有稱之為圖像增強(qiáng)型定位,通常是將Lidar和視覺(jué)系統(tǒng)結(jié)合進(jìn)行定位,用單目即可。這種方法需要預(yù)先準(zhǔn)備一幅激光雷達(dá)制造的3D地圖,用Ground-Plane Sufficient得到一個(gè)2D的純地面模型地圖,用OpenGL將單目視覺(jué)圖像與這個(gè)2D的純地面模型地圖經(jīng)過(guò)坐標(biāo)變換, 用歸一化互信息(normalized mutual information)配準(zhǔn)。然后用擴(kuò)展卡爾曼濾波器(EKF)來(lái)實(shí)現(xiàn)定位。
第四種是高斯混合模型,這實(shí)際還是第二種方法的補(bǔ)充,在遇到惡劣環(huán)境,比如很厚的積雪,雪后還有殘雪的泥濘的道路,缺乏紋理的老舊的被破壞的道路,用高斯混合模型來(lái)做定位,提高激光雷達(dá)定位的魯棒性。
高斯混合模型
前面四種都離不開激光雷達(dá),成本頗高,但是室內(nèi)VSLAM又未達(dá)到實(shí)用地步,更不要說(shuō)室外定位了。因此Mobileye提出一種無(wú)需SLAM的定位方法。這就是REM。雖然REM不用視覺(jué)SLAM,但顯然只是視覺(jué)SLAM的變種而已,Mobileye 通過(guò)采集包括交通信號(hào)、方向指示牌、長(zhǎng)方形指示牌、路燈及反光標(biāo)等「地標(biāo)」,得到一個(gè)簡(jiǎn)單的 3D 坐標(biāo)數(shù)據(jù);再通過(guò)識(shí)別車道線信息,路沿,隔離帶等獲取豐富的 1D 數(shù)據(jù)。把簡(jiǎn)單的 3D 數(shù)據(jù)和豐富的 1D 的數(shù)據(jù)加起來(lái),大小也不過(guò)是 10Kb/km,攝像頭的圖像與這種REM地圖中匹配即可定位。Mobileye這種設(shè)計(jì)毫無(wú)疑問(wèn)是成本最低的,但前提是至少有上千萬(wàn)輛車配備REM系統(tǒng),能夠自動(dòng)搜集數(shù)據(jù)并上傳到云端,有些路段或者說(shuō)非道路地區(qū),沒(méi)有裝載REM系統(tǒng)的車走過(guò),就無(wú)法定位。在全球范圍內(nèi)讓裝載REM系統(tǒng)的車走遍每一寸土地是不可能的。這可能牽涉到隱私問(wèn)題,也牽涉到數(shù)據(jù)版權(quán)問(wèn)題,這些數(shù)據(jù)的版權(quán)究竟歸誰(shuí),是車主還是車企還是云端的服務(wù)商,還是Mobileye?這問(wèn)題很難說(shuō)清。同時(shí)REM的數(shù)據(jù)要及時(shí)更新,幾乎要做到準(zhǔn)實(shí)時(shí)狀態(tài),同時(shí)光線對(duì)數(shù)據(jù)影響明顯,REM要濾除那些不合適的數(shù)據(jù),所以維持這份地圖的有效性需要非常龐大的數(shù)據(jù)量和運(yùn)算量,誰(shuí)來(lái)維護(hù)這個(gè)龐大的運(yùn)算體系?還有最致命的一點(diǎn),REM是基于視覺(jué)的,只能在天氣晴好,光線變化幅度小的情況下使用,這大大限制了其實(shí)用范圍,而激光雷達(dá)可滿足95%的路況。
厘米級(jí)定位是無(wú)人駕駛的難點(diǎn)之一,不光是車輛本身的語(yǔ)義級(jí)定位,還有一個(gè)絕對(duì)坐標(biāo)定位,目前GPS定位,城區(qū)的最高精度大約10米,郊區(qū)大約5米。GPS RTK只能在小范圍應(yīng)用,覆蓋面有限,系統(tǒng)帶寬更有限,跑幾輛車湊合,上百輛系統(tǒng)可能就崩潰了。北斗地基系統(tǒng)主要做軍用,系統(tǒng)帶寬和刷新頻率有限,無(wú)法做大規(guī)模商用和車用。日本的準(zhǔn)天頂衛(wèi)星只能覆蓋中國(guó)東部少數(shù)地區(qū),并且也不是長(zhǎng)久之計(jì)。
當(dāng)然,將來(lái)無(wú)人車的定位很難擺脫厘米級(jí)地圖,但是這只是車輛啟動(dòng)前的第一次定位,車輛啟動(dòng)后,利用車載激光雷達(dá)的SLAM和障礙物識(shí)別完全可以取代高精度地圖做自主導(dǎo)航。所以未來(lái),高精度地圖的主要作用是定位而非導(dǎo)航,也無(wú)需車載,放在云端即可。
-
谷歌
+關(guān)注
關(guān)注
27文章
6172瀏覽量
105628 -
百度
+關(guān)注
關(guān)注
9文章
2272瀏覽量
90488 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13867瀏覽量
166597
原文標(biāo)題:自動(dòng)駕駛的核心技術(shù)是什么?
文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論