在自動駕駛的感知領(lǐng)域,行業(yè)內(nèi)分成了立場鮮明的兩派——視覺派和激光雷達(dá)派。特斯拉是視覺派最堅定的守護(hù)者,甚至不惜用一切最惡毒的形容詞將激光雷達(dá)貶到一無是處。但按照埃隆·馬斯克一貫的作風(fēng),在“詛咒”某些事情的背后,他一定也在“敬畏”某些事情。
當(dāng)一個系統(tǒng)想要變得可靠,一個關(guān)鍵原則是把這個系統(tǒng)做“冗余”。因此,汽車行業(yè)里的多數(shù)人,都在為這個極度需要可靠的物件做加法。
但特斯拉恰恰相反,它不斷地在為汽車做減法:大幅降低車輛線束長度、大幅減少車身零部件數(shù)量、大幅壓縮生產(chǎn)制造工序。所有這一切都是從技術(shù)快速落地的商業(yè)化考慮——足夠便宜,用戶才能接受。
如果秉持同樣的出發(fā)點(diǎn),就不難理解埃隆·馬斯克多次在公開場合對激光雷達(dá)無下限的貶低:
2015年10月——激光雷達(dá)毫無意義,對于自動駕駛汽車來說沒有必要。
2017年4月——激光雷達(dá)很差勁,他們會拋棄激光雷達(dá),記住我的話,這是我的預(yù)測。
2018年2月——激光雷達(dá)昂貴、丑陋、沒有必要。
2019年4月——激光雷達(dá)就像人身上長了一堆闌尾,闌尾本身的存在基本是無意義的,如果長了一堆的話,那就太可笑了。任何依賴激光雷達(dá)的公司都可能無疾而終。
當(dāng)然,從事實(shí)的結(jié)果來講,馬斯克有足夠的資本藐視激光雷達(dá),因為依靠視覺方案的特斯拉是目前公認(rèn)這個星球上將量產(chǎn)輔助駕駛做到最好的公司。
但是,埃隆·馬斯克真的就將激光雷達(dá)踩在腳底了嗎?恰恰相反,他清楚地認(rèn)識到視覺與激光雷達(dá)的優(yōu)劣勢,同時不斷推動讓視覺方案做到本只能由激光雷達(dá)做到的事情。
特斯拉為何不用激光雷達(dá)?
理論上說,視覺與激光雷達(dá)是完美的互補(bǔ)體。
視覺方案中的圖像傳感器能以高幀率、高分辨率獲取周圍復(fù)雜的環(huán)境信息,且價格便宜。但圖像傳感器是一種被動式傳感器,其本身并不發(fā)光,成像質(zhì)量受到環(huán)境亮度影響較大,在惡劣環(huán)境下完成感知任務(wù)的難度會大幅提升。
激光雷達(dá)是一種主動式傳感器,通過發(fā)射脈沖激光并探測目標(biāo)的散射光特性獲取目標(biāo)的深度信息,具有精度高、范圍大、抗干擾能力強(qiáng)的特性。但是,激光雷達(dá)獲取的數(shù)據(jù)稀疏無序、難以直接利用,且激光單色的特性讓其無法獲取顏色和紋理信息。
所以,基于可靠性的考慮,行業(yè)中多數(shù)人在研究的是如何將視覺與激光雷達(dá)所獲得的信息進(jìn)行融合,實(shí)現(xiàn)更加精確的環(huán)境感知。
但在馬斯克看來,無論是汽車還是道路,都是人類為人類設(shè)計的。既然人類可以通過視覺收集信息+大腦處理信息的方式進(jìn)行安全駕駛,那就意味著自動駕駛也可以通過同樣的方式實(shí)現(xiàn)。如果強(qiáng)行加入一個激光雷達(dá)作為“超人感官”,就好比人在行走時拿著一根拐杖。
顯然,拐杖不是創(chuàng)新,而是限制創(chuàng)新。
另一方面,激光雷達(dá)的高成本,以及因為加入激光雷達(dá)后造成電氣系統(tǒng)的復(fù)雜,不符合特斯拉一貫做減法的造車?yán)砟睢?/p>
視覺的瓶頸在算法,激光雷達(dá)的瓶頸在原理。顯然,視覺具有更大的開發(fā)潛力,也擁有理論上更高的上限。做對的事情,不做容易的事情,也是一直以來馬斯克的作風(fēng)。
至于在公開場合頻繁唱衰激光雷達(dá),就權(quán)當(dāng)是特斯拉及埃隆·馬斯克出色公關(guān)水平的一種體現(xiàn)。
特斯拉如何克服視覺劣勢?
從2D平面圖像推斷精確的3D立體實(shí)景,實(shí)際上是非常困難的。
以下圖中這輛MPV為例,如果只看左側(cè)的2D圖像,似乎用視覺和激光雷達(dá)標(biāo)注的形狀都是準(zhǔn)確的,但是如果放在3D的場景中,就會發(fā)現(xiàn)使用視覺方案標(biāo)注的形狀不僅偏長、偏窄,而且缺少了汽車的側(cè)面。
因為在2D圖像中,很容易找到車輛的左前角和右后角,但是左后角卻沒有明顯的特征,由于車輛尾部的傾斜、向上收窄,就會造成對整體寬度的低估。同時,依靠發(fā)動機(jī)艙蓋超出車頂?shù)牟糠止浪丬囬L,也會導(dǎo)致在縱深方向上的高估。
而這還僅僅是一個在高亮度環(huán)境下相對規(guī)則的物體,如果環(huán)境變暗,或是加入更多的遮蔽物、障礙物,情況會變得更加極端。比如在黑暗樹蔭中的二輪車,純視覺方案很難分辨。
因此,從根本算法上解決視覺信息的準(zhǔn)確處理,就是特斯拉自動駕駛體系的絕對核心技術(shù)。
實(shí)現(xiàn)自動駕駛功能,更多的是技巧、記憶和經(jīng)驗,而不只是推理和計算,深度學(xué)習(xí)的算法就是為了提高自動駕駛的成熟程度。特斯拉完善視覺算法的一大優(yōu)勢,就是通過海量的車主駕駛數(shù)據(jù),進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,從而不斷覆蓋更多的工況與場景,達(dá)到視覺算法無限接近人類判斷的目的。
這一方面取決于特斯拉自動駕駛硬件的高算力,另一方面是特斯拉在“模式識別模型”領(lǐng)域的絕對領(lǐng)先——超大的數(shù)據(jù)規(guī)模、多樣化的數(shù)據(jù)覆蓋度、真實(shí)的數(shù)據(jù)場景。歸根到底,全世界超過百萬輛的特斯拉車主,都是特斯拉自動駕駛算法訓(xùn)練的眾測者。
這里不得不提的就是特斯拉獨(dú)有的“影子模式”,這是特斯拉在不影響算法訓(xùn)練的速度與準(zhǔn)確性的基礎(chǔ)上,大幅降低因數(shù)據(jù)量過大造成訓(xùn)練成本提升的關(guān)鍵。
藏在駕駛員背后的“影子”,始終在觀察外部環(huán)境與駕駛員的動作。如果在某個特定場景中駕駛員的操作與“影子”預(yù)想的一致,那么數(shù)據(jù)不會被上報;如果“影子”發(fā)現(xiàn)它的判斷與駕駛員操作不相符,那么這次的數(shù)據(jù)就會被送到特斯拉的服務(wù)器中,并對算法進(jìn)行修正性訓(xùn)練,達(dá)到一定程度后再次下發(fā)到車輛中。
這個過程中,駕駛員不會有任何感知,但特斯拉事實(shí)上已經(jīng)完成了“模式識別-算法學(xué)習(xí)-反饋-升級-應(yīng)用”的閉環(huán)。正是在無數(shù)次的訓(xùn)練后,特斯拉不斷提升視覺方案的精度,克服視覺方案固有的劣勢,并且將算法優(yōu)勢變成牢不可破的技術(shù)門檻。
用視覺替代激光雷達(dá),可能嗎?
特斯拉最終希望達(dá)到的目的,是讓其視覺處理能力達(dá)到激光雷達(dá)的可見性,在行業(yè)中被稱為“偽激光雷達(dá)”。
激光雷達(dá)通過每個激光點(diǎn)的距離,實(shí)時還原環(huán)境。而特斯拉則是要去預(yù)測每個像素的深度,然后將其投射出來,從而復(fù)制激光雷達(dá)的功能。
分析2D圖像的每個像素,將其還原成真實(shí)的3D場景,毫無疑問其中的核心能力,依然是圖像處理的算法以及支持這一算法的高算力硬件,也是特斯拉將其視覺方案進(jìn)一步升級的體現(xiàn)。
這就不難理解,為何特斯拉一定要將其自動駕駛系統(tǒng)的研發(fā)深入到芯片級。
在特斯拉公開展示的通過“偽激光雷達(dá)”還原的3D地圖中,明亮環(huán)境下已經(jīng)非常接近于激光雷達(dá)的效果,但相信這只是一個階段性成果,更多的場景仍然有待考察?!皞渭す饫走_(dá)”這項從2018年才開始在學(xué)術(shù)界有可見報道的研究,對特斯拉同樣是一個極具探索挑戰(zhàn)的問題。
但如果特斯拉要依靠純視覺方案解決L4乃至L5級別的完全自動駕駛,通過強(qiáng)大的計算能力解決2D圖像到3D實(shí)景的轉(zhuǎn)換,是必須要攻克的難關(guān)。
寫在最后
如果一個人還在使用指南針和地圖,此時你給他一個GPS,意味著只是提供了解決問題的一個極有價值的工具,但卻沒有解決問題。激光雷達(dá)是那個解決問題的工具,但是視覺方案也許能從一個新的維度解決問題。
是視覺方案變強(qiáng)大的速度更快,還是激光雷達(dá)降價的速度更快?無人能給出答案,所以才會產(chǎn)生今天的行業(yè)路線紛爭,每一種路線的踐行者都堅信自己會是最終的勝利者。在無比自信的馬斯克身上,這點(diǎn)體現(xiàn)得尤為明顯。
責(zé)任編輯:pj
-
傳感器
+關(guān)注
關(guān)注
2551文章
51106瀏覽量
753652 -
激光雷達(dá)
+關(guān)注
關(guān)注
968文章
3972瀏覽量
189933 -
自動駕駛
+關(guān)注
關(guān)注
784文章
13816瀏覽量
166470
發(fā)布評論請先 登錄
相關(guān)推薦
評論