無人駕駛傳感,通常意義上認(rèn)為是“三雷達(dá)一相機(jī)”:激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)和相機(jī)。實(shí)際上,行業(yè)里認(rèn)為可能以后還會(huì)使用紅外,只要是對(duì)傳感感知有利的傳感器,無人駕駛的研究上是不介于使用的。
下面逐個(gè)介紹傳感類型和傳感信息處理方法。之所以叫方法,而不叫算法,是因?yàn)橹皇菑暮暧^上說明數(shù)據(jù)是如何處理的。
相機(jī)
相機(jī)分為單目、雙目、多目、環(huán)視。
攝像頭是應(yīng)用范圍最大也是最不可替代的傳感方案,無論是哪個(gè)廠的方案,特斯拉也好,奔馳寶馬也好,都離不開攝像頭。這是因?yàn)?,攝像頭具有一個(gè)獨(dú)一無二的能力。以現(xiàn)有工業(yè)技術(shù)來看,在所有傳感器當(dāng)中,只有攝像頭具備識(shí)別能力,而且這個(gè)識(shí)別能力還會(huì)根據(jù)算法實(shí)現(xiàn)迭代優(yōu)化。對(duì)于自動(dòng)駕駛的具體場景來說,識(shí)別能力非常關(guān)鍵。
目前智能車上有使用單目攝像頭(用于目標(biāo)和障礙物識(shí)別)+雷達(dá)(測距,有的還用于目標(biāo)識(shí)別),或者使用雙目攝像頭(雙目攝像頭比單目攝像頭能更好地解決測距問題)。
在自動(dòng)駕駛場景中,偏高速的場景往往會(huì)用毫米波雷達(dá)來解決測距問題,而在低速場景使用雙目來測距則仍會(huì)受到陰雨、光線等外界條件的影響。所以有識(shí)別能力且不以判斷距離為核心的單目攝像頭是必不可少的視覺傳感。
圖像處理方法
圖像處理的辦法有兩類:
1、傳統(tǒng)的模式識(shí)別
簡單來說就是對(duì)識(shí)別到的物體進(jìn)行特征提取,然后將提取到的特征與現(xiàn)有模板進(jìn)行比對(duì),然后完成分類、識(shí)別的任務(wù)。使用這一類技術(shù)的最有代表性的公司就是以色列的 Mobileye。但模式識(shí)別存在一個(gè)問題,就是所有的判斷都是基于已經(jīng)了解的知識(shí)。
換句話說,是通過枚舉的方式來認(rèn)識(shí)這個(gè)世界。如果遇到了此前沒有見過的物體,那么系統(tǒng)就無法完成識(shí)別判斷。這在 ADAS、有人類輔助的低級(jí)自動(dòng)駕駛場景中可行,但在更高級(jí)別的自動(dòng)駕駛場景,例如車?yán)锏娜俗鰟e的事讓車自己行駛,那么這種方法就可能出現(xiàn)問題。
Mobileye 在這個(gè)技術(shù)路徑上積累了多年經(jīng)驗(yàn),已收集和迭代了全球各種駕駛場景的數(shù)據(jù)。國內(nèi)也有走與 Mobielye 相同路線的公司,但想在算法和數(shù)據(jù)上超越 Mobileye 基本上是非常困難的,需要很長的時(shí)間和大量資源的投入。
從自動(dòng)駕駛場景的基本屬性來看,交通場景屬于非結(jié)構(gòu)化的場景。什么是非結(jié)構(gòu)化?
簡單來說,結(jié)構(gòu)化的數(shù)據(jù)是可以通過一、兩個(gè)物理量表征出來的,但非結(jié)構(gòu)化數(shù)據(jù)和場景卻很難用一、兩個(gè)量表征出來。例如,一個(gè)復(fù)雜的十字路口就沒有辦法單純滴用幾個(gè)人、幾盞燈、幾個(gè)小孩這樣的量來表征。
而隨著這一輪人工智能的興起,深度學(xué)習(xí)在自動(dòng)駕駛場場景中就起到了非常關(guān)鍵的作用,可以通過一系列數(shù)據(jù)訓(xùn)練模型來解決問題,而且隨著數(shù)據(jù)量的增加,模型的識(shí)別和判斷能力會(huì)逐漸提升。如此看來,投資走模式識(shí)別技術(shù)路線的公司在短期內(nèi)機(jī)會(huì)相對(duì)較小。
從技術(shù)角度出發(fā),深度學(xué)習(xí)能力的判斷無非就是考量模型和數(shù)據(jù)。
首先看的是數(shù)據(jù),想看看有沒有一些特殊的方式能夠讓一家公司能夠擁有先于業(yè)內(nèi)其他企業(yè)數(shù)據(jù)獲取能力,擁有更低成本、更高效率的數(shù)據(jù)獲取方式,這是我們當(dāng)時(shí)考量的一個(gè)基礎(chǔ)。
其實(shí),我們?cè)诶斫鈹?shù)據(jù)上也走很長的一段路。最開始,我們以為在出租車上掛一個(gè)行車記錄儀出去跑一跑、拍一拍就 OK 了,但這跟實(shí)際需要的數(shù)據(jù)相差甚遠(yuǎn)。
為什么呢?因?yàn)閷?shí)際需要的數(shù)據(jù)需要多元化的數(shù)據(jù)??赡茉诟咚俟妨伺牧藥兹f公里但是由于車輛少、場景單一,大多數(shù)數(shù)據(jù)都沒什么用。
后來我們了解到,實(shí)際需要的數(shù)據(jù)叫做全駕乘狀態(tài)的車輛數(shù)據(jù)。除了攝像頭自身標(biāo)定出來的有人和物的數(shù)據(jù),還要伴隨著場景中的汽車狀態(tài)數(shù)據(jù),例如 CAN 總線數(shù)據(jù)、GPS 數(shù)據(jù)等。
相比之下,簡單依靠出租車搭載行車記錄儀得到的數(shù)據(jù)并不完備,這種全駕乘狀態(tài)的車輛數(shù)據(jù)才是核心,而且必須與專業(yè)機(jī)構(gòu)、車廠合作才能獲取。
另外一點(diǎn)就是模型。在考量算法模型時(shí),我們其實(shí)有很大的顧慮?,F(xiàn)在有很多成熟的開源框架,例如 TensorFlow、Caffe 等等。這些開源算法框架的存在似乎是把門檻降低了。但是理解之后,我們發(fā)現(xiàn),同樣是 TensorFlow,不同企業(yè)、不同廠家拿過來使用以后,產(chǎn)生的效果是不一樣的。原因在于,模型優(yōu)化這件事情有三個(gè)層面。
第一個(gè)層面是簡單的參數(shù)調(diào)整。例如對(duì)某一個(gè)網(wǎng)絡(luò)層的某一個(gè)參數(shù)進(jìn)行調(diào)參,并不知道調(diào)出來的效果是什么樣的,只能一次一次的試,有點(diǎn)像算命。
第二個(gè)層面是可以改開源算法框架的源代碼,進(jìn)而優(yōu)化里面的細(xì)節(jié)公式。這個(gè)層面可能需要對(duì) TensorFlow 體系有比較深入的理解,同時(shí)對(duì)工程化有比較深入的認(rèn)知,往往具備產(chǎn)業(yè)背景。
第三個(gè)層面不但可以調(diào)整技術(shù)源代碼,還可以根據(jù)自己的數(shù)學(xué)理解和開發(fā)能力,用不同的數(shù)據(jù)方法優(yōu)化底層的數(shù)據(jù)公式。這個(gè)層面除了對(duì)產(chǎn)業(yè)和工程存在要求,最好還要具備比較深的數(shù)學(xué)功底。這些經(jīng)歷可以幫助研發(fā)人員在模型嘗試的過程中少走很多彎路。
激光雷達(dá)
激光雷達(dá)種類
第一個(gè)是機(jī)械旋轉(zhuǎn)式激光雷達(dá)。這類激光雷達(dá)有機(jī)械旋轉(zhuǎn)機(jī)構(gòu),相對(duì)笨重,如果要將旋轉(zhuǎn)機(jī)構(gòu)做到可靠性高,滿足車規(guī)級(jí)要求,成本會(huì)很高。我們認(rèn)為,這類激光雷達(dá)的機(jī)會(huì)是窗口性的,未來其他技術(shù)成熟了,這類激光雷達(dá)可能會(huì)退出市場。這也是所謂的非固態(tài)激光雷達(dá),人們通常把下面這三種成為固態(tài)激光雷達(dá)。
第二類是 MEMS 激光雷達(dá)。這類激光雷達(dá)是把所有的機(jī)械結(jié)構(gòu)做到半導(dǎo)體工藝上,集成到單個(gè)芯片。目前,國外有以色列公司 Innoluce 正在嘗試這一技術(shù)路徑,國內(nèi)也有走類似路線公司,但國內(nèi)在其核心原件 MEMS 振鏡一直量產(chǎn)能力不強(qiáng)。而且這個(gè)方案在成本上不太可靠。
第三類是光學(xué)相控陣激光雷達(dá)。這類激光雷達(dá)對(duì)工藝要求極其苛刻,因此量產(chǎn)也是一個(gè)問題。
第四類是面陣激光雷達(dá)。之前面陣激光雷達(dá)較多應(yīng)用于航天軍工領(lǐng)域,精度較高,但是造價(jià)昂貴。
評(píng)論
查看更多