在不久前(6月19日)結(jié)束的CVPR(全球計(jì)算機(jī)視覺及模式識(shí)別領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議)2019上,百度Apollo公布了一套自動(dòng)駕駛純視覺城市道路閉環(huán)解決方案——百度Apollo Lite。
據(jù)Apollo技術(shù)委員會(huì)主席王亮介紹,Apollo Lite是目前國內(nèi)唯一的城市道路L4級(jí)視覺感知解決方案,能夠支持對10路攝像頭、200幀/秒數(shù)據(jù)量的并行處理,單視覺鏈路最高丟幀率能夠控制在5‰以下,實(shí)現(xiàn)全方位360°實(shí)時(shí)環(huán)境感知,前向障礙物的穩(wěn)定檢測視距達(dá)到240米。
百度Apollo的這一成果的發(fā)布,特斯拉應(yīng)該會(huì)很高興。
在自動(dòng)駕駛研究領(lǐng)域,只有特斯拉一家是純視覺方案的堅(jiān)定支持者,今年4月份的“自動(dòng)駕駛?cè)铡鄙希R斯克還曾公開嘲笑“使用激光雷達(dá)做自動(dòng)駕駛的人都是傻X”,幾乎得罪了所有同行。
如今,百度用實(shí)際行動(dòng)表示對純視覺感知方案的支持,特斯拉心里或許暖暖的:我不再孤軍奮戰(zhàn)了。
無論是激光雷達(dá)派,還是純視覺感知派,都夾藏私心
所謂的激光雷達(dá)派和純視覺感知派,是自動(dòng)駕駛車輛對外界環(huán)境感知兩種不同的技術(shù)取向。根據(jù)自動(dòng)駕駛的基本原理,首先由各類硬件傳感器組成感知層,用來捕捉車輛位置信息和外部環(huán)境信息,然后再進(jìn)入到?jīng)Q策和執(zhí)行。
圍繞著自動(dòng)加上感知硬件的取舍,就形成了純視覺派和激光雷達(dá)派。長期以來,Mobileye、特斯拉等堅(jiān)持第一性原理的公司認(rèn)為,只要用攝像頭就夠了,但多數(shù)公司則認(rèn)為,激光雷達(dá)是必不可少的。
值得注意的是,從2018年以來,Mobileye也開始“修正”自己感知技術(shù)的路線,在測試車輛中加上了激光雷達(dá),甚至,Mobileye還打算親自上陣做激光雷達(dá)。目前,在自動(dòng)駕駛技術(shù)主流公司中,只有特斯拉一家還在堅(jiān)持著純視覺方案。
站在技術(shù)的角度,這兩派都有各自的長短板。
激光雷達(dá)雖然探測距離和準(zhǔn)確性都大大高于攝像頭,但不能識(shí)別顏色,無法完成追蹤目標(biāo)的任務(wù);同時(shí)在高速移動(dòng)中處理的信號(hào)越多,海量像素會(huì)對廣電探測器帶來干擾,造成識(shí)別精度的下降,以及要額外插入外部適配器單獨(dú)充電,使用比較繁瑣。
純視覺方案的優(yōu)勢在于,由攝像頭獲取的視頻數(shù)據(jù)與人眼感知的真實(shí)世界最為相似,也最接近人類駕駛的形態(tài),同時(shí)高分辨率高幀率的成像技術(shù)發(fā)展趨勢意味著圖像內(nèi)蘊(yùn)含的環(huán)境信息更加豐富,但攝像頭依賴環(huán)境光照,容易受到惡劣環(huán)境影響,而且無法直觀判斷景深,對算法、算力的要求都很高。
站在商業(yè)的角度,兩個(gè)派別實(shí)際上都夾藏私心。
現(xiàn)階段,激光雷達(dá)的感知能力是強(qiáng)于攝像頭的,這也導(dǎo)致為了加快自動(dòng)駕駛商業(yè)落地的速度,科技公司和車企們走“捷徑”,在方案中過分依賴和堆砌激光雷達(dá),而回避了視覺識(shí)別算法、芯片等自動(dòng)駕駛的基本問題,用特斯拉AI高級(jí)總監(jiān)Andrej Karparthy的話來說,就是“給人一種虛假的‘技術(shù)進(jìn)步了’的感覺”。
特斯拉力挺純視覺方案其中很大一個(gè)原因在于激光雷達(dá)實(shí)在太貴了。Waymo在它的測試車上最早使用Velodyne的激光雷達(dá),單個(gè)售價(jià)達(dá)7.5萬美元,這樣的成本很難通過用戶消化。而特斯拉畢竟是一家面向C端銷售新能源汽車的企業(yè),而不是一家出售自動(dòng)駕駛技術(shù)和解決方案的公司。從技術(shù)長遠(yuǎn)的發(fā)展趨勢來看,純視覺方案或許無法走完自動(dòng)駕駛的全程,但純視覺方案的核心硬件攝像頭及其視覺算法一定是今后自動(dòng)駕駛感知技術(shù)的核心。特斯拉站隊(duì)低成本的純視覺方案,既是為當(dāng)前的銷售,也是押注未來的趨勢。
百度是選邊站隊(duì)還是另有所圖?
此次百度發(fā)布純視覺方案,是單純的技術(shù)能力展示,還是被馬斯克“洗腦”了,決定與特斯拉組成“同盟”,站隊(duì)純視覺方案陣營?智能相對論認(rèn)為,百度的行動(dòng)或可從以下幾個(gè)方面進(jìn)行解讀。
1、打磨自己的視覺技術(shù)
上文提到,無論自動(dòng)駕駛技術(shù)如何發(fā)展,攝像頭為核心的硬件及算法都將是未來自動(dòng)駕駛感知技術(shù)的核心。百度作為全球自動(dòng)駕駛研究排名靠前的科技公司,提前布局相關(guān)技術(shù)非常必要。
百度Apollo技術(shù)委員會(huì)主席王亮強(qiáng)調(diào),百度下決心投入資源研發(fā)純視覺感知解決方案并不意味著放棄現(xiàn)有基于激光雷達(dá)的技術(shù)路線,而是在技術(shù)實(shí)踐過程中充分意識(shí)到無人駕駛系統(tǒng)true redundancy的必要性,決定通過壓強(qiáng)環(huán)視視覺技術(shù)來夯實(shí)多傳感器融合感知框架。
將王亮的話說得通俗一點(diǎn),就是在傳統(tǒng)以激光雷達(dá)為主,視覺為輔的感知解決方案中,視覺感知的自身問題和缺陷在激光雷達(dá)的優(yōu)勢掩蓋下暴露得不夠充分,因而需要通過純視覺方案來打磨技術(shù),提升無人駕駛系統(tǒng)的魯棒性和安全性。
2、低成本進(jìn)入ADAS市場
百度推出純視覺方案的這個(gè)時(shí)間節(jié)點(diǎn)也意味頗深。眾所周知,實(shí)現(xiàn)真正意義上的自動(dòng)駕駛并沒有確切的時(shí)間表,現(xiàn)在汽車行業(yè)整體都處于L2級(jí)向L3級(jí)或者L4跨越的過程中,因而從中產(chǎn)生了大量的ADAS(先進(jìn)駕駛輔助系統(tǒng):Advanced Driver Assistance System)需求。
根據(jù)相關(guān)統(tǒng)計(jì)顯示,2017年國內(nèi)ADAS市場規(guī)模約為421億元;預(yù)計(jì)2020年,國內(nèi)ADAS市場規(guī)模將有望超過800億元。Qyresearch預(yù)測到2023年,國內(nèi)的ADAS市場規(guī)模將達(dá)到1200億元。其中前裝市場規(guī)模約為950億元,后裝市場約為250億元。
很顯然,ADAS是一個(gè)體量龐大、內(nèi)涵豐富的市場,是實(shí)現(xiàn)自動(dòng)駕駛的必經(jīng)之路。那么在實(shí)現(xiàn)自動(dòng)駕駛之前,在路上“淘點(diǎn)金”也無可厚非。
百度用低成本的視覺方案降級(jí)進(jìn)入到ADAS市場,不光可以開發(fā)出更多應(yīng)用場景,還能提升ADAS產(chǎn)品能力,競爭力明顯。這套純視覺方案也可看成是百度的“一石二鳥”之計(jì),不光宣示了自己的技術(shù)能力,還能就此打開一個(gè)新的市場。在埋頭拉車(進(jìn)行自動(dòng)駕駛研發(fā))的同時(shí)也抬頭看看路(獲得ADAS營收)。
2015-2020年國內(nèi)ADAS行業(yè)規(guī)模及預(yù)測(億元)圖 公開資料整理
3、形成自動(dòng)駕駛技術(shù)話語權(quán)
在學(xué)術(shù)圈和技術(shù)界,都存在話語權(quán)的問題。自動(dòng)駕駛的話語權(quán)在于能夠形成完善的技術(shù)解決方案、能夠形成標(biāo)準(zhǔn)的技術(shù)規(guī)范、能夠整合上下游的產(chǎn)業(yè)鏈。掌握了話語權(quán),就能形成自己的技術(shù)生態(tài),進(jìn)而生成馬太效應(yīng),在行業(yè)中形成一定規(guī)模的壟斷。
百度正在努力建立自己在自動(dòng)駕駛視覺感知技術(shù)方面的話語權(quán),畢竟既有自己成熟的激光雷達(dá)方案,又深鉆純視覺方案的自動(dòng)駕駛研發(fā)公司一個(gè)手都數(shù)的出來,百度提前布局就是為了提前完成技術(shù)沉淀,占據(jù)先發(fā)優(yōu)勢,形成自己在行業(yè)的話語權(quán)。
總結(jié):技術(shù)的發(fā)展是永無止境的,激光雷達(dá)與純視覺方案的爭論也是技術(shù)發(fā)展的一部分,我們需要比較技術(shù)之間的長板,我們更需要了解技術(shù)之間的短板,只有通過爭論才會(huì)將各自的短板充分暴露,而技術(shù)的進(jìn)步則在于人類對短板修復(fù)程度的高低與好壞。
評(píng)論
查看更多