0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動(dòng)駕駛深度感知技術(shù)對(duì)車和行人的檢測(cè)

mK5P_AItists ? 來源:人工智能學(xué)家 ? 2019-11-24 07:42 ? 次閱讀

今天我主要想分享自動(dòng)駕駛感知技術(shù)在探索的過程中,采用的傳統(tǒng)方法和深度學(xué)習(xí)方法。傳統(tǒng)方法不代表多傳統(tǒng),深度學(xué)習(xí)也不代表多深度。它們有各自的優(yōu)點(diǎn),也都能解決各自的問題,最終希望將其結(jié)合起來,發(fā)揮所有方法的優(yōu)點(diǎn)。

感知系統(tǒng)簡(jiǎn)介

首先介紹下感知系統(tǒng)。感知可以被看作是對(duì)周圍世界建模的過程,比如車輛在行駛過程中,需要知道其他物體的地理位置、速度、運(yùn)動(dòng)方向、加速度等各種各樣的信息,自動(dòng)駕駛系統(tǒng)接收這些信息之后,再通過后續(xù)的規(guī)劃和控制模塊來對(duì)車的運(yùn)動(dòng)做真正的調(diào)節(jié)。

感知可以類比為人類眼睛的功能,即觀察周圍世界的能力:

◆采用的傳感器:激光雷達(dá)、照相機(jī)、毫米波雷達(dá)等。

◆幀信號(hào)處理:多傳感器深度融合、物體分割、物體檢測(cè)、物體分類。

◆物體追蹤:當(dāng)有多幀信息之后,可以推算速度、加速度、方向等更有意義的信息,甚至可以用多幀的信息調(diào)整物體分割的結(jié)果。

◆道路特征分析:對(duì)道路特征進(jìn)行理解,比如交通信號(hào)燈、交通指示牌等。

感知可以認(rèn)為是自動(dòng)駕駛系統(tǒng)的基礎(chǔ)部分,假如感知不到這個(gè)世界,就談不上對(duì)這個(gè)世界做出反應(yīng),更談不上后續(xù)的路徑規(guī)劃和車輛控制的過程。

2D物體檢測(cè)

我今天主要介紹關(guān)于物體檢測(cè)部分,因?yàn)楸仨毾扔辛藴?zhǔn)確的物體檢測(cè)和分割結(jié)果,我們才能對(duì)物體做出準(zhǔn)確的分類、追蹤等。我首先介紹下2D物體檢測(cè)。

2D物體檢測(cè)是指以2D信息作為輸入(input)的檢測(cè)過程,而典型的2D輸入信息來自于照相機(jī)。

傳統(tǒng)2D物體檢測(cè)方法及缺點(diǎn)

傳統(tǒng)的 2D 信息檢測(cè)方法是使用檢測(cè)框遍歷圖片,把對(duì)應(yīng)的圖片位置摳出來之后,進(jìn)行特征提取,用 Harris計(jì)算子檢測(cè)角點(diǎn)信息,Canny計(jì)算子檢測(cè)邊緣信息等。物體特征被提取并聚集在一起后,通過做分類器(比如SVM),我們可以判斷提取的圖中是否存在物體,以及物體的類別是什么。

但傳統(tǒng) 2D 物體檢測(cè)方法存在不足:

檢測(cè)物體時(shí),需要預(yù)置檢測(cè)框,對(duì)不同物體需要設(shè)置不同的檢測(cè)框。

自動(dòng)駕駛需要高級(jí)的組合特征,而傳統(tǒng)方法提取的特征維度比較低,對(duì)后續(xù)的分類會(huì)造成比較大的影響。

基于深度學(xué)習(xí)的2D物體檢測(cè)

卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),解決了部分傳統(tǒng)2D物體檢測(cè)方法的不足。

卷積神經(jīng)網(wǎng)絡(luò)首先是多層感知機(jī)加卷積操作的結(jié)合,它的特征提取能力非常不錯(cuò)。因?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)經(jīng)常會(huì)有幾十、上百個(gè)卷積,使其具備高維特征提取能力。

其次,通過 ROI pooling和RPN,整張圖可以共享同樣的特征,物體檢測(cè)時(shí)不用遍歷整張圖片,還可以在單次操作中對(duì)圖片中所有物體進(jìn)行檢測(cè)。這種檢測(cè)方法使物體檢測(cè)模型真正具備了應(yīng)用于實(shí)際場(chǎng)景中的性能。

目前基于卷積神經(jīng)網(wǎng)絡(luò)的2D物體檢測(cè)有兩類分支:

◆Anchor Based Methods:跟傳統(tǒng)方法比較類似,先預(yù)置檢測(cè)框,檢測(cè)過程則是對(duì)預(yù)設(shè)框的擬合過程。

RCNN(fast,faster)

SSD(DSSD)

YOLO(v1,v2,v3)

RetinaNET

◆Anchor Free Methods:直接對(duì)照特征金字塔的每個(gè)位置,回歸對(duì)應(yīng)位置上,判斷物體是否存在、它的大小是多少等。這類方法是2018年底開始大量出現(xiàn)的,也是未來的一個(gè)發(fā)展方向。

CornerNet

FSAF

FCOS

這是路測(cè)場(chǎng)景中的一個(gè)真實(shí)檢測(cè)案例(上圖),2D 物體檢測(cè)已經(jīng)應(yīng)用于檢測(cè)路面上一些小物體。

同時(shí)遠(yuǎn)距離物體檢測(cè)也是2D物體檢測(cè)中關(guān)注的重點(diǎn)。受限于激光雷達(dá)和毫米波雷達(dá)的物理特征,遠(yuǎn)距離物體缺乏良好的檢測(cè)效果,而照相機(jī)在這方面比較有優(yōu)勢(shì),可以和其他的檢測(cè)方法進(jìn)行互補(bǔ)。

2D物體檢測(cè)面臨的問題

物體相互遮擋

但是采用照相機(jī)做 2D 物體檢測(cè)不可避免要面臨一些問題。因?yàn)檎障鄼C(jī)回饋的圖像只有兩個(gè)維度,當(dāng)兩個(gè)物體堆疊時(shí),對(duì)一個(gè)神經(jīng)網(wǎng)絡(luò)而言,圖像的特征就比較聚集。

一般做物體檢測(cè)的過程,會(huì)用一些非極大值抑制的方法,對(duì)檢測(cè)結(jié)果進(jìn)行后處理,當(dāng)特征結(jié)果非常密集的時(shí)候,這種方法往往會(huì)受到影響。

成像質(zhì)量波動(dòng)

照相機(jī)是可見光設(shè)備,因此會(huì)受到光照強(qiáng)度的影響,成像質(zhì)量出現(xiàn)波動(dòng)。但我們總是希望圖中的特征不管是在哪個(gè)位置,都能得到足夠的表達(dá)。

例如,2D圖像中遠(yuǎn)處的車燈和路燈很難區(qū)分開,導(dǎo)致可能都被檢測(cè)為車或者路燈。在這種情況下,特征總會(huì)難以區(qū)分。

測(cè)距 另一個(gè)的問題就是測(cè)距問題。因?yàn)檎障鄼C(jī)是被動(dòng)光源的設(shè)備,它不具備主動(dòng)測(cè)距的能力。

如果希望借助照相機(jī)進(jìn)行物體測(cè)距,就需要做很多的假設(shè)或者求解一些病態(tài)的數(shù)學(xué)問題,用以估算車與物體的距離。但這個(gè)結(jié)果通常不如主動(dòng)測(cè)距設(shè)備的結(jié)果,比如激光雷達(dá)和毫米波雷達(dá)。

3D物體檢測(cè)

正是因?yàn)檎障鄼C(jī)存在上面提到的問題,所以我們物體檢測(cè)也使用了其他的傳感器,將它們的結(jié)果共同結(jié)合起來,最終達(dá)到更可靠的檢測(cè)效果。

什么是3D物體檢測(cè)?

3D物體檢測(cè),顧名思義就是把3D的一些數(shù)據(jù)坐標(biāo),聚集起來進(jìn)行物體檢測(cè)。比如激光雷達(dá),類似于我們拿一支激光筆不斷掃描周圍,它會(huì)提供相對(duì)明顯的信息。當(dāng)把3D數(shù)據(jù)聚集起來之后,我們可以用來推測(cè)周圍物體的位置,大小,朝向等等。

3D物體檢測(cè)一個(gè)很大的好處就是,我們?cè)?D物體檢測(cè)中很難區(qū)分的物體,有了3D數(shù)據(jù)提供的距離信息之后,將更容易從距離的維度上分開。這樣感知系統(tǒng)在進(jìn)行物體分割的時(shí)候能使用的信息更多,達(dá)到一個(gè)更好的工作效果。

傳統(tǒng)3D分割方法及限制

傳統(tǒng)的 3D 分割方法包括:

Flood Fill

DB scan

Graph Cut

它主要是利用一些點(diǎn)的距離信息、密度信息或者點(diǎn)的一些天然屬性,比如它的強(qiáng)度,把物體聚類分割。

傳統(tǒng)分割方法也存在不少限制,首先是過度分割。

比如上圖中的異形車,由于車尾和車頭之間有縫隙,在 3D 檢測(cè)中,它可能會(huì)被分割成多個(gè)物體,因?yàn)辄c(diǎn)和點(diǎn)之間有間隙,在激光雷達(dá)檢測(cè)時(shí)呈現(xiàn)的是離散信息,就會(huì)出現(xiàn)過度分割。

傳統(tǒng)分割方法的另一個(gè)問題是分割不足。

我們將上圖出現(xiàn)的情況稱為“三人成車”,就是當(dāng)三個(gè)人離的很近的時(shí)候,有可能被傳統(tǒng)分割方法識(shí)別成一輛車。

基于深度學(xué)習(xí)的3D分割方法

當(dāng)深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)引入到 3D 物體檢測(cè)中時(shí),我們發(fā)現(xiàn)傳統(tǒng)3D分割方法遇到的問題得到較好解決。

首先讓點(diǎn)云信息進(jìn)行特征工程,即將點(diǎn)的位置、反射強(qiáng)度、高級(jí)特征聚合在一起,組織成類似圖片或者圖的關(guān)系。隨后進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)特征提取,再進(jìn)行多幀特征的聚合(它的意義是對(duì)運(yùn)動(dòng)的物體有一個(gè)更好的反映),最后輸出物體的位置、聚類信息、物體速度。

通過上述深度學(xué)習(xí)方法,“三人成車”的情況得到避免。系統(tǒng)不僅可以提取人的距離關(guān)系,還可以提取到更多的高級(jí)信息,比如在點(diǎn)云變化中,人類的點(diǎn)云形似長(zhǎng)的柱體,而自行車類似于小山一樣的點(diǎn)云分布,這樣感知系統(tǒng)可以了解這些障礙物不屬于同一物體,而將其割離開。

深度學(xué)習(xí)3D分割方法的限制

另一方面,我們也要認(rèn)識(shí)到深度學(xué)習(xí)分割方法也可能面對(duì)的挑戰(zhàn)。

◆結(jié)果的不完全可控:首先卷積神經(jīng)網(wǎng)絡(luò)經(jīng)常有幾百層的卷積層,參數(shù)總量可能有百萬級(jí),并且是自動(dòng)學(xué)習(xí)的,這可能會(huì)導(dǎo)致對(duì)網(wǎng)絡(luò)的輸出缺少把控。換句話說,系統(tǒng)無法預(yù)期數(shù)據(jù)輸入(input)后會(huì)得到怎樣的數(shù)據(jù)輸出,于自動(dòng)駕駛而言,這是比較致命的。因?yàn)樽詣?dòng)駕駛對(duì)場(chǎng)景的召回率和精度有非常高要求,如果車輛在行駛中,前面的一位行人miss(丟失),這是極其嚴(yán)重的隱患。

◆無法保證100%的召回(recall):如上圖所示,垃圾桶和行人的特征其實(shí)非常相似,那么深度學(xué)習(xí)可能會(huì)出現(xiàn)把人學(xué)成了垃圾桶,最后導(dǎo)致行人在感知系統(tǒng)中出現(xiàn)丟失的情況。

◆易導(dǎo)致過擬合:由于卷積神經(jīng)網(wǎng)絡(luò)有非常好的特征提取能力,固定的數(shù)據(jù)集訓(xùn)練可能導(dǎo)致神經(jīng)網(wǎng)絡(luò)過擬合。例如同樣的數(shù)據(jù)集訓(xùn)練后,在北京路測(cè)的表現(xiàn)很好,但是當(dāng)?shù)竭_(dá)一個(gè)新的城市進(jìn)行測(cè)試時(shí),因?yàn)槁访嫣卣骱捅本┯兴鶇^(qū)別,可能導(dǎo)致物體分割效果下降,這對(duì)感知系統(tǒng)非常不友好。

優(yōu)點(diǎn)兼得:傳統(tǒng)方法和深度學(xué)習(xí)方法的結(jié)合

為了解決分割方法的限制,我們的想法是將傳統(tǒng)方法和深度學(xué)習(xí)方法的結(jié)果進(jìn)行結(jié)合:

◆使用深度學(xué)習(xí)的分割結(jié)果調(diào)整傳統(tǒng)分割方法的結(jié)果。

◆使用傳統(tǒng)分割方法的結(jié)果補(bǔ)足深度學(xué)習(xí)結(jié)果的召回。

◆基于多幀追蹤的概率模型融合:比如利用馬爾可夫分布的特點(diǎn)、貝葉斯的方法對(duì)多幀數(shù)據(jù)進(jìn)行一定的平滑,以得到更好的效果。

通過傳統(tǒng)方法和深度學(xué)習(xí)方法的相互結(jié)合與補(bǔ)充,我們最終可以實(shí)現(xiàn)優(yōu)點(diǎn)兼具的物體檢測(cè)策略。

做自動(dòng)駕駛真的是一個(gè)很崎嶇的旅程,不斷的解決問題之后又出現(xiàn)新的問題,不過正是因?yàn)檫^程的艱難,才帶來更多的快樂。

感知系統(tǒng)基本介紹

Perception(感知)系統(tǒng)是以多種傳感器的數(shù)據(jù)與高精度地圖的信息作為輸入,經(jīng)過一系列的計(jì)算及處理,對(duì)自動(dòng)駕駛車的周圍環(huán)境精確感知的系統(tǒng)。

它能夠?yàn)橄掠文K提供豐富的信息,包括障礙物的位置、形狀、類別及速度信息,也包括對(duì)一些特殊場(chǎng)景的語義理解(例如施工區(qū)域,交通信號(hào)燈及交通路牌等)。

感知系統(tǒng)的構(gòu)成與子系統(tǒng)

◆傳感器:涉及到傳感器的安裝,視場(chǎng)角,探測(cè)距離,數(shù)據(jù)吞吐,標(biāo)定精度,時(shí)間同步等。因?yàn)樽詣?dòng)駕駛使用的傳感器比較多,時(shí)間同步的解決方案至關(guān)重要。

◆目標(biāo)檢測(cè)及分類:為了保證自動(dòng)駕駛的安全,感知系統(tǒng)需要達(dá)到近似百分之百的召回率及非常高的準(zhǔn)確率。目標(biāo)檢測(cè)及分類往往會(huì)涉及到深度學(xué)習(xí)方面的工作,包括3D點(diǎn)云及2D Image(圖片)上的物體檢測(cè)及多傳感器深度融合等。

◆多目標(biāo)追蹤:跟進(jìn)多幀的信息計(jì)算并預(yù)測(cè)障礙物的運(yùn)動(dòng)軌跡。

◆場(chǎng)景理解:包括交通信號(hào)燈,路牌,施工區(qū)域,以及特殊類別,比如校車,警車。

機(jī)器學(xué)習(xí)分布式訓(xùn)練基礎(chǔ)架構(gòu)及相關(guān)評(píng)價(jià)系統(tǒng)

◆數(shù)據(jù):大量的標(biāo)注數(shù)據(jù),這里包括3D點(diǎn)云數(shù)據(jù)及2D的圖片數(shù)據(jù)等。

傳感器詳解

目前自動(dòng)駕駛應(yīng)用的傳感器主要分為三類:激光雷達(dá)(LiDAR),相機(jī)(Camera),毫米波雷達(dá)(Radar)。

開頭提到,感知系統(tǒng)的輸入為多種傳感器數(shù)據(jù)和高精地圖,而上圖展示了感知系統(tǒng)物體檢測(cè)的輸出結(jié)果,即能夠檢測(cè)車輛周圍的障礙物,如車輛、行人、自行車等,同時(shí)結(jié)合高精度地圖,感知系統(tǒng)也會(huì)對(duì)周邊的Background(環(huán)境背景)信息進(jìn)行輸出。

如上圖所示,綠顏色的塊狀代表一輛乘用車,橙色代表一輛摩托車,黃色代表一位行人,灰色則是檢測(cè)到的環(huán)境信息,如植被。

感知系統(tǒng)結(jié)合多幀的信息(上圖),還能對(duì)運(yùn)動(dòng)的行人和車輛的速度、方向、軌跡預(yù)測(cè)等進(jìn)行精確的輸出。

傳感器配置與多傳感器深度融合

了解了關(guān)于感知系統(tǒng)從輸入到輸出的大致介紹,接下來,我簡(jiǎn)要介紹一下小馬智行第三代自動(dòng)駕駛系統(tǒng)PonyAlpha的傳感器安裝方案以及多傳感器深度融合的解決方案。

傳感器安裝方案

目前PonyAlpha傳感器安裝方案的感知距離能夠覆蓋車周360度、范圍200米以內(nèi)。

具體來看,這套方案用到了3個(gè)激光雷達(dá),在車的頂部和兩側(cè)。同時(shí),通過多個(gè)廣角的攝像頭來覆蓋360度的視野。遠(yuǎn)處的視野方面,前向的毫米波雷達(dá)以及長(zhǎng)焦相機(jī)將感知距離擴(kuò)到200米的范圍,使其可以探測(cè)到更遠(yuǎn)處的物體信息。這套傳感器配置能保證我們的自動(dòng)駕駛車輛在居民區(qū)、商業(yè)區(qū)、工業(yè)區(qū)這樣的場(chǎng)景進(jìn)行自動(dòng)駕駛。

多傳感器深度融合解決方案

多傳感器深度融合的基礎(chǔ) 多傳感器深度融合的方案首要解決的是將不同的傳感器的數(shù)據(jù)標(biāo)定到同一個(gè)坐標(biāo)系里,包括了相機(jī)的內(nèi)參標(biāo)定,激光雷達(dá)到相機(jī)的外參標(biāo)定,毫米波雷達(dá)到GPS的外參標(biāo)定等等。

傳感器融合重要前提是使標(biāo)定精度達(dá)到到極高水平,不論對(duì)于結(jié)果層面的傳感器融合還是元數(shù)據(jù)層面的傳感器融合,這都是必要的基礎(chǔ)。

通過上圖你會(huì)發(fā)現(xiàn),我們的感知系統(tǒng)將3D的激光點(diǎn)云精準(zhǔn)地投射到影像上,可見傳感器標(biāo)定的精度是足夠高的。

不同傳感器的標(biāo)定方案 整個(gè)傳感器標(biāo)定的工作基本上已做到完全自動(dòng)化的方式。

首先是相機(jī)內(nèi)參的標(biāo)定(上圖),這是為了修正由相機(jī)自身特性導(dǎo)致的圖像扭曲等。相機(jī)內(nèi)參的標(biāo)定平臺(tái)使每一個(gè)相機(jī)能夠在兩到三分鐘之內(nèi)完成傳感器的標(biāo)定。

其次是激光雷達(dá)與GPS/IMU的外參標(biāo)定(上圖),激光雷達(dá)的原始數(shù)據(jù)是基于雷達(dá)坐標(biāo)系,因此我們需要將點(diǎn)由雷達(dá)坐標(biāo)系轉(zhuǎn)換為世界坐標(biāo)系,這就涉及到激光雷達(dá)與GPS/IMU相對(duì)位置關(guān)系的計(jì)算。我們的標(biāo)定工具在室外通過優(yōu)化的方案,能夠快速找到最優(yōu)的位置關(guān)系。

第三是相機(jī)到激光雷達(dá)的融合(上圖)。激光雷達(dá)的感知環(huán)境是360度旋轉(zhuǎn)的方式,每旋轉(zhuǎn)一周是100毫秒,而相機(jī)是某一瞬時(shí)曝光,為了保證相機(jī)的曝光與激光雷達(dá)的旋轉(zhuǎn)保證同步,需要對(duì)二者進(jìn)行時(shí)間同步,即通過Lidar來觸發(fā)相機(jī)曝光。比如說,可以通過激光雷達(dá)的位置信息來觸發(fā)對(duì)應(yīng)位置相機(jī)的曝光時(shí)間,以達(dá)到相機(jī)與激光雷達(dá)的精確同步。

3D(激光雷達(dá))和2D(相機(jī))彼此互補(bǔ),二者更好的融合可使得感知得到更精確的輸出。

最后是毫米波雷達(dá)(Radar)與GPS/IMU的標(biāo)定(上圖),同樣是將Radar數(shù)據(jù)由Local(本地)坐標(biāo)系將其轉(zhuǎn)換到世界坐標(biāo)系,我們將通過真實(shí)的3D環(huán)境來計(jì)算Radar與GPS/IMU的相對(duì)位置關(guān)系。好的標(biāo)定結(jié)果能夠保證感知系統(tǒng)給出200米距離以內(nèi)障礙車的車道信息(如位于車道內(nèi)或壓車道線等)等。

下面這個(gè)demo視頻簡(jiǎn)明生動(dòng)地展示了多傳感器深度融合的部分處理效果。

車載感知系統(tǒng)架構(gòu)

那么車載感知系統(tǒng)架構(gòu)是什么樣的?它的解決方案又是什么?

上圖展示了整個(gè)車載感知系統(tǒng)的架構(gòu)。首先激光雷達(dá)、相機(jī)、毫米波雷達(dá)三種傳感器數(shù)據(jù)須進(jìn)行時(shí)間同步,將所有的時(shí)間誤差控制在毫秒級(jí)。結(jié)合傳感器數(shù)據(jù),感知系統(tǒng)以幀為基礎(chǔ)(frame-based)進(jìn)行檢測(cè)(detection)、分割(segmentation)、分類(classification)等計(jì)算,最后利用多幀信息進(jìn)行多目標(biāo)跟蹤,將相關(guān)結(jié)果輸出。這個(gè)過程中將涉及到多傳感器深度融合和深度學(xué)習(xí)相關(guān)的技術(shù)細(xì)節(jié),我這里不做過多的討論。

感知系統(tǒng)的解決方案應(yīng)保證以下五點(diǎn):

◆首先是安全,保證近乎百分之百的檢測(cè)(Detection)召回率(Recall)。

◆精度(Precision)要求非常高,如果低于某個(gè)閾值,造成False Positive(誤報(bào)),會(huì)導(dǎo)致車輛在自動(dòng)駕駛狀態(tài)下行駛得非常不舒適。

◆盡量輸出所有對(duì)行車有幫助的信息,包括路牌,交通信號(hào)燈及其它場(chǎng)景理解的信息。

◆保證感知系統(tǒng)的高效運(yùn)行,能夠近實(shí)時(shí)處理大量的傳感器數(shù)據(jù)。

◆可擴(kuò)展性(Scalability)也很重要。深度學(xué)習(xí)(Deep learning)依賴大量數(shù)據(jù),其訓(xùn)練模型的泛化能力對(duì)于感知系統(tǒng)非常重要。未來,我們希望模型(model)和新算法有能力適配更多的城市和國(guó)家的路況。

感知技術(shù)的挑戰(zhàn)

感知精度與召回率相平衡的挑戰(zhàn)

上圖展示了晚高峰時(shí)期十字路口的繁忙場(chǎng)景,此時(shí)有大量行人、摩托車穿過十字路口。

通過3D點(diǎn)云數(shù)據(jù)(上圖),能夠看到此時(shí)對(duì)應(yīng)的感知原始數(shù)據(jù)。

這里挑戰(zhàn)是,經(jīng)過計(jì)算處理后,感知系統(tǒng)需要在這樣環(huán)境下輸出所有障礙物的正確的分割(segmentation)結(jié)果和障礙物類別。

除了繁忙的十字路口,感知系統(tǒng)在處理一些特殊的或者惡劣的天氣條件,也面臨不小挑戰(zhàn)。

突降暴雨或者長(zhǎng)時(shí)間降雨往往會(huì)造成路面積水,車輛經(jīng)過自然會(huì)濺起水花。上方視頻中白色點(diǎn)云展示了激光雷達(dá)檢測(cè)到其他車輛經(jīng)過濺起的水花并對(duì)其進(jìn)行filter(過濾)的結(jié)果。如果感知系統(tǒng)不能對(duì)水花進(jìn)行準(zhǔn)確的識(shí)別和過濾,這會(huì)對(duì)自動(dòng)駕駛造成麻煩。結(jié)合激光雷達(dá)與攝像頭(Lidar&Camera)的數(shù)據(jù),我們的感知系統(tǒng)對(duì)水花有很高的識(shí)別率。

長(zhǎng)尾場(chǎng)景挑戰(zhàn)

灑水車 上圖是我們?cè)诼窚y(cè)時(shí)曾遇到的兩類灑水車(上圖)。左邊灑水車采用向上噴的霧炮,而右邊是向兩側(cè)噴灑的灑水車。

人類司機(jī)遇到灑水車時(shí),可以很容易做出判斷并超過灑水車,但是對(duì)于感知系統(tǒng)來說,則需要花一定時(shí)間去處理和識(shí)別這類場(chǎng)景和車輛,我們的自動(dòng)駕駛在遇到類似場(chǎng)景已獲得更優(yōu)的乘坐體驗(yàn)。

小物體的檢測(cè)

小物體檢測(cè)的意義在于,面對(duì)意想不到的路測(cè)事件,比如流浪的小貓、小狗突然出現(xiàn)馬路上,感知系統(tǒng)對(duì)這類小物體能夠有準(zhǔn)確的召回,以保證小生命的安全。

紅綠燈

隨著越來越多地區(qū)和國(guó)家開展自動(dòng)駕駛路測(cè),感知系統(tǒng)在處理交通信號(hào)燈總會(huì)遇到新的長(zhǎng)尾場(chǎng)景。

例如,逆光的問題(上圖)或者突然從橋洞中駛出后相機(jī)曝光的問題,我們可以通過動(dòng)態(tài)調(diào)整相機(jī)的曝光等方法來解決問題。

還有紅綠燈倒計(jì)時(shí)的場(chǎng)景(上圖),感知系統(tǒng)可以識(shí)別出倒計(jì)時(shí)的數(shù)字,這樣能夠讓自動(dòng)駕駛車輛在遇到黃燈時(shí)/前,給出更優(yōu)的規(guī)劃決策應(yīng)對(duì),優(yōu)化乘車體驗(yàn)。

雨天時(shí),攝像頭(照相機(jī))會(huì)水珠密布(上圖),感知系統(tǒng)需要處理這類特殊氣候條件下的場(chǎng)景,準(zhǔn)確識(shí)別紅綠燈。

一些地區(qū)使用的紅綠燈帶有進(jìn)度條(上圖),要求感知系統(tǒng)能夠識(shí)別進(jìn)度條的變動(dòng),這樣可以幫助下游的規(guī)劃決策模塊在綠燈將變黃時(shí),提前給出減速。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 感知系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    71

    瀏覽量

    15969
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13904

    瀏覽量

    166730
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5511

    瀏覽量

    121355

原文標(biāo)題:【智能駕駛】自動(dòng)駕駛深度感知技術(shù)對(duì)車和行人的檢測(cè)

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    2024年自動(dòng)駕駛行業(yè)熱點(diǎn)技術(shù)盤點(diǎn)

    感知輕地圖以及純視覺等。這些技術(shù)的出現(xiàn),也代表著自動(dòng)駕駛正從概念走向現(xiàn)實(shí),今天就給大家來盤點(diǎn)2024年自動(dòng)駕駛行業(yè)出現(xiàn)的那些技術(shù)熱點(diǎn)! ?
    的頭像 發(fā)表于 01-14 10:48 ?179次閱讀

    一文聊聊自動(dòng)駕駛測(cè)試技術(shù)的挑戰(zhàn)與創(chuàng)新

    隨著自動(dòng)駕駛技術(shù)的飛速發(fā)展,自動(dòng)駕駛測(cè)試的重要性也日益凸顯。自動(dòng)駕駛測(cè)試不僅需要驗(yàn)證車輛的感知、決策、控制模塊的獨(dú)立性能,還需確保系統(tǒng)在復(fù)雜
    的頭像 發(fā)表于 12-03 15:56 ?250次閱讀
    一文聊聊<b class='flag-5'>自動(dòng)駕駛</b>測(cè)試<b class='flag-5'>技術(shù)</b>的挑戰(zhàn)與創(chuàng)新

    標(biāo)貝科技:自動(dòng)駕駛中的數(shù)據(jù)標(biāo)注類別分享

    自動(dòng)駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動(dòng)駕駛感知模型需要使用大量準(zhǔn)確真實(shí)的數(shù)據(jù)。據(jù)英特爾計(jì)算,L3+級(jí)
    的頭像 發(fā)表于 11-22 15:07 ?979次閱讀
    標(biāo)貝科技:<b class='flag-5'>自動(dòng)駕駛</b>中的數(shù)據(jù)標(biāo)注類別分享

    標(biāo)貝科技:自動(dòng)駕駛中的數(shù)據(jù)標(biāo)注類別分享

    自動(dòng)駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動(dòng)駕駛感知模型需要使用大量準(zhǔn)確真實(shí)的數(shù)據(jù)。據(jù)英特爾計(jì)算,L3+級(jí)
    的頭像 發(fā)表于 11-22 14:58 ?846次閱讀
    標(biāo)貝科技:<b class='flag-5'>自動(dòng)駕駛</b>中的數(shù)據(jù)標(biāo)注類別分享

    MEMS技術(shù)自動(dòng)駕駛汽車中的應(yīng)用

    MEMS技術(shù)自動(dòng)駕駛汽車中的應(yīng)用主要體現(xiàn)在傳感器方面,這些傳感器為自動(dòng)駕駛汽車提供了關(guān)鍵的環(huán)境感知和數(shù)據(jù)采集能力。以下是對(duì)MEMS技術(shù)
    的頭像 發(fā)表于 11-20 10:19 ?472次閱讀

    自動(dòng)駕駛技術(shù)的典型應(yīng)用 自動(dòng)駕駛技術(shù)涉及到哪些技術(shù)

    自動(dòng)駕駛技術(shù)的典型應(yīng)用 自動(dòng)駕駛技術(shù)是一種依賴計(jì)算機(jī)、無人駕駛設(shè)備以及各種傳感器,實(shí)現(xiàn)汽車自主行駛的技術(shù)
    的頭像 發(fā)表于 10-18 17:31 ?917次閱讀

    Mobileye端到端自動(dòng)駕駛解決方案的深度解析

    強(qiáng)大的技術(shù)優(yōu)勢(shì)。 Mobileye的端到端解決方案概述 1.1 什么是端到端自動(dòng)駕駛? 端到端自動(dòng)駕駛解決方案是一種新型的智能系統(tǒng)架構(gòu),旨在通過AI學(xué)習(xí)從感知到?jīng)Q策再到操作的全流程。M
    的頭像 發(fā)表于 10-17 09:35 ?413次閱讀
    Mobileye端到端<b class='flag-5'>自動(dòng)駕駛</b>解決方案的<b class='flag-5'>深度</b>解析

    聊聊自動(dòng)駕駛離不開的感知硬件

    自動(dòng)駕駛飛速發(fā)展,繞不開感知、決策和控制決策的經(jīng)典框架,而感知作為自動(dòng)駕駛汽車“感官”的重要組成部分,決定了自動(dòng)駕駛系統(tǒng)對(duì)環(huán)境的理解和反應(yīng)能
    的頭像 發(fā)表于 08-23 10:18 ?592次閱讀

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些優(yōu)勢(shì)?

    FPGA(Field-Programmable Gate Array,現(xiàn)場(chǎng)可編程門陣列)在自動(dòng)駕駛領(lǐng)域具有顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)使得FPGA成為自動(dòng)駕駛技術(shù)中不可或缺的一部分。以下是FPGA在
    發(fā)表于 07-29 17:11

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用?

    是FPGA在自動(dòng)駕駛領(lǐng)域的主要應(yīng)用: 一、感知算法加速 圖像處理:自動(dòng)駕駛中需要通過攝像頭獲取并識(shí)別道路信息和行駛環(huán)境,這涉及到大量的圖像處理任務(wù)。FPGA在處理圖像上的運(yùn)算速度快,可并行性強(qiáng),且功耗
    發(fā)表于 07-29 17:09

    自動(dòng)駕駛識(shí)別技術(shù)有哪些

    自動(dòng)駕駛的識(shí)別技術(shù)自動(dòng)駕駛系統(tǒng)中的重要組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。自動(dòng)駕駛識(shí)別
    的頭像 發(fā)表于 07-23 16:16 ?750次閱讀

    自動(dòng)駕駛的傳感器技術(shù)介紹

    自動(dòng)駕駛的傳感器技術(shù)自動(dòng)駕駛系統(tǒng)的核心組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。以下是對(duì)自動(dòng)駕駛傳感器
    的頭像 發(fā)表于 07-23 16:08 ?2386次閱讀

    深度學(xué)習(xí)在自動(dòng)駕駛中的關(guān)鍵技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,自動(dòng)駕駛技術(shù)作為其中的重要分支,正逐漸走向成熟。在自動(dòng)駕駛系統(tǒng)中,深度學(xué)習(xí)
    的頭像 發(fā)表于 07-01 11:40 ?824次閱讀

    如何提高自動(dòng)駕駛汽車感知模型的訓(xùn)練效率和GPU利用率

    由于采用了多攝像頭輸入和深度卷積骨干網(wǎng)絡(luò),用于訓(xùn)練自動(dòng)駕駛感知模型的 GPU 內(nèi)存占用很大。當(dāng)前減少內(nèi)存占用的方法往往會(huì)導(dǎo)致額外的計(jì)算開銷或工作負(fù)載的失衡。
    的頭像 發(fā)表于 04-29 09:12 ?947次閱讀
    如何提高<b class='flag-5'>自動(dòng)駕駛</b>汽車<b class='flag-5'>感知</b>模型的訓(xùn)練效率和GPU利用率

    未來已來,多傳感器融合感知自動(dòng)駕駛破局的關(guān)鍵

    可以引導(dǎo)本的攝像頭針對(duì)運(yùn)動(dòng)目標(biāo)做快速局部修正曝光(見下圖),以此實(shí)時(shí)獲取運(yùn)動(dòng)目標(biāo)的分辨細(xì)節(jié)特征,并將局部修正曝光的圖像融合雷達(dá)數(shù)據(jù)傳輸至自動(dòng)駕駛系統(tǒng),避免撞擊危險(xiǎn)發(fā)生。 昱感微的融合感知
    發(fā)表于 04-11 10:26