0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于自動駕駛的時空融合激光雷達地點識別算法SeqOT

3D視覺工坊 ? 來源:計算機視覺工坊 ? 作者:馬君驛 ? 2022-12-09 10:01 ? 次閱讀

論文作者:Junyi Ma, Xieyuanli Chen, Jingyi Xu, Guangming Xiong?

論文來源:IEEE Transactions on Industrial Electronics

1、摘要

在本文中,作者在其原有工作OverlapTransformer (OT)的基礎上,提出了一種用于自動駕駛的時空融合激光雷達地點識別算法SeqOT。SeqOT以多幀激光雷達數(shù)據(jù)作為輸入,使用端到端的方式直接為序列化數(shù)據(jù)提取全局描述子,用以快速的地點識別檢索。SeqOT采用多尺度Transformer結(jié)構(gòu)對單幀高階特征與多幀高階特征進行增強和融合,并使用池化結(jié)構(gòu)對多幀子描述子進行降維,顯著提升地點識別描述子特異性和實時性。此外,SeqOT具有yaw角旋轉(zhuǎn)不變和激光序列順序不變的結(jié)構(gòu),進一步提高自動駕駛車輛多角度地點識別的準確率。試驗結(jié)果表明,SeqOT在長、短時間跨度數(shù)據(jù)集上均具有很好的識別性能,且其運行速度快于激光雷達幀率,適用于實時運行的自動駕駛車輛。

2、主要工作與貢獻

本文的主要貢獻是一個端到端的地點識別神經(jīng)網(wǎng)絡,它利用連續(xù)的range image實現(xiàn)可靠的長期地點識別。受益于所提出的yaw角旋轉(zhuǎn)不變結(jié)構(gòu),SeqOT對視點變化和多幀激光雷達數(shù)據(jù)的輸入順序具有較強的魯棒性,因此即使在自動駕駛車輛以相反方向行駛時也能實現(xiàn)可靠的地點識別。SeqOT利用多尺度Transformer模塊來融合序列化激光雷達數(shù)據(jù)的時空信息,通過增強單幀內(nèi)部特征的關(guān)聯(lián)與多幀間特征的關(guān)聯(lián),增強地點描述子特異性,進而提升地點識別精度。

3、算法流程

38896004-775f-11ed-8abf-dac502259ad0.png

圖1 SeqOT算法結(jié)構(gòu)

SeqOT由單幀編碼模塊、多幀編碼模塊,以及池化模塊組合而成。如圖1所示,首先將多幀三維激光點云通過球面投影轉(zhuǎn)換為多幀二維range image,然后將各幀range image輸入到單幀編碼模塊中,分別進行空間維度的壓縮和通道維度的擴張,再利用單幀Transformer模塊進行特征圖的特異性增強,然后將特異性增強后的結(jié)果與增強前的結(jié)果進行通道維度上的拼接。以上操作均對序列化激光信息中的單幀數(shù)據(jù)分別進行操作。接下來,將單幀編碼模塊輸出的特征輸入到多幀編碼模塊中,在將相鄰幀特征進行拼接后,輸入到多幀Transformer模塊進行多幀信息的高階特征融合與增強,然后將融合后的結(jié)果輸入到NetVLAD結(jié)構(gòu)中生成一系列維度為1x256的子描述子向量。池化模塊將此輸入激光序列中的全部子描述子進行池化壓縮,為輸入激光序列生成最終的1x256全局描述子向量。

球面投影與yaw角旋轉(zhuǎn)等變性

SeqOT使用序列化range image作為輸入,并充分利用其yaw角旋轉(zhuǎn)等變性。一個三維激光點(x, y, z),通過如下公式就可以投影至一個二維的圖像像素(u, v),這就是球面投影生成range image的過程。range image上的每個像素點都代表激光點的距離信息。

389cf970-775f-11ed-8abf-dac502259ad0.png

range image本身具備yaw角旋轉(zhuǎn)等變性,即一幀激光點云相對于z軸的旋轉(zhuǎn)等價于本幀range image的平移。圖2展示了yaw角旋轉(zhuǎn)等變的簡單示例。

38b1ce36-775f-11ed-8abf-dac502259ad0.png

圖2 yaw角旋轉(zhuǎn)等變性示例

得益于三維點云繞z軸的旋轉(zhuǎn)等價于range image的平移,SeqOT后續(xù)的結(jié)構(gòu)能夠輸出一系列yaw角旋轉(zhuǎn)等變的中間特征圖,進而最終將yaw角旋轉(zhuǎn)等變性轉(zhuǎn)化為yaw角旋轉(zhuǎn)不變性,輸出不受視點變化影響的全局描述子,從而保證多角度地點識別的可行性。

單幀編碼模塊

單幀編碼模塊對輸入序列激光幀的每一幀單獨進行高階特征提取?;诖饲暗墓ぷ鱗1],單幀編碼模塊使用了與OverlapTransformer相似的OverlapNetLeg對range image進行高度方向的壓縮與通道維度的擴張。而后的單幀Transformer模塊對OverlapNetLeg的輸出進行特異性增強,即增強單幀激光內(nèi)部不同特征之間的關(guān)聯(lián)。增強后的特征與增強前的特征進行拼接,得到y(tǒng)aw角旋轉(zhuǎn)等變的中間特征,輸入到后續(xù)的多幀編碼模塊。

多幀編碼模塊與池化模塊

多幀編碼模塊將連續(xù)幀經(jīng)過單幀編碼模塊輸出的序列化高階特征進行初步融合,池化模塊則對初步融合的特征進行描述子級的聚合,最終為序列化輸入計算地點識別描述子。在多幀編碼模塊中,首先將相鄰三幀點云對應的單幀編碼模塊的輸出進行拼接,構(gòu)成更長的特征編碼,輸入至多幀Transformer模塊,對幀間特征關(guān)聯(lián)進行增強,實現(xiàn)多幀信息的融合。序列化信息融合后的特征輸入至NetVLAD結(jié)構(gòu)中,提取一系列子描述子。池化模塊最終將序列子描述子進行聚合,生成一維地點識別全局描述子。由于結(jié)構(gòu)中使用了具有順序不變性質(zhì)的NetVLAD結(jié)構(gòu)與GeM池化結(jié)構(gòu),因此最終輸出的全局描述子具備yaw角旋轉(zhuǎn)不變性和激光序列順序不變性,示例如圖3所示,相關(guān)證明詳見論文。

38fadb3a-775f-11ed-8abf-dac502259ad0.png

圖3 全局描述子yaw角旋轉(zhuǎn)不變性示例

基于overlap的訓練

與此前工作[1]類似,SeqOT利用基于overlap劃分的數(shù)據(jù)集進行訓練。利用overlap作為label進行訓練的理念在OverlapNet論文[2]中有所闡述。訓練過程采用對比學習的思路,對于一幀query點云,同時向SeqOT輸入本幀點云對應的序列激光幀、以及它的kp個正樣本序列和kn個負樣本序列?;趏verlap的triplet loss函數(shù)如下式所示。

3912427a-775f-11ed-8abf-dac502259ad0.png

使用overlap而不是點云之間的距離作為衡量正負樣本的基準,是因為overlap對于描述激光點云相似度來說是一個更為自然的方式;此外,點云間的overlap對應了后續(xù)點云配準的質(zhì)量,因此基于overlap對是否為同一地點進行判斷更有益于后續(xù)算法的進行。此外,本工作面向自動駕駛車輛地點識別最常用場景——可重復性行駛環(huán)境,為低顯存的嵌入式設備提供了更為節(jié)省資源的兩步訓練策略,即第一步:將triplet loss作用于多幀編碼模塊輸出的子描述子,訓練池化模塊之前的模型,并保存訓練使用的子描述子;第二步:利用保存的子描述子作為輸入,將triplet loss作用于SeqOT最終輸出的全局描述子,訓練池化模塊。

4、實驗結(jié)果

毫末數(shù)據(jù)集上的地點識別結(jié)果

3924b3ce-775f-11ed-8abf-dac502259ad0.png

KITTI和MulRan數(shù)據(jù)集上的泛化性測試結(jié)果

3944d8a2-775f-11ed-8abf-dac502259ad0.png

396889fa-775f-11ed-8abf-dac502259ad0.png

輸入序列長度的對比試驗結(jié)果

398decae-775f-11ed-8abf-dac502259ad0.png

多尺度Transformer的消融試驗結(jié)果

39b77cea-775f-11ed-8abf-dac502259ad0.png

yaw角旋轉(zhuǎn)不變性驗證

39dd84ee-775f-11ed-8abf-dac502259ad0.png

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4771

    瀏覽量

    100777
  • 激光雷達
    +關(guān)注

    關(guān)注

    968

    文章

    3972

    瀏覽量

    189933
  • 自動駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13816

    瀏覽量

    166470

原文標題:SeqOT: 基于時空融合Transformer的SOTA地點識別算法,代碼開源(IEEE Trans2022)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Mobileye牽手Innoviz合作激光雷達用于其Mobile Drive平臺

    自動駕駛駕駛輔助技術(shù)的全球領(lǐng)導者Mobileye 和Innoviz今天宣布,Mobileye將在Mobileye Drive平臺上使用innoviz的激光雷達。這展示了Innoviz的激光雷
    的頭像 發(fā)表于 12-12 18:41 ?785次閱讀

    毫米波雷達激光雷達比較 毫米波雷達自動駕駛中的作用

    毫米波雷達激光雷達的比較 毫米波雷達激光雷達自動駕駛技術(shù)中常用的兩種傳感器,它們在多個方面存在顯著差異: 毫米波
    的頭像 發(fā)表于 12-03 17:27 ?468次閱讀

    激光雷達在SLAM算法中的應用綜述

    一、文章概述 1.1 摘 要 即時定位與地圖構(gòu)建(simultaneous localization and mapping,SLAM)是自主移動機器人和自動駕駛的關(guān)鍵 技術(shù)之一,而激光雷達則是支撐
    的頭像 發(fā)表于 11-12 10:30 ?592次閱讀
    <b class='flag-5'>激光雷達</b>在SLAM<b class='flag-5'>算法</b>中的應用綜述

    激光雷達技術(shù)的基于深度學習的進步

    信息。這使得激光雷達自動駕駛、無人機、機器人等領(lǐng)域具有廣泛的應用前景。 二、深度學習技術(shù)的發(fā)展 深度學習是機器學習的一個分支,它通過模擬人腦的神經(jīng)網(wǎng)絡結(jié)構(gòu)來處理和分析數(shù)據(jù)。近年來,深度學習技術(shù)在圖像識別、語音
    的頭像 發(fā)表于 10-27 10:57 ?386次閱讀

    激光雷達自動駕駛中的應用

    自動駕駛車輛提供必要的環(huán)境感知能力。 1. 激光雷達的工作原理 激光雷達系統(tǒng)通常包括一個激光發(fā)射器、一個接收器、一個旋轉(zhuǎn)的機械部件(用于掃描
    的頭像 發(fā)表于 10-27 10:34 ?556次閱讀

    激光雷達與純視覺方案,哪個才是自動駕駛最優(yōu)選?

    主要分為兩大類:激光雷達與視覺感知。激光雷達因其能夠提供精確的距離和形狀信息,在自動駕駛技術(shù)早期的開發(fā)中被廣泛應用。然而,隨著計算機視覺技術(shù)的飛速進步,基于攝像頭的純視覺感知方案逐漸嶄露頭角,并在某些場景
    的頭像 發(fā)表于 09-29 10:47 ?457次閱讀

    激光雷達濾光片:自動駕駛的“眼睛之選”

    隨著科技的飛速進步,激光雷達作為核心技術(shù),正以前所未有的態(tài)勢革新著我們的生活。從自動駕駛汽車的安全導航到智能機器人的敏銳環(huán)境感知,激光雷達的應用廣泛且深入,而濾光片則是其中不可或缺的一部分。
    的頭像 發(fā)表于 08-09 17:54 ?1854次閱讀
    <b class='flag-5'>激光雷達</b>濾光片:<b class='flag-5'>自動駕駛</b>的“眼睛之選”

    FPGA在自動駕駛領(lǐng)域有哪些應用?

    低,適合用于實現(xiàn)高效的圖像算法,如車道線檢測、交通標志識別等。 雷達和LiDAR處理:自動駕駛汽車通常會使用
    發(fā)表于 07-29 17:09

    自動駕駛汽車如何識別障礙物

    自動駕駛汽車識別障礙物是一個復雜而關(guān)鍵的過程,它依賴于多種傳感器和技術(shù)的協(xié)同工作。這些傳感器主要包括激光雷達(LiDAR)、雷達、攝像頭以及超聲波
    的頭像 發(fā)表于 07-23 16:40 ?1220次閱讀

    百度蘿卜快跑第六代無人車攜手禾賽AT128激光雷達,共筑自動駕駛新篇章

    自動駕駛技術(shù)的浪潮中,激光雷達作為感知層的核心部件,正引領(lǐng)著行業(yè)向更高水平的智能化邁進。近日,激光雷達領(lǐng)域的佼佼者禾賽科技宣布了一項重要合作——成為百度蘿卜快跑第六代無人車主激光雷達
    的頭像 發(fā)表于 07-19 16:21 ?1516次閱讀

    基于FPGA的激光雷達控制板

    激光雷達作為一種高精度、高性能的傳感技術(shù),廣泛應用于自動駕駛、機器人導航、工業(yè)自動化、無人機等應用領(lǐng)域。激光雷達控制板可以很好的滿足這些領(lǐng)域
    的頭像 發(fā)表于 05-28 08:11 ?685次閱讀
    基于FPGA的<b class='flag-5'>激光雷達</b>控制板

    阜時科技近期簽訂商用車自動駕駛全固態(tài)激光雷達批量訂單

    阜時科技戰(zhàn)略合作的某頭部激光雷達(LiDAR)公司,簽訂商用車自動駕駛全固態(tài)激光雷達批量訂單,近期將陸續(xù)交付。
    的頭像 發(fā)表于 04-11 14:08 ?1089次閱讀

    未來已來,多傳感器融合感知是自動駕駛破局的關(guān)鍵

    模態(tài)精準感知信息,使自動駕駛系統(tǒng)可以實時精準地感知道路上的各種狀況。 昱感微融合感知產(chǎn)品方案創(chuàng)新性地 將可見光攝像頭、紅外攝像頭以及4D毫米波雷達的探測數(shù)據(jù)在前端(數(shù)據(jù)獲取時)交互,將各傳感器的探測
    發(fā)表于 04-11 10:26

    激光雷達的應用場景

    激光雷達在多個領(lǐng)域中都有著廣泛的應用。以下是幾個主要的應用場景: 自動駕駛汽車:激光雷達自動駕駛汽車中起到了至關(guān)重要的作用。它可以幫助車輛檢測和
    的頭像 發(fā)表于 04-10 14:59 ?1352次閱讀

    硅基片上激光雷達的測距原理

    硅基光電子技術(shù)的發(fā)展可以將激光雷達系統(tǒng)發(fā)射模塊和接收模塊中分立的有源和無源器件集成在芯片上,使激光雷達體積更小、穩(wěn)定性更強、成本更低,推動激光雷達自動駕駛等領(lǐng)域的應用。
    發(fā)表于 04-08 10:23 ?591次閱讀
    硅基片上<b class='flag-5'>激光雷達</b>的測距原理