0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA拿下CVPR 2023 3D Occupancy預(yù)測(cè)第一名!

CVer ? 來(lái)源:機(jī)器之心 ? 2023-06-21 14:04 ? 次閱讀

自動(dòng)駕駛中的三維占用預(yù)測(cè)難題,一場(chǎng)比賽給出了解決方案。

道路錯(cuò)綜復(fù)雜、交通工具形態(tài)各異、行人密集,這是當(dāng)前城市道路交通的現(xiàn)狀,也是自動(dòng)駕駛領(lǐng)域面臨的現(xiàn)實(shí)挑戰(zhàn)。為了應(yīng)對(duì)這一挑戰(zhàn),感知和理解三維環(huán)境至關(guān)重要。

在傳統(tǒng)的三維物體檢測(cè)任務(wù)中,前景物體通常由三維邊界框表示。然而,這種方法存在一些弊端,一方面,現(xiàn)實(shí)世界的物體幾何形狀非常復(fù)雜,無(wú)法用簡(jiǎn)單的三維框表示;另一方面,這種方法容易忽略背景元素的感知。對(duì)于實(shí)現(xiàn)全面的 L4/L5 自動(dòng)駕駛,傳統(tǒng)的三維感知方法是遠(yuǎn)遠(yuǎn)不夠的。

最近,端到端自動(dòng)駕駛研討會(huì) (End-to-End Autonomous Driving Workshop) 聯(lián)合視覺(jué)中心自動(dòng)駕駛研討會(huì) (Vision-Centric Autonomous Driving Workshop) 在 CVPR 2023 上舉辦了自動(dòng)駕駛挑戰(zhàn)賽,其中就包括三維占用預(yù)測(cè)(3D occupancy prediction)賽道。

dab614dc-0ff1-11ee-962d-dac502259ad0.png

圖 1 CVPR2023 自動(dòng)駕駛挑戰(zhàn)賽

三維占用預(yù)測(cè)是自動(dòng)駕駛領(lǐng)域的新興任務(wù),要求對(duì)車(chē)輛行駛場(chǎng)景進(jìn)行細(xì)粒度建模,對(duì)于實(shí)現(xiàn)自動(dòng)駕駛的通用感知能力有著重要意義。比賽提供基于 nuScenes 數(shù)據(jù)集的大規(guī)模占用預(yù)測(cè)評(píng)估基準(zhǔn),對(duì)三維空間進(jìn)行體素化表示,并在三維占用任務(wù)的基礎(chǔ)上結(jié)合兩項(xiàng)新任務(wù):估計(jì)三維空間中體素的占據(jù)狀態(tài)和語(yǔ)義信息。整個(gè)任務(wù)旨在在給定多視角圖像的情況下對(duì)三維空間進(jìn)行密集預(yù)測(cè)。

本次比賽是三維占用感知領(lǐng)域的首個(gè)國(guó)際頂尖權(quán)威賽事,吸引了業(yè)界和學(xué)界的廣泛關(guān)注。比賽共有 149 個(gè)團(tuán)隊(duì)參與角逐,其中包括來(lái)自小米汽車(chē),華為,42dot,??低?/u>的業(yè)界團(tuán)隊(duì),也有來(lái)自北京大學(xué),浙江大學(xué),中國(guó)科學(xué)院等科研院所的學(xué)術(shù)界團(tuán)隊(duì)。

最終,來(lái)自英偉達(dá) (NVIDIA) 和南京大學(xué)的團(tuán)隊(duì)在激烈的競(jìng)爭(zhēng)中脫穎而出,同時(shí)贏得了三維占用預(yù)測(cè)任務(wù)的冠軍和最佳創(chuàng)新獎(jiǎng)兩個(gè)重磅獎(jiǎng)項(xiàng)。下面我們來(lái)看一下冠軍團(tuán)隊(duì)的獲獎(jiǎng)方案。

冠軍方案

不同于以往比賽對(duì)于數(shù)據(jù)利用方面的限制,本次自動(dòng)駕駛比賽允許參賽者使用額外的開(kāi)源數(shù)據(jù)或者模型進(jìn)行數(shù)據(jù)驅(qū)動(dòng)算法的探索。因此在本次比賽中,英偉達(dá)和南大的研究人員在設(shè)計(jì)高效的模型結(jié)構(gòu)的基礎(chǔ)上,也在大模型的訓(xùn)練方面進(jìn)行了探索,將模型參數(shù)擴(kuò)展到 10 億量級(jí),達(dá)到過(guò)去常用 3D 感知模型的 10 倍以上。

憑借先進(jìn)的模型結(jié)構(gòu)設(shè)計(jì)和大模型強(qiáng)大的表征能力,該團(tuán)隊(duì)提出的方案 FB-OCC 實(shí)現(xiàn)了單模型 50+% mIoU 的出色性能,并最終取得了 54.19% mIoU 的最佳成績(jī)。

網(wǎng)絡(luò)架構(gòu)

FB-OCC 的主要?jiǎng)?chuàng)新在于使用了前向和后向投影相結(jié)合的三維空間建模方式。

如圖 2 所示,在前向投影過(guò)程中,參考 LSS 投影范式,F(xiàn)B-OCC 會(huì)根據(jù)每個(gè)像素的深度分布生成場(chǎng)景對(duì)應(yīng)的三維體素 (3D voxel) 表征。同時(shí),由于 LSS 范式生產(chǎn)的特征傾向于稀疏且不均勻,F(xiàn)B-OCC 引入反向投影機(jī)制來(lái)優(yōu)化稀疏的場(chǎng)景特征。

db056b86-0ff1-11ee-962d-dac502259ad0.png

圖 2 網(wǎng)絡(luò)架構(gòu)圖

此外,考慮到計(jì)算負(fù)擔(dān),F(xiàn)B-OCC 在方向投影的過(guò)程中會(huì)將場(chǎng)景特征壓縮為鳥(niǎo)瞰圖 (BEV) 表征,最后將三維體素表征和鳥(niǎo)瞰圖表征相結(jié)合。結(jié)合后得到的三維體素特征在后續(xù)還會(huì)經(jīng)過(guò)額外的體素編碼器 (Voxel encoder) 來(lái)增強(qiáng)特征感受野。

大規(guī)模模型探索

增加模型參數(shù)量是提升模型精度的最便捷的方式,但在三維視覺(jué)感知領(lǐng)域,研究人員發(fā)現(xiàn)更大規(guī)模的模型更容易產(chǎn)生過(guò)擬合現(xiàn)象,而現(xiàn)有主流感知模型的參數(shù)仍在 100M 量級(jí)。

在本次比賽中,F(xiàn)B-OCC 模型嘗試使用 10 億參數(shù)量級(jí)的 InternImage 主干網(wǎng)絡(luò),模型總體參數(shù)量是現(xiàn)有常用模型的十倍以上。大模型訓(xùn)練通常需要大數(shù)據(jù)與之匹配,但受限于自動(dòng)駕駛數(shù)據(jù)采集標(biāo)注的高昂成本,開(kāi)源的三維感知數(shù)據(jù)集并不足以支撐 10 億參數(shù)規(guī)模的模型。

針對(duì)這個(gè)痛點(diǎn),F(xiàn)B-OCC 使用了多輪預(yù)訓(xùn)練機(jī)制。由于可獲取的二維感知數(shù)據(jù)集遠(yuǎn)遠(yuǎn)豐富于三維感知數(shù)據(jù),F(xiàn)B-OCC 首先在大規(guī)模開(kāi)源數(shù)據(jù)集 Objects365 上進(jìn)行通用目標(biāo)檢測(cè)預(yù)訓(xùn)練。然后,如圖 3 所示,F(xiàn)B-OCC 引入深度和語(yǔ)義聯(lián)合預(yù)訓(xùn)練來(lái)建立二維感知和三維感知的橋梁。

db11d3c6-0ff1-11ee-962d-dac502259ad0.png

圖 3 深度和語(yǔ)義聯(lián)合預(yù)訓(xùn)練

為了生成語(yǔ)義分割標(biāo)簽,F(xiàn)B-OCC 還使用 Meta 的 SAM 模型來(lái)進(jìn)行自動(dòng)標(biāo)注,分別使用框提示和點(diǎn)提示來(lái)生成不同類(lèi)別的語(yǔ)義。經(jīng)過(guò)多輪預(yù)訓(xùn)練后,大規(guī)模模型在占用感知任務(wù)上可以避免嚴(yán)重的過(guò)擬合問(wèn)題。

實(shí)驗(yàn)結(jié)果

研究團(tuán)隊(duì)在實(shí)驗(yàn)中證明了 FB-OCC 的出色性能。如表 1 所示,F(xiàn)B-OCC 在 ResNet-50 主干網(wǎng)絡(luò)以及 256x704 分辨率的輸入圖像下,借助時(shí)序融合、深度監(jiān)督等技術(shù),模型性能從最初的 23.12% mIoU 增長(zhǎng)至 42.06% mIoU。

db467086-0ff1-11ee-962d-dac502259ad0.png

表 1 小規(guī)模模型的消融實(shí)驗(yàn)結(jié)果

為了獲得更好的精度,F(xiàn)B-OCC 使用了更大參數(shù)量的模型。如表 2 所示,在 400M 的模型規(guī)模下,F(xiàn)B-OCC 獲得了單模型 50+% mIoU 的效果。借助 InternImage 主干網(wǎng)絡(luò),10 億參數(shù)量級(jí)的模型進(jìn)一步取得了 52.79% 的極佳效果。

db921b30-0ff1-11ee-962d-dac502259ad0.png

表 2 不同模型規(guī)模下的效果

最終,F(xiàn)B-OCC 多個(gè)模型的集成結(jié)果取得了目前測(cè)試集上最高的準(zhǔn)確率 ——54.19%,贏得了比賽的冠軍并被授予最佳創(chuàng)新獎(jiǎng)。FB-OCC 為自動(dòng)駕駛中復(fù)雜的三維占用預(yù)測(cè)問(wèn)題貢獻(xiàn)了新的思路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5002

    瀏覽量

    103233
  • 三維
    +關(guān)注

    關(guān)注

    1

    文章

    510

    瀏覽量

    29000
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13848

    瀏覽量

    166579

原文標(biāo)題:NVIDIA拿下CVPR 2023 3D Occupancy預(yù)測(cè)第一名!

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    祝賀 | 鵬城實(shí)驗(yàn)室開(kāi)源 EDA 團(tuán)隊(duì)勇奪 ICCAD 競(jìng)賽第一名

    的 iEDA 3Dplacer 團(tuán)隊(duì)獲得了該項(xiàng)賽事三大賽道之第一名。本屆 CAD Contest@ICCAD 算法競(jìng)賽共有來(lái)自國(guó)內(nèi)外知名高校與研究機(jī)構(gòu)的166 支隊(duì)伍參與,如東京大學(xué)、臺(tái)灣大學(xué)
    發(fā)表于 12-13 18:29

    口碑最好的國(guó)產(chǎn)手機(jī),華為mate9排第五!第一名你認(rèn)可嗎!

    近日,安兔兔發(fā)布了2017年1月安卓手機(jī)好評(píng)TOP10,從發(fā)布的榜單來(lái)看,基本都是近期比較熱門(mén)的手機(jī),這里就為大家盤(pán)點(diǎn)下。第一名:小米MIX第二/三3/
    發(fā)表于 02-13 11:57 ?7168次閱讀

    三星認(rèn)為自家手機(jī)才是手機(jī)拍照的第一名

    昨晚華為發(fā)布的P30 Pro手機(jī)登上DxOMark(以下簡(jiǎn)稱(chēng)DxO)后置拍照排行榜第一名的位置。三星對(duì)此表示不服,今天三星官方微博將Galaxy S10+ DxO前置拍照得分和后置得分加在起,總分超過(guò)華為了P30 Pro,他們認(rèn)為自己才是手機(jī)拍照
    發(fā)表于 03-28 09:42 ?631次閱讀

    iPhone 11依舊占據(jù)手機(jī)銷(xiāo)量的第一名

    最近看到雙11戰(zhàn)況,好像最賣(mài)力的品牌就是蘋(píng)果了,因?yàn)閕Phone 11直牢牢占據(jù)了手機(jī)銷(xiāo)量的第一名,4999元不占優(yōu)勢(shì)就4799元,大有舍我其誰(shuí)的架勢(shì)。而在其之后,都是1000多元的性?xún)r(jià)比手機(jī)。
    的頭像 發(fā)表于 11-10 10:17 ?2085次閱讀

    五菱宏光mini EV以2萬(wàn)輛的銷(xiāo)量奪回國(guó)內(nèi)新能源汽車(chē)市場(chǎng)銷(xiāo)量第一名

    10月份公布的新能源汽車(chē)銷(xiāo)量數(shù)據(jù)顯示,五菱宏光mini EV銷(xiāo)量高達(dá)20631輛,高居國(guó)內(nèi)新能源汽車(chē)銷(xiāo)量第一名,其銷(xiāo)量比第二的特斯拉model3高近七成。 特斯拉model3自從去年
    的頭像 發(fā)表于 11-16 15:24 ?3114次閱讀

    小米電視2020年出貨量位列國(guó)內(nèi)第一名

    昨天上午,小米電視通過(guò)官方微博宣布,小米電視2020年出貨量位列國(guó)內(nèi)第一名,并連續(xù)2年穩(wěn)居中國(guó)出貨第一名。
    的頭像 發(fā)表于 02-23 09:30 ?5330次閱讀

    Python能否成為編程語(yǔ)言榜單的第一名?

    Python 在不久的將來(lái)或?qū)⒊紺語(yǔ)言成為榜單的第一名
    的頭像 發(fā)表于 06-15 09:31 ?1828次閱讀
    Python能否成為編程語(yǔ)言榜單的<b class='flag-5'>第一名</b>?

    中國(guó)芯片第一名是誰(shuí)

    在中國(guó)比較厲害的芯片公司有華為海思、匯頂科技、比特大陸、清華紫光、中興微電子等,那么中國(guó)芯片第一名是誰(shuí)?
    的頭像 發(fā)表于 12-16 17:08 ?6w次閱讀

    京東618會(huì)議平板榜,新銳品牌會(huì)參謀(leaderhub)第一名

    京東618會(huì)議平板榜,新銳互聯(lián)網(wǎng)爆款品牌會(huì)參謀細(xì)分品類(lèi)多項(xiàng)第一名 京東618巔峰決戰(zhàn)已經(jīng)結(jié)束!各大廠商也拿出看家本領(lǐng),毫不吝嗇地發(fā)放各種福利、優(yōu)惠,只為在被譽(yù)為“消費(fèi)風(fēng)向標(biāo)”的京東排行榜爆發(fā),拿下
    的頭像 發(fā)表于 06-21 18:52 ?2749次閱讀

    NVIDIA 3D MoMa:基于2D圖像創(chuàng)建3D物體

    可逆渲染流程 NVIDIA 3D MoMa 將于本周在新奧爾良舉行的計(jì)算機(jī)視覺(jué)和模式識(shí)別會(huì)議 CVPR 上亮相。
    的頭像 發(fā)表于 06-23 11:00 ?1306次閱讀

    NVIDIA Research 在 CVPR 上贏得自動(dòng)駕駛挑戰(zhàn)賽并獲得創(chuàng)新獎(jiǎng)

    新研究成果帶來(lái)實(shí)現(xiàn)安全自動(dòng)駕駛系統(tǒng)所需的先進(jìn) 3D Occupancy 預(yù)測(cè)。 NVIDIA 以自動(dòng)駕駛開(kāi)發(fā)大賽 3D
    的頭像 發(fā)表于 08-24 17:10 ?488次閱讀
    <b class='flag-5'>NVIDIA</b> Research 在 <b class='flag-5'>CVPR</b> 上贏得自動(dòng)駕駛挑戰(zhàn)賽并獲得創(chuàng)新獎(jiǎng)

    華潤(rùn)微電子以第一名的成績(jī)榮獲新吳區(qū)區(qū)長(zhǎng)質(zhì)量獎(jiǎng)

    近日,無(wú)錫高新區(qū)(新吳區(qū))召開(kāi)2023年度高質(zhì)量發(fā)展總結(jié)暨2024年工作推進(jìn)會(huì),會(huì)議隆重表彰了新吳區(qū)區(qū)長(zhǎng)質(zhì)量獎(jiǎng)單位,華潤(rùn)微電子以第一名的成績(jī)榮獲新吳區(qū)區(qū)長(zhǎng)質(zhì)量獎(jiǎng)。
    的頭像 發(fā)表于 04-07 09:19 ?671次閱讀
    華潤(rùn)微電子以<b class='flag-5'>第一名</b>的成績(jī)榮獲新吳區(qū)區(qū)長(zhǎng)質(zhì)量獎(jiǎng)

    潤(rùn)和軟件連續(xù)四年蟬聯(lián)數(shù)字業(yè)務(wù)類(lèi)解決方案市場(chǎng)第一名

    ,連續(xù)四年蟬聯(lián)數(shù)字業(yè)務(wù)類(lèi)解決方案市場(chǎng)第一名。在細(xì)分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場(chǎng)持續(xù)保持第一名,數(shù)字銀行解決方案子市場(chǎng)穩(wěn)居第二,開(kāi)放銀行解決方案子市場(chǎng)上升至第三。 ? 數(shù)字業(yè)務(wù)類(lèi)
    的頭像 發(fā)表于 07-31 10:10 ?602次閱讀

    軟通動(dòng)力榮獲2023年中國(guó)IT服務(wù)市場(chǎng)第一名

    近日,賽迪顧問(wèn)最新發(fā)布《2023-2024年中國(guó)IT服務(wù)市場(chǎng)研究年度報(bào)告》。報(bào)告中,軟通動(dòng)力憑借在數(shù)字化轉(zhuǎn)型浪潮中卓越的數(shù)字化能力和表現(xiàn),持續(xù)領(lǐng)跑IT服務(wù)市場(chǎng),位列2023年中國(guó)IT服務(wù)市場(chǎng)第一名
    的頭像 發(fā)表于 07-31 10:18 ?461次閱讀

    蔚來(lái)獲得CACSI車(chē)型滿(mǎn)意度和售后服務(wù)滿(mǎn)意度第一名

    近日,由中國(guó)質(zhì)量協(xié)會(huì)發(fā)布的2024年中國(guó)新能源汽車(chē)用戶(hù)滿(mǎn)意度測(cè)評(píng)結(jié)果(CACSI)出爐。蔚來(lái)ET5T榮獲純電動(dòng)中型轎車(chē)滿(mǎn)意度第一名,蔚來(lái)品牌榮獲售后服務(wù)滿(mǎn)意度第一名。蔚來(lái)已連續(xù)兩年獲得CACSI車(chē)型滿(mǎn)意度和售后服務(wù)滿(mǎn)意度第一名。
    的頭像 發(fā)表于 12-06 17:19 ?871次閱讀