娇妻被邻居灌满精H无码,91精品免费久久久,一本一久本久A久久精品综合

【導(dǎo)讀】MagicDrive可以細(xì)粒度生成高保真、多相機(jī)街景，可以隨意變換天氣、光照條件以及人物位置，海量自動(dòng)駕駛數(shù)據(jù)觸手可及！

在深度學(xué)習(xí)算法的應(yīng)用中，高質(zhì)量的數(shù)據(jù)是技術(shù)創(chuàng)新的關(guān)鍵驅(qū)動(dòng)力，尤其在自動(dòng)駕駛領(lǐng)域，獲取和標(biāo)注3D感知數(shù)據(jù)的成本不菲，對(duì)于許多研究者和開發(fā)者來說都是一個(gè)重大挑戰(zhàn)。

為此，來自香港中文大學(xué)、香港科技大學(xué)和華為諾亞方舟實(shí)驗(yàn)室的研究人員聯(lián)合提出了基于 Diffusion的3D自動(dòng)駕駛數(shù)據(jù)生成方法MagicDrive。

通過多種3D幾何條件的細(xì)粒度控制，MagicDrive在生成高保真多相機(jī)街景圖像的同時(shí)，還能夠支持多種下游感知任務(wù)的訓(xùn)練。

論文地址：https://arxiv.org/abs/2310.02601

項(xiàng)目主頁：https://gaoruiyuan.com/magicdrive/

Github: https://github.com/cure-lab/MagicDrive

?MagicDrive多樣化生成數(shù)據(jù)

MagicDrive是一個(gè)突破性的解決方案利用可控生成技術(shù)合成自動(dòng)駕環(huán)視相機(jī)視圖，生成更多樣化的自動(dòng)駕駛數(shù)據(jù)，為自動(dòng)駕駛場(chǎng)景仿真提供了新思路。

先來看一些MagicDrive的生成效果。

多視角下，前景和背景都能保持一致性：

可以一鍵轉(zhuǎn)雨天：

不止生成車，人、障礙物都能準(zhǔn)確控制位置：

還可以一鍵轉(zhuǎn)夜晚：

物體位置可以實(shí)現(xiàn)細(xì)粒度控制：

?關(guān)鍵問題：多種3D條件的編碼與注入

描述自動(dòng)駕駛場(chǎng)景的條件是多維度的，包括：相機(jī)參數(shù)、物體框、路面地圖以及對(duì)場(chǎng)景屬性的語言描述（比如天氣和時(shí)間）。如何將如此復(fù)雜的場(chǎng)景信息同時(shí)作為條件指導(dǎo)生成，是3D自動(dòng)駕駛街景數(shù)據(jù)合成的重點(diǎn)問題。

BEVGen[1]將3D幾何信息（路面和物體位置）都投影在BEV空間中，這會(huì)丟失全部高度信息，既無法控制物體高度/遮擋，也無法體現(xiàn)路面起伏；BEVControl[2]將3D幾何信息分別投影在相機(jī)視圖中，對(duì)于沒有高度信息的路面地圖而言，投影本身就是一個(gè)欠定義的問題，而且這種做法丟失了深度信息，同樣無法準(zhǔn)確控制遮擋。

3D幾何信息與不同2D投影（相機(jī)投影/BEV）控制的比較

MagicDrive在完整考慮這些控制條件的基礎(chǔ)上，首次實(shí)現(xiàn)3D幾何的直接控制。MagicDrive結(jié)合Diffusion Model進(jìn)行條件生成的優(yōu)勢(shì)，根據(jù)每個(gè)控制條件的形式，采用不同的方法對(duì)生成進(jìn)行控制。

MagicDrive的方法框架

具體來說，對(duì)于場(chǎng)景級(jí)別的信息（語言描述和相機(jī)參數(shù)）和物體框信息，由于他們具有可變長(zhǎng)的性質(zhì)，MagicDrive先使用不同的編碼器講輸入數(shù)據(jù)編碼成嵌入序列，然后使用交叉注意力模塊控制圖像生成過程；

對(duì)于路面地圖信息，BEV能夠很好地將路面表示成圖像的形式，因此，使用類似ControlNet[3]的額外編碼器分支，就能夠讓生成遵循路面地圖的條件。

刪繁就簡(jiǎn)：不同視角的一致性生成

多視角一致性是3D場(chǎng)景相機(jī)視圖生成的另一個(gè)重要要求。此前，已經(jīng)有一些工作探索了室內(nèi)場(chǎng)景中的多視角一致性約束方法，例如：MVDiffusion[5]和[6]，但室內(nèi)場(chǎng)景通常視角之間重疊較大，因此他們借助了不同的幾何先驗(yàn)來限制視角之間的關(guān)系。

對(duì)于自動(dòng)駕駛場(chǎng)景，不同相機(jī)之間重疊程度是有限的，因此并不需要過強(qiáng)的幾何約束。相反，在幾何條件足夠的情況下（即不同視角已經(jīng)有獨(dú)立的幾何條件信息），只需要讓不同視角的生成過程有信息交互，就能夠保證前景和背景的一致生成。

因此MagicDrive提出cross-view attention模塊，用于在各個(gè)視角的生成過程中與左右相鄰視角交換信息，確保了從多個(gè)視角看到的前景和背景是一致的，這大大提高了數(shù)據(jù)的真實(shí)性與可靠性。

Corss-view attention 模塊控制多視角的一致性

生成效果：在多個(gè)下游任務(wù)上提升明顯

用以真實(shí)圖像訓(xùn)練的感知模型評(píng)價(jià)生成模型產(chǎn)生的圖片，MagicDrive不僅可以在BEV分割任務(wù)上超過baseline，并且能夠直接支持3D物體檢測(cè)任務(wù)，體現(xiàn)出優(yōu)越的生成效果。

MagicDrive生成的圖片還可以直接用于數(shù)據(jù)增強(qiáng)，支持BEV分割和3D物體檢測(cè)任務(wù)，提升BEVFusion[6]和CVT[7]的性能。

除此之外，MagicDrive的多條件控制還可以實(shí)現(xiàn)場(chǎng)景、背景和前景的多層次街景圖像編輯，用來生成更多的新街景圖像。

更多評(píng)價(jià)結(jié)果與討論請(qǐng)參考原論文。

總結(jié)

總的來說，MagicDrive帶給我們一個(gè)全新的、高效的數(shù)據(jù)生成途徑。不僅成功解決了之街景生成中的3D幾何控制問題，而且提供了一種全新的方法，利用細(xì)粒度可控生成技術(shù)為3D自動(dòng)駕駛產(chǎn)生訓(xùn)練數(shù)據(jù)，生成數(shù)據(jù)的質(zhì)量和真實(shí)性向自動(dòng)駕駛的感知技術(shù)注入了新的活力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

模塊

模塊

+關(guān)注

關(guān)注
7

文章
2726

瀏覽量
47611
3D

3D

+關(guān)注

關(guān)注
9

文章
2899

瀏覽量
107701
自動(dòng)駕駛

自動(dòng)駕駛

+關(guān)注

關(guān)注
784

文章
13897

瀏覽量
166696

原文標(biāo)題：自動(dòng)駕駛數(shù)據(jù)不用愁！港中文等發(fā)布MagicDrive：日夜、雨晴、多視角全覆蓋，人、物位置隨意變更

文章出處：【微信號(hào)：CVer，微信公眾號(hào)：CVer】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

【Tisan物聯(lián)網(wǎng)申請(qǐng)】戶外集雨器

申請(qǐng)理由：由于傳統(tǒng)的采雨都是人工的，既費(fèi)時(shí)費(fèi)力，而且效率不高，基于單片機(jī)控制的集雨器不僅能自動(dòng)采集雨水，而且還自動(dòng)換瓶，省時(shí)省力。項(xiàng)目描述：由于有多個(gè)采樣地點(diǎn)，同時(shí)控制集雨板的開合不太容易，基于

發(fā)表于 11-16 11:17

工廠車間無線WiFi覆蓋解決方案

都是在一個(gè)AP覆蓋下，手持設(shè)備和移動(dòng)終端隨意移動(dòng)，不會(huì)出現(xiàn)跨AP切換斷線或延時(shí)的問題，真正意義上的零延時(shí)零切換。扇區(qū)覆蓋的缺點(diǎn)：　　適合于全敞開的車間、倉庫、貨場(chǎng)，中間不能有橫墻或隔斷

發(fā)表于 08-11 17:15

定制段碼液晶屏如何確認(rèn)視角反向？

的是視角就是有LCD顯示屏安裝在儀器上的位置來確定的，（如：計(jì)算器一般是放在桌子上或握在手上，這種做6:00視角比較好，有些LCD液晶屏是安裝在低于人

發(fā)表于 07-08 09:13

G104XVN01.0?友達(dá)10.4寸高清全視角工業(yè)顯示屏

G104XVN01.0?友達(dá)10.4寸高清全視角工業(yè)顯示屏一、友達(dá)10.4寸液晶屏G104XVN01.0應(yīng)用詳情品牌：友達(dá)型號(hào)名稱：G104XVN01.0屏幕類型：a-Si TFT-LCD , 液晶

發(fā)表于 03-16 10:02

中文C語言編程玩轉(zhuǎn)物聯(lián)網(wǎng)華為鴻蒙Hi3861開發(fā)-基礎(chǔ)案例合集

繼《一套支持中文C語言編程的鴻蒙Hi3861智能硬件開發(fā)套件》發(fā)布后，中文C語言編程玩轉(zhuǎn)物聯(lián)網(wǎng)華為鴻蒙Hi3861開發(fā)，多個(gè)基礎(chǔ)案例視頻，包括交通紅綠燈、數(shù)碼管、光電開關(guān)、手指?jìng)蓽y(cè)心率

發(fā)表于 05-08 23:50

晴雨指示器電路圖

發(fā)表于 04-13 09:26 ?810次閱讀

<b class='flag-5'>晴</b><b class='flag-5'>雨</b>指示器電路圖

霓虹燈晴雨控制器電路圖

發(fā)表于 06-16 15:46 ?985次閱讀

霓虹燈<b class='flag-5'>晴</b><b class='flag-5'>雨</b>控制器電路圖

熵加權(quán)多視角核K-means算法

在基于視角加權(quán)的多視角聚類中，每個(gè)視角的權(quán)重取值對(duì)聚類結(jié)果的精度都有著重要的影V向。針對(duì)此問題，提出熵加權(quán)多

發(fā)表于 12-17 09:57 ?1次下載

基于視角相容性的多視角數(shù)據(jù)缺失補(bǔ)全

隨著信息技術(shù)的快速發(fā)展，現(xiàn)實(shí)生活中不斷涌現(xiàn)出大量的多視角數(shù)據(jù)，由此應(yīng)運(yùn)而生的多視角學(xué)習(xí)已成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)．然而，在數(shù)據(jù)獲取過程中，由于收集的難度、高額成本或設(shè)備故障

發(fā)表于 12-18 10:46 ?1次下載

基于多源數(shù)據(jù)融合高時(shí)空分辨率晴雨分類

高時(shí)空分辨率晴雨分類與交通、旅游、農(nóng)業(yè)灌溉及人們?nèi)粘３鲂卸济芮邢嚓P(guān)，然而天有不測(cè)風(fēng)云，東邊日頭西邊雨。準(zhǔn)確的高時(shí)空分辨率晴雨分類是極具挑戰(zhàn)性

發(fā)表于 12-25 11:48 ?0次下載

基于<b class='flag-5'>多</b>源數(shù)據(jù)融合高時(shí)空分辨率<b class='flag-5'>晴</b><b class='flag-5'>雨</b>分類

晴雨瓶制作方法

感覺淘寶賣的晴雨瓶不值那個(gè)價(jià)格，今天上午用白熾燈泡做了一個(gè)試試看效果。

發(fā)表于 09-14 14:08 ?4491次閱讀

北京聯(lián)通實(shí)現(xiàn)了五個(gè)5G全覆蓋

今年全國兩會(huì)，北京聯(lián)通實(shí)現(xiàn)了“五個(gè)5G全覆蓋”，滿足 “四個(gè)多”新媒體需求，即：兩會(huì)會(huì)場(chǎng)區(qū)域5G全覆蓋；大會(huì)堂部長(zhǎng)通道/媒體展示廳/金色大廳

發(fā)表于 03-19 13:41 ?1588次閱讀

如何實(shí)現(xiàn)大區(qū)域物聯(lián)網(wǎng)的低成本全覆蓋

低功耗廣域網(wǎng)（LPWAN）技術(shù)是近年國際上一種革命性的物聯(lián)網(wǎng)接入技術(shù)，具有遠(yuǎn)距離、低功耗、低運(yùn)維成本等特點(diǎn)，可以真正實(shí)現(xiàn)大區(qū)域物聯(lián)網(wǎng)低成本全覆蓋

發(fā)表于 07-21 10:11 ?4379次閱讀

行業(yè)首款RISC-V物聯(lián)網(wǎng)安全芯片“港華芯”正式發(fā)布

近日，由港華集團(tuán)主辦的“‘港華芯’產(chǎn)品發(fā)布會(huì)暨合作伙伴戰(zhàn)略合作發(fā)布會(huì)”隆重舉行。賽昉科技、微五科技、紫光展銳、海思、移遠(yuǎn)通信、中移物聯(lián)、中國

發(fā)表于 12-15 10:04 ?916次閱讀

雨洪水資源管理遠(yuǎn)程監(jiān)控平臺(tái)

數(shù)據(jù)必將耗費(fèi)大量人力物力。通過EMCP物聯(lián)網(wǎng)云平臺(tái)搭建的雨洪水遠(yuǎn)程監(jiān)測(cè)預(yù)警系統(tǒng)，實(shí)現(xiàn)以水庫（河道）水雨情信息“全要素、全量程、全覆蓋”自動(dòng)

發(fā)表于 11-06 17:17 ?562次閱讀

搜索歷史

港中文等發(fā)布MagicDrive：日夜、雨晴、多視角全覆蓋，人、物位置隨意變更

評(píng)論

【Tisan物聯(lián)網(wǎng)申請(qǐng)】戶外集雨器

工廠車間無線WiFi覆蓋解決方案

定制段碼液晶屏如何確認(rèn)視角反向？

G104XVN01.0?友達(dá)10.4寸高清全視角工業(yè)顯示屏

中文C語言編程玩轉(zhuǎn)物聯(lián)網(wǎng)華為鴻蒙Hi3861開發(fā)-基礎(chǔ)案例合集

晴雨指示器電路圖

霓虹燈晴雨控制器電路圖

熵加權(quán)多視角核K-means算法

基于視角相容性的多視角數(shù)據(jù)缺失補(bǔ)全

基于多源數(shù)據(jù)融合高時(shí)空分辨率晴雨分類

晴雨瓶制作方法

北京聯(lián)通實(shí)現(xiàn)了五個(gè)5G全覆蓋

如何實(shí)現(xiàn)大區(qū)域物聯(lián)網(wǎng)的低成本全覆蓋

行業(yè)首款RISC-V物聯(lián)網(wǎng)安全芯片“港華芯”正式發(fā)布

雨洪水資源管理遠(yuǎn)程監(jiān)控平臺(tái)

搜索歷史

港中文等發(fā)布MagicDrive：日夜、雨晴、多視角全覆蓋，人、物位置隨意變更

評(píng)論

港中文等發(fā)布MagicDrive：日夜、雨晴、多視角全覆蓋，人、物位置隨意變更