0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

3D視覺工坊

文章:432 被閱讀:67w 粉絲數(shù):22 關(guān)注數(shù):0 點(diǎn)贊數(shù):3

廣告

一種基于自然語言的軌跡修正方法

本研究提出了ExTraCT框架,利用自然語言進(jìn)行軌跡校正。該框架結(jié)合了大型語言模型(LLMs)用于自....
的頭像 3D視覺工坊 發(fā)表于 01-19 10:45 ?452次閱讀
一種基于自然語言的軌跡修正方法

標(biāo)注神器!AAAI'24最新:第一個(gè)交互式3D目標(biāo)檢測器!

考慮到3D點(diǎn)云的稀疏性質(zhì),iDet3D設(shè)計(jì)了負(fù)點(diǎn)擊模擬 (NCS),通過減少誤報(bào)預(yù)測來提高準(zhǔn)確性。還....
的頭像 3D視覺工坊 發(fā)表于 01-16 16:08 ?552次閱讀
標(biāo)注神器!AAAI'24最新:第一個(gè)交互式3D目標(biāo)檢測器!

新勢力第一車企誕生

另外,之前被網(wǎng)友調(diào)侃是“和諧號”車頭的理想MEGA也將于3月1日正式發(fā)布,比原定發(fā)布時(shí)間推遲了2個(gè)多....
的頭像 3D視覺工坊 發(fā)表于 01-14 10:00 ?1352次閱讀
新勢力第一車企誕生

頂刊TPAMI最全綜述!深入自動(dòng)駕駛BEV感知的魔力!

BEV感知的主要工作。在輸入模態(tài)下," L "為LiDAR," SC "為單相機(jī)," MC "為多相....
的頭像 3D視覺工坊 發(fā)表于 01-14 09:53 ?1398次閱讀
頂刊TPAMI最全綜述!深入自動(dòng)駕駛BEV感知的魔力!

自動(dòng)駕駛領(lǐng)域中,什么是BEV?什么是Occupancy?

BEV是Bird's Eye View 的縮寫,意為鳥瞰視圖。在自動(dòng)駕駛領(lǐng)域,BEV 是指....
的頭像 3D視覺工坊 發(fā)表于 01-13 09:41 ?3369次閱讀
自動(dòng)駕駛領(lǐng)域中,什么是BEV?什么是Occupancy?

基于NID-SLAM對神經(jīng)SLAM在動(dòng)態(tài)環(huán)境下的性能提升

TUM數(shù)據(jù)集上相機(jī)跟蹤結(jié)果,評價(jià)指標(biāo)是ATE RMSE [ m ] (↓),表示相關(guān)文獻(xiàn)未提及這個(gè)數(shù)....
的頭像 3D視覺工坊 發(fā)表于 01-12 11:24 ?417次閱讀
基于NID-SLAM對神經(jīng)SLAM在動(dòng)態(tài)環(huán)境下的性能提升

如何用3D Occupancy處理遮擋問題下的圖像匹配?

圖像匹配是各種視覺應(yīng)用中基本且關(guān)鍵的任務(wù),如同時(shí)定位與地圖構(gòu)建( Simultaneous Loca....
的頭像 3D視覺工坊 發(fā)表于 01-06 10:24 ?675次閱讀
如何用3D Occupancy處理遮擋問題下的圖像匹配?

基于神經(jīng)輻射場的自監(jiān)督多相機(jī)占用預(yù)測

本研究提出了一種自監(jiān)督的多攝相機(jī)3D占據(jù)預(yù)測方法,名為OccNeRF。該方法旨在解決無界場景的建模問....
的頭像 3D視覺工坊 發(fā)表于 01-02 14:53 ?475次閱讀
基于神經(jīng)輻射場的自監(jiān)督多相機(jī)占用預(yù)測

PatchMatch MVS求解器中深度估計(jì)的挑戰(zhàn)性問題

本文提出了一種全新的學(xué)習(xí)型PatchMatch MVS框架,DS-PMNet,并嵌入了DeformS....
的頭像 3D視覺工坊 發(fā)表于 01-02 09:25 ?619次閱讀
PatchMatch MVS求解器中深度估計(jì)的挑戰(zhàn)性問題

一種新的分割模型Stable-SAM

SAM、HQ-SAM、Stable-SAM在提供次優(yōu)提示時(shí)的性能比較,Stable-SAM明顯優(yōu)于其....
的頭像 3D視覺工坊 發(fā)表于 12-29 14:35 ?680次閱讀
一種新的分割模型Stable-SAM

手持RGB-D傳感器廣泛應(yīng)用的情況

DisCo方法:提出了一種基于擴(kuò)散的跨模態(tài)形狀重建方法。該方法利用三平面擴(kuò)散模型,結(jié)合部分點(diǎn)云和多視....
的頭像 3D視覺工坊 發(fā)表于 12-26 16:44 ?513次閱讀
手持RGB-D傳感器廣泛應(yīng)用的情況

NeRF何去何從?GS SLAM到底哪家強(qiáng)?來看看最新的開源方案!

Gaussian-SLAM提出了用于seeding和優(yōu)化Gaussian splats的新策略,以將....
的頭像 3D視覺工坊 發(fā)表于 12-26 16:38 ?1234次閱讀
NeRF何去何從?GS SLAM到底哪家強(qiáng)?來看看最新的開源方案!

陣列相機(jī)三維重建系統(tǒng),誰才是頂流?

該標(biāo)定過程僅需10分鐘,能夠自動(dòng)完成所有校準(zhǔn)步驟,無需人工干預(yù)。通過該標(biāo)定解決方案,相機(jī)模組能夠?qū)崿F(xiàn)....
的頭像 3D視覺工坊 發(fā)表于 12-19 15:14 ?1322次閱讀

一個(gè)用于6D姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

今天筆者將為大家分享NVIDIA的最新開源方案FoundationPose,是一個(gè)用于 6D 姿態(tài)估....
的頭像 3D視覺工坊 發(fā)表于 12-19 09:58 ?951次閱讀
一個(gè)用于6D姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

基于事件的視覺慣性速度計(jì)

這個(gè)速度計(jì)框架以事件數(shù)據(jù)和IMU測量作為輸入。圖中所示分別為:(a) 無人機(jī)在狹窄走廊中進(jìn)行攻擊行為....
的頭像 3D視覺工坊 發(fā)表于 12-18 15:43 ?458次閱讀
基于事件的視覺慣性速度計(jì)

單目深度估計(jì)開源方案分享

可以看一下單目深度估計(jì)效果,這個(gè)深度圖的分辨率是真的高,物體邊界分割的非常干凈!這里也推薦工坊推出的....
的頭像 3D視覺工坊 發(fā)表于 12-17 10:01 ?816次閱讀
單目深度估計(jì)開源方案分享

一種通過視圖合成增強(qiáng)預(yù)訓(xùn)練的2D擴(kuò)散模型的可擴(kuò)展技術(shù)

現(xiàn)有的3D物體檢測方法通常需要使用完全注釋的數(shù)據(jù)進(jìn)行訓(xùn)練,而使用預(yù)訓(xùn)練的語義特征可以帶來一些優(yōu)勢。
的頭像 3D視覺工坊 發(fā)表于 12-14 10:00 ?470次閱讀
一種通過視圖合成增強(qiáng)預(yù)訓(xùn)練的2D擴(kuò)散模型的可擴(kuò)展技術(shù)

三項(xiàng)SOTA!MasQCLIP:開放詞匯通用圖像分割新網(wǎng)絡(luò)

MasQCLIP在開放詞匯實(shí)例分割、語義分割和全景分割三項(xiàng)任務(wù)上均實(shí)現(xiàn)了SOTA,漲點(diǎn)非常明顯。這里....
的頭像 3D視覺工坊 發(fā)表于 12-12 11:23 ?822次閱讀
三項(xiàng)SOTA!MasQCLIP:開放詞匯通用圖像分割新網(wǎng)絡(luò)

放下你的PhotoShop!無限圖像編輯已開源!

我們知道擴(kuò)散模型生成圖像是通過反轉(zhuǎn)采樣來進(jìn)行的,重點(diǎn)是識別噪聲。LEDITS++從DDPM反演中提取....
的頭像 3D視覺工坊 發(fā)表于 12-10 10:09 ?898次閱讀
放下你的PhotoShop!無限圖像編輯已開源!

逼真到頭發(fā)絲,光線可調(diào),Meta推出實(shí)時(shí)3D頭像合成方法

2021 年,F(xiàn)acebook 將「元宇宙(metaverse)」作為公司主營業(yè)務(wù),并將公司名稱更改....
的頭像 3D視覺工坊 發(fā)表于 12-10 10:02 ?880次閱讀
逼真到頭發(fā)絲,光線可調(diào),Meta推出實(shí)時(shí)3D頭像合成方法

深度學(xué)習(xí)神器DYnet++:輕松駕馭復(fù)雜自由曲面,3D測量無難度!

利用深度學(xué)習(xí)網(wǎng)絡(luò)模型DYnet++從單個(gè)復(fù)合圖案中獲取相位信息。為了訓(xùn)練深度學(xué)習(xí)模型,作者使用了一個(gè)....
的頭像 3D視覺工坊 發(fā)表于 12-04 15:29 ?659次閱讀
深度學(xué)習(xí)神器DYnet++:輕松駕馭復(fù)雜自由曲面,3D測量無難度!

基于深度學(xué)習(xí)的三維重建技術(shù)

多視圖立體幾何(Multi-View Stereo,MVS)是計(jì)算機(jī)視覺中重要的研究領(lǐng)域,也是邁入三....
的頭像 3D視覺工坊 發(fā)表于 12-04 10:08 ?898次閱讀
基于深度學(xué)習(xí)的三維重建技術(shù)

怎么去處理視覺SLAM長期定位中的外觀變化和軌跡漂移呢?

服務(wù)機(jī)器人、巡檢機(jī)器人、自動(dòng)駕駛車輛等SLAM應(yīng)用,需要進(jìn)行長時(shí)間的定位和導(dǎo)航,但是可能會(huì)遇到很多光....
的頭像 3D視覺工坊 發(fā)表于 12-04 10:01 ?814次閱讀
怎么去處理視覺SLAM長期定位中的外觀變化和軌跡漂移呢?

一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

提出了一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng),該系統(tǒng)由完整的前端和后....
的頭像 3D視覺工坊 發(fā)表于 11-29 10:35 ?615次閱讀
一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

香港大學(xué)最新提出!實(shí)現(xiàn)超現(xiàn)實(shí)的人類圖像生成:HyperHuman

最后,為了進(jìn)一步提高視覺質(zhì)量,我們提出了一種結(jié)構(gòu)引導(dǎo)細(xì)化器來組合預(yù)測條件,以更詳細(xì)地生成更高分辨率。....
的頭像 3D視覺工坊 發(fā)表于 11-27 16:03 ?758次閱讀
香港大學(xué)最新提出!實(shí)現(xiàn)超現(xiàn)實(shí)的人類圖像生成:HyperHuman

基于RGM的魯棒且通用的特征匹配

在一對圖像中尋找匹配的像素是具有各種應(yīng)用的基本計(jì)算機(jī)視覺任務(wù)。由于光流估計(jì)和局部特征匹配等不同任務(wù)的....
的頭像 3D視覺工坊 發(fā)表于 11-27 11:32 ?553次閱讀
基于RGM的魯棒且通用的特征匹配

英偉達(dá)聯(lián)合多倫多大學(xué)最新提出用于高效神經(jīng)輻照場渲染的自適應(yīng)外殼!

分配樣本數(shù)量:根據(jù)場景的不同區(qū)域,分配不同數(shù)量的樣本來表示地面真實(shí)外觀。對于復(fù)雜的模糊表面,需要更多....
的頭像 3D視覺工坊 發(fā)表于 11-25 11:49 ?801次閱讀
英偉達(dá)聯(lián)合多倫多大學(xué)最新提出用于高效神經(jīng)輻照場渲染的自適應(yīng)外殼!

基于Transformer的可泛化人體表征設(shè)計(jì)方案

本文在ZJU-MoCap和H36M上進(jìn)行了泛化性實(shí)驗(yàn),結(jié)果如下圖所示。主要分為四個(gè)setting: ....
的頭像 3D視覺工坊 發(fā)表于 11-23 11:25 ?434次閱讀
基于Transformer的可泛化人體表征設(shè)計(jì)方案

一種在線激光雷達(dá)語義分割框架MemorySeg

本文提出了一種在線激光雷達(dá)語義分割框架MemorySeg,它利用三維潛在記憶來改進(jìn)當(dāng)前幀的預(yù)測。傳統(tǒng)....
的頭像 3D視覺工坊 發(fā)表于 11-21 10:48 ?605次閱讀
一種在線激光雷達(dá)語義分割框架MemorySeg

EmerNeRF:全面基于NeRF的自動(dòng)駕駛仿真框架,無需分割

在自動(dòng)駕駛中,感知、表示和重建動(dòng)態(tài)場景對于代理程序理解并與其環(huán)境進(jìn)行交互至關(guān)重要。
的頭像 3D視覺工坊 發(fā)表于 11-21 10:23 ?3405次閱讀
EmerNeRF:全面基于NeRF的自動(dòng)駕駛仿真框架,無需分割