0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

3D視覺工坊

文章:432 被閱讀:67w 粉絲數(shù):22 關(guān)注數(shù):0 點贊數(shù):3

廣告

IROS'23開源,nuScenes跟蹤第一!無需學(xué)習(xí)的超強多目標跟蹤!

Poly-MOT跟蹤效果的直接對比,也體現(xiàn)了文章的核心思想,就是為不同類別建立不同的運動模型。汽車使....
的頭像 3D視覺工坊 發(fā)表于 11-20 16:46 ?1603次閱讀
IROS'23開源,nuScenes跟蹤第一!無需學(xué)習(xí)的超強多目標跟蹤!

一種用于自主導(dǎo)航的具有擴展傳感器視場的自旋轉(zhuǎn)單驅(qū)動無人機

無人駕駛飛行器(UAV)在各種現(xiàn)實應(yīng)用中發(fā)揮著越來越重要的作用,例如搜索和救援、洞穴勘測、建筑測繪和....
的頭像 3D視覺工坊 發(fā)表于 11-17 09:42 ?767次閱讀
一種用于自主導(dǎo)航的具有擴展傳感器視場的自旋轉(zhuǎn)單驅(qū)動無人機

NeurlPS'23開源 | 首個!開放詞匯3D實例分割!

我們介紹了開放詞匯3D實例分割的任務(wù)。當(dāng)前的3D實例分割方法通常只能從訓(xùn)練數(shù)據(jù)集中標注的預(yù)定義的封閉....
的頭像 3D視覺工坊 發(fā)表于 11-14 15:53 ?656次閱讀
NeurlPS'23開源 | 首個!開放詞匯3D實例分割!

ECON:最新單圖穿衣人三維重建SOTA算法

深度學(xué)習(xí)、藝術(shù)家策劃的掃描和隱式功能(IF)的結(jié)合,使從圖像中創(chuàng)建詳細的、有衣的3D人體成為可能。然....
的頭像 3D視覺工坊 發(fā)表于 11-13 16:11 ?783次閱讀
ECON:最新單圖穿衣人三維重建SOTA算法

使用RayDF方法突破3D形狀重建方案

本文還引入了多視角一致性優(yōu)化模塊,以提高學(xué)習(xí)到的射線-表面距離場在不同視角下的一致性。通過在多個數(shù)據(jù)....
的頭像 3D視覺工坊 發(fā)表于 11-10 15:04 ?511次閱讀
使用RayDF方法突破3D形狀重建方案

177倍加速!NVIDIA最新開源 | GPU加速各種SDF建圖!

但最近,NVIDIA和ETHZ就聯(lián)合提出了nvblox,是一個使用GPU加速SDF建圖的庫。計算速度....
的頭像 3D視覺工坊 發(fā)表于 11-09 16:46 ?1178次閱讀
177倍加速!NVIDIA最新開源 | GPU加速各種SDF建圖!

CVPR2023 RobustNeRF: 從單張圖像生成3D形狀

在通常使用的nerf數(shù)據(jù)中,一個場景往往無法從同一視角捕捉多幅圖像,這使得數(shù)學(xué)建模干擾物變得困難。更....
的頭像 3D視覺工坊 發(fā)表于 11-09 16:35 ?946次閱讀
CVPR2023 RobustNeRF: 從單張圖像生成3D形狀

NeurlPS'23開源 | 大規(guī)模室外NeRF也可以實時渲染

神經(jīng)輻射場 (NeRF)是一種新穎的隱式三維重建方法,顯示出巨大的潛力,受到越來越多的關(guān)注。它能夠僅....
的頭像 3D視覺工坊 發(fā)表于 11-08 16:41 ?1025次閱讀
NeurlPS'23開源 | 大規(guī)模室外NeRF也可以實時渲染

上線一周就2.1k star!單張圖像直接轉(zhuǎn)為3D模型!

最大的好處就是可以直接利用Stable Diffusion這種經(jīng)過數(shù)十億張圖像訓(xùn)練過的2D擴散模型,....
的頭像 3D視覺工坊 發(fā)表于 11-06 16:13 ?1127次閱讀
上線一周就2.1k star!單張圖像直接轉(zhuǎn)為3D模型!

深度剖析點云配準中的數(shù)學(xué)基礎(chǔ)

但是這個方法同樣也存在缺點,即著名的萬向鎖(或萬向節(jié)死鎖)(Gimbal Lock)問題:在俯仰角為....
的頭像 3D視覺工坊 發(fā)表于 11-03 12:38 ?872次閱讀

第一個基于DETR的高質(zhì)量通用目標檢測方法

現(xiàn)有的DETR系列模型在非COCO數(shù)據(jù)集上表現(xiàn)較差,且預(yù)測框不夠準確。其主要原因是:DETR在檢測頭....
的頭像 3D視覺工坊 發(fā)表于 11-01 16:12 ?764次閱讀
第一個基于DETR的高質(zhì)量通用目標檢測方法

LOAM源代碼中坐標變換部分的詳細講解

本系列文章將對LOAM源代碼進行講解,在講解過程中,涉及到論文中提到的部分,會結(jié)合論文以及我自己的理....
的頭像 3D視覺工坊 發(fā)表于 11-01 10:49 ?2029次閱讀
LOAM源代碼中坐標變換部分的詳細講解

如何利用CLIP 的2D 圖像-文本預(yù)習(xí)知識進行3D場景理解

自我監(jiān)督學(xué)習(xí)的目的是獲得有利于下游任務(wù)的良好表現(xiàn)。主流的方法是使用對比學(xué)習(xí)來與訓(xùn)練網(wǎng)絡(luò)。受CLIP成....
的頭像 3D視覺工坊 發(fā)表于 10-29 16:54 ?1488次閱讀
如何利用CLIP 的2D 圖像-文本預(yù)習(xí)知識進行3D場景理解

利用PyTorch實現(xiàn)NeRF代碼詳解

神經(jīng)輻射場(NeRF)是一種利用神經(jīng)網(wǎng)絡(luò)來表示和渲染復(fù)雜的三維場景的方法。它可以從一組二維圖片中學(xué)習(xí)....
的頭像 3D視覺工坊 發(fā)表于 10-21 09:46 ?745次閱讀

關(guān)于魚眼相機標定的畸變與矯正的分享

在目標追蹤任務(wù)中,通常的球機或者槍機方案,無法避免人群遮擋的問題,從而導(dǎo)致較高的ID Swich,造....
的頭像 3D視覺工坊 發(fā)表于 10-18 14:24 ?3323次閱讀
關(guān)于魚眼相機標定的畸變與矯正的分享

讀者理解:LEAP泛化到新的物體類別和場景

本文主要介紹了兩個與NeRF(Neural Radiance Fields)相關(guān)的工作,分別是針對稀....
的頭像 3D視覺工坊 發(fā)表于 10-17 15:46 ?479次閱讀
讀者理解:LEAP泛化到新的物體類別和場景

CVPR2023 I BUFFER:點云配準中卓越精度、高效性和泛化性的完美平衡

總體而言,現(xiàn)有基于對應(yīng)關(guān)系方法的局限性在于兩個方面。首先,目前還沒有統(tǒng)一、高效、通用的特征學(xué)習(xí)框架。....
的頭像 3D視覺工坊 發(fā)表于 10-16 17:18 ?999次閱讀
CVPR2023 I BUFFER:點云配準中卓越精度、高效性和泛化性的完美平衡

ICCV 2023:實現(xiàn)實時六自由度物體跟蹤

近年來,一些端到端學(xué)習(xí)方法被提出以增強六自由度物體定位的魯棒性,包括:直接回歸幾何參數(shù);采用渲染 -....
的頭像 3D視覺工坊 發(fā)表于 10-16 17:13 ?766次閱讀
ICCV 2023:實現(xiàn)實時六自由度物體跟蹤

CVPR2022;直接從點云提取3D基元

(i)實例分割 :定義將每個點分配給某個片段 k{1 ...K} 的可能性,其中每個片段都是擠壓柱面....
的頭像 3D視覺工坊 發(fā)表于 10-12 16:49 ?607次閱讀
CVPR2022;直接從點云提取3D基元

一種基于毫米波雷達和相機系統(tǒng)之間的在線無目標校準方法

傳感器融合對于自動駕駛和自主機器人是至關(guān)重要,毫米波雷達-相機融合系統(tǒng)由于其互補的傳感能力而廣受歡迎....
的頭像 3D視覺工坊 發(fā)表于 10-09 14:17 ?743次閱讀
一種基于毫米波雷達和相機系統(tǒng)之間的在線無目標校準方法

點云采樣方法新創(chuàng)新,深度學(xué)習(xí)與傳統(tǒng)的結(jié)合

使用標準差代替了梯度計算,該方法相比原本的圖像的Canny邊緣檢測器計算成本更高,但卻可以將其應(yīng)用于....
的頭像 3D視覺工坊 發(fā)表于 10-08 15:46 ?2054次閱讀
點云采樣方法新創(chuàng)新,深度學(xué)習(xí)與傳統(tǒng)的結(jié)合

點-線特征聯(lián)合的全景圖像位姿解算方法

使用真實場景的車載激光點云和兩幅全景圖像進行試驗,驗證點-線特征聯(lián)合的位姿解算方法優(yōu)于單純的點特征解....
的頭像 3D視覺工坊 發(fā)表于 09-29 08:01 ?773次閱讀
點-線特征聯(lián)合的全景圖像位姿解算方法

三維點云配準算法原理及推導(dǎo)

粗配準就是再兩個點云還差得十萬八千里、完全不清楚兩個點云的相對位置關(guān)系的情況下,找到一個這兩個點云近....
的頭像 3D視覺工坊 發(fā)表于 09-25 11:31 ?990次閱讀

?基于文本提示就可自動實現(xiàn)復(fù)雜計算機視覺任務(wù)?

目的:對通用人工智能系統(tǒng)的追求導(dǎo)致了強大的端到端可訓(xùn)練模型的開發(fā),其中許多模型渴望為人工智能提供簡單....
的頭像 3D視覺工坊 發(fā)表于 09-23 11:16 ?791次閱讀
?基于文本提示就可自動實現(xiàn)復(fù)雜計算機視覺任務(wù)?

一種簡單而有效的多攝像頭算法,用于平衡性能和效率

Multi-view Stereo(MVS)方法旨在從具有已知位姿的一組圖像中恢復(fù)密集的3D場景結(jié)構(gòu)....
的頭像 3D視覺工坊 發(fā)表于 09-22 16:14 ?862次閱讀
一種簡單而有效的多攝像頭算法,用于平衡性能和效率

SLAM/SfM相似非回環(huán)場景應(yīng)該如何處理?

相似結(jié)構(gòu)一直是SLAM和SfM中很難處理卻又不得不處理的問題,如果機器人遇到了非常相似但實際不同的結(jié)....
的頭像 3D視覺工坊 發(fā)表于 09-20 15:15 ?781次閱讀
SLAM/SfM相似非回環(huán)場景應(yīng)該如何處理?

VoxelMap++:在線LiDAR慣性里程計實現(xiàn)可合并的體素建圖方法

VoxelMap++的流程如圖1所示,LiDAR原始點預(yù)處理方法和基于迭代誤差狀態(tài)卡爾曼濾波器的狀態(tài)....
的頭像 3D視覺工坊 發(fā)表于 09-11 17:02 ?1125次閱讀
VoxelMap++:在線LiDAR慣性里程計實現(xiàn)可合并的體素建圖方法

middlebury數(shù)據(jù)集是什么

Middlebury立體測評網(wǎng)站是計算機視覺領(lǐng)域的重要資源,它為研究人員和工程師提供了一個評估和比較....
的頭像 3D視覺工坊 發(fā)表于 09-10 11:29 ?2211次閱讀
middlebury數(shù)據(jù)集是什么

只需簡單的幾步,2D視頻變3D?最新視頻創(chuàng)作AI模型!

本文的網(wǎng)絡(luò)將給定一個具有幀的動態(tài)場景的單目視頻(I1, I2,…,, IN ) 和已知的相機參數(shù) (....
的頭像 3D視覺工坊 發(fā)表于 09-10 10:08 ?3403次閱讀
只需簡單的幾步,2D視頻變3D?最新視頻創(chuàng)作AI模型!

基于單張RGB圖像定位被遮擋行人設(shè)計案例

基于單張RGB圖像在3D場景空間中定位行人對于各種下游應(yīng)用至關(guān)重要。目前的單目定位方法要么利用行人的....
的頭像 3D視覺工坊 發(fā)表于 09-08 09:29 ?789次閱讀
基于單張RGB圖像定位被遮擋行人設(shè)計案例