0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

融合3D場景幾何信息的視覺定位算法

機(jī)器人創(chuàng)新生態(tài) ? 來源:機(jī)器人創(chuàng)新生態(tài) ? 作者:機(jī)器人創(chuàng)新生態(tài) ? 2020-11-13 10:50 ? 次閱讀

視覺定位是自動駕駛和移動機(jī)器人領(lǐng)域的核心技術(shù)之一,旨在估計移動平臺當(dāng)前的全局位姿,為環(huán)境感知和路徑規(guī)劃等其他環(huán)節(jié)提供參考和指導(dǎo)。國內(nèi)知名互聯(lián)網(wǎng)公司-美團(tuán)無人配送團(tuán)隊(duì)長期在該方面進(jìn)行深入探索,積累了大量創(chuàng)新性工作。不久前,視覺定位組提出的融合3D場景幾何信息的視覺定位算法ICRA2020收錄,本文將對該方法進(jìn)行介紹。

背景

1. 視覺定位算法介紹1.1 傳統(tǒng)視覺定位算法 傳統(tǒng)的視覺定位方法通常需要預(yù)先構(gòu)建視覺地圖,然后在定位階段,根據(jù)當(dāng)前圖像和地圖的匹配關(guān)系來估計相機(jī)的位姿(位置和方向)。在這種定位框架中,視覺地圖通常用帶有三維信息和特征描述子的稀疏關(guān)鍵點(diǎn)表示。然后,通過當(dāng)前圖像與地圖之間的關(guān)鍵點(diǎn)匹配獲取2D-3D對應(yīng)關(guān)系,利用PnP結(jié)合RANSAC的策略來估計相機(jī)位姿。其中,獲得準(zhǔn)確的2D-3D對應(yīng)關(guān)系對定位結(jié)果至關(guān)重要。近年來,許多工作為提高2D-3D的匹配精度進(jìn)行了各方面的探索,但大多傳統(tǒng)方法[1,3,4]還是基于SIFT、SURFORB等底層特征,很難處理具有挑戰(zhàn)性(光照改變或季節(jié)改變)的情況。

1.2 深度學(xué)習(xí)視覺定位算法 最近幾年,融合神經(jīng)網(wǎng)絡(luò)的視覺定位算法被廣泛研究,大家希望用神經(jīng)網(wǎng)絡(luò)取代傳統(tǒng)方法中的部分模塊(例如關(guān)鍵點(diǎn)和描述子生成)或者直接端到端的估計相機(jī)位姿。本論文研究內(nèi)容屬于對后面這種類型算法的優(yōu)化。端到端視覺定位算法用神經(jīng)網(wǎng)絡(luò)的權(quán)值來表征場景信息,網(wǎng)絡(luò)的訓(xùn)練過程實(shí)現(xiàn)建圖,定位由網(wǎng)絡(luò)的推理過程實(shí)現(xiàn)。PoseNet[2]是第一個基于神經(jīng)網(wǎng)絡(luò)的端到端視覺定位算法,它利用GoogLeNet的基礎(chǔ)架構(gòu)直接對輸入的RGB圖像進(jìn)行6DoF相機(jī)位姿回歸。在該思路的基礎(chǔ)上,后續(xù)的改進(jìn)包括加深網(wǎng)絡(luò)結(jié)構(gòu)、增加約束關(guān)系、融合時序信息和多任務(wù)聯(lián)合建模等,例如,[5]加入貝葉斯CNN來建模精度不確定性;[6]將網(wǎng)絡(luò)改為encoder-decoder結(jié)構(gòu);[7]和[8]引入了LSTM,利用視頻流的時間和運(yùn)動平滑性約束網(wǎng)絡(luò)學(xué)習(xí);[9]和[10]提出了多任務(wù)學(xué)習(xí)框架,聯(lián)合建模視覺定位、里程計估計和語義分割三個任務(wù),以上的工作都取得了定位精度的提升。

1.3 研究目的及意義 在上述提到的優(yōu)化方法中,雖然[9]和[10]在定位精度上表現(xiàn)的更有優(yōu)勢,但是往往需要語義分割等大量的標(biāo)注信息,在大規(guī)模的場景下代價太大。對于加深網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法,又可能帶來訓(xùn)練的難度,因此,我們認(rèn)為合理利用容易獲取的信息來優(yōu)化約束關(guān)系,具有更好的普適性和靈活性,這也是本研究的動機(jī)之一。一些其他研究者也在這方面開展了工作,例如受傳統(tǒng)方法的啟發(fā),幾何一致性誤差、重投影誤差、相對變換誤差等被構(gòu)建為正則化項(xiàng)加入損失函數(shù)中。這些改進(jìn)比僅公式化預(yù)測位姿和真值位姿之間歐式距離的效果更好,并且不受網(wǎng)絡(luò)結(jié)構(gòu)的約束,可以靈活的適用于各種網(wǎng)絡(luò)做進(jìn)一步的性能提升。

在此基礎(chǔ)上,我們進(jìn)一步探索以更好的方式用幾何信息來約束網(wǎng)絡(luò)權(quán)重的更新。在SLAM應(yīng)用和無人車平臺中,深度信息是不可或缺的。例如,室內(nèi)情況,利用現(xiàn)有的深度估計算法,可以直接從結(jié)構(gòu)光相機(jī)、ToF相機(jī)或立體相機(jī)中獲取深度信息;室外環(huán)境,通常采用三維激光雷達(dá)來獲取深度/距離信息。因此,我們的改進(jìn)也對深度信息加以利用。此外,我們使用了光度一致性的假設(shè),也就是說,根據(jù)三維幾何知識,當(dāng)在多個圖像中觀察三維場景中的同一個點(diǎn)時,我們認(rèn)為其對應(yīng)的像素強(qiáng)度應(yīng)該是相同的,這也被用于許多視覺里程計或光流算法。受此啟發(fā),我們構(gòu)建了光度差損失項(xiàng),并自然而然地搭配結(jié)構(gòu)相似性(SSIM)損失項(xiàng)。前者為像素級約束,后者為圖像級約束,和常用的歐式距離一起作為網(wǎng)絡(luò)的損失函數(shù),訓(xùn)練過程中約束網(wǎng)絡(luò)權(quán)重的更新。我們優(yōu)化后的損失函數(shù)融合了運(yùn)動信息、3D場景幾何信息和圖像內(nèi)容,幫助訓(xùn)練過程更高效、定位效果更準(zhǔn)確。

2. 相關(guān)工作介紹2.1 幾何一致性約束 幾何一致性約束最近被用來幫助提高位姿回歸的準(zhǔn)確性,并被證明比單獨(dú)使用歐氏距離約束更有效。[9]和[10]通過懲罰與相對運(yùn)動相矛盾的位姿預(yù)測,將幾何一致性引入到損失函數(shù)中。[11]利用圖像對之間的相對運(yùn)動一致性來約束絕對位姿的預(yù)測。[12]引入了重投影誤差,使用真值和預(yù)測位姿分別將3D點(diǎn)投影到2D圖像平面上,將像素點(diǎn)位置的偏差作為約束項(xiàng)。這些方法都被認(rèn)為是當(dāng)時使用幾何一致性損失的最先進(jìn)方法。在本研究中,我們探索了一個3D場景幾何約束即光度差約束,通過聚合三維場景幾何結(jié)構(gòu)信息,使得網(wǎng)絡(luò)不僅能將預(yù)測的位姿與相機(jī)運(yùn)動對齊,還能利用圖像內(nèi)容的光度一致性。

2.2 光度差約束 光度差約束通常用于處理帶監(jiān)督或無監(jiān)督學(xué)習(xí)的相對位姿回歸、光流估計和深度預(yù)測。例如,[13]研究了視頻序列的時間關(guān)系,為深度補(bǔ)全網(wǎng)絡(luò)提供額外的監(jiān)督。[14]利用無監(jiān)督學(xué)習(xí)的稠密深度和帶有光度差損失的相機(jī)位姿構(gòu)建了神經(jīng)網(wǎng)絡(luò),以學(xué)習(xí)場景級一致性運(yùn)動。[15]提出了一種多任務(wù)無監(jiān)督學(xué)習(xí)稠密深度、光流和ego-motion的方法,其中光度差約束對不同任務(wù)之間的一致性起著重要作用。由于光度差約束在相對位姿回歸和深度預(yù)測中被證明是有效的,我們引入并驗(yàn)證了它在絕對位姿預(yù)測中的有效性。 與上述工作相比,我們的研究擴(kuò)展了以下幾點(diǎn)工作:

搭建了一個深度神經(jīng)網(wǎng)絡(luò)模型,可以直接從輸入圖像估計相應(yīng)的相機(jī)絕對位姿。

利用深度傳感器信息,構(gòu)建了 3D 場景幾何約束來提高位姿預(yù)測精度。并且,稀疏深度信息足以獲得顯著的定位精度提升,這意味著我們的方法可以適用于任何類型的深度傳感器(稀疏或稠密)。

在室內(nèi)和室外數(shù)據(jù)集上進(jìn)行了廣泛的實(shí)驗(yàn)評估,證明了加入 3D 場景幾何約束后,可以提高網(wǎng)絡(luò)的定位精度,并且這一約束可以靈活地加入到其他網(wǎng)絡(luò)中,幫助進(jìn)一步提高算法性能。

算法介紹

1. 算法框架

本研究提出的算法框架和數(shù)據(jù)流如圖a所示,藍(lán)色部分是算法中的神經(jīng)網(wǎng)絡(luò)部分(圖b),綠色部分是warping計算過程,黃色部分是網(wǎng)絡(luò)的損失函數(shù)項(xiàng),只有藍(lán)色部分包含可訓(xùn)練的權(quán)重。 藍(lán)色部分的網(wǎng)絡(luò)模型采用主流的ResNet-50網(wǎng)絡(luò),保留原來的block設(shè)置,并在最后一個block后加入3個全連接層,分別預(yù)測3維的translation(x)和3維的rotation(q)。網(wǎng)絡(luò)的訓(xùn)練過程需要輸入兩張連續(xù)的有共視的圖像以及其中一張圖像的深度圖,建立真值位姿和預(yù)測位姿之間的歐式距離約束作為損失項(xiàng)。大部分先前文獻(xiàn)中的工作僅以這個損失項(xiàng)作為損失函數(shù),我們的工作則進(jìn)一步融入了3D場景幾何信息,通過利用比較容易獲取的深度信息將這個約束公式化為光度差和SSIM。相比之下,3D場景幾何約束是像素級的,可以利用更多的信息包括相機(jī)運(yùn)動,場景的三維結(jié)構(gòu)信息和圖像內(nèi)容相關(guān)的光度信息,從而使網(wǎng)絡(luò)的學(xué)習(xí)更加高效,更好地朝著全局極小值的方向收斂。

2.Warping計算 綠色部分的warping計算利用連續(xù)兩張圖像之間的相對位姿變換和其中一張圖像的深度圖,將本張圖像上的像素投影到另一張圖像的視角上,生成視warping后的圖像,計算公式如下所示。

在warping計算中,從二維圖像像素重建三維結(jié)構(gòu)需要深度信息,實(shí)際應(yīng)用中我們可以從深度傳感器(結(jié)構(gòu)光相機(jī)、ToF相機(jī)和三維激光雷達(dá))獲取深度信息或通過相關(guān)算法回歸深度,例如從兩個重疊的圖像中提取匹配點(diǎn)的三角測量方法。為了不引入誤差,我們更傾向于選擇來自深度傳感器的比較魯棒的深度信息。為了方便反向傳播的梯度計算,我們采用雙線性插值作為采樣機(jī)制,生成與當(dāng)前圖像格式相同的合成圖像。此外,這部分計算不含可訓(xùn)練的參數(shù),并且inference過程不需要進(jìn)行這部分的計算,因此不會帶來額外的時間或者資源開銷。 3. 損失函數(shù) 在訓(xùn)練過程中,應(yīng)用了三個約束條件來幫助訓(xùn)練收斂:一個經(jīng)典的歐式距離損失項(xiàng)來約束預(yù)測位姿和真值位姿的距離,歐式距離損失項(xiàng)此處不再贅述,直接給出公式如下:

? 當(dāng)視角變化較小且環(huán)境光不變時,同一個三維點(diǎn)在不同圖像中的光強(qiáng)應(yīng)該相同。這種光度一致性用于解決許多問題,如光流估計、深度估計、視覺里程計等。在這里,我們使用它來進(jìn)行絕對位姿估計,并光度差損失項(xiàng)公式化為warping計算后的圖像與原始圖像對應(yīng)像素點(diǎn)的光度差值: ?

其中,M是用來過濾沒有深度信息或者不服從光度一致性的像素。在我們的實(shí)驗(yàn)中,主要用它來屏蔽兩種類型的像素:移動目標(biāo)對應(yīng)的像素和帶有無效深度信息的像素。光度差損失項(xiàng)會約束預(yù)測的位姿離真值位姿不遠(yuǎn),以保證在相鄰圖像間進(jìn)行warping計算后重建的圖像與原始圖像對應(yīng)像素的光度值一致。考慮到warping計算后,獲得了視角重建后的圖像,自然而然的引入結(jié)構(gòu)相似性約束作為損失項(xiàng)。這個約束反映了場景結(jié)構(gòu)的一致性,計算公式如下所示:

網(wǎng)絡(luò)的損失函數(shù)定義為三個損失項(xiàng)的加權(quán)和,用三個加權(quán)系數(shù)進(jìn)行尺度均衡。

實(shí)驗(yàn)結(jié)果

為了驗(yàn)證我們提出的算法的性能,進(jìn)行了以下實(shí)驗(yàn): 1. 與其他算法定位結(jié)果對比 在7Scene數(shù)據(jù)集中,除了MapNet[11]在chess場景中的表現(xiàn)稍好之外,我們的方法在其他場景都取得了最優(yōu)的結(jié)果(見table 1)。在所需的訓(xùn)練時間上,MapNet 需要300個epochs和PoseNet[2]需要多于120個epochs,我們的方法只需要50個epochs。同時,在室外的Oxford robotcar數(shù)據(jù)集上,我們的方法也取得了較大的定位精度提升。Figure2顯示了在7Scene中隨機(jī)挑選的場景的測試結(jié)果。很明顯,PoseNet的預(yù)測位姿噪聲較大,MapNet表現(xiàn)的更穩(wěn)定,但預(yù)測精度欠佳,我們的定位結(jié)果更為精確。

2. 損失項(xiàng)的消融實(shí)驗(yàn) 為了充分驗(yàn)證我們提出的光度差損失和SSIM損失對視覺定位算法性能提升的貢獻(xiàn),分別進(jìn)行兩個訓(xùn)練:在PoseNet網(wǎng)絡(luò)的損失函數(shù)中加入光度差損失和SSIM損失后訓(xùn)練網(wǎng)絡(luò)。在我們的算法中去掉這兩項(xiàng)損失項(xiàng),只在歐式距離的約束下訓(xùn)練網(wǎng)絡(luò)。結(jié)果表明加入光度差和SSIM損失項(xiàng)總是能提高網(wǎng)絡(luò)的定位性能(詳細(xì)結(jié)果見論文)。同時,也表明新的損失項(xiàng)可以靈活的加入其他網(wǎng)絡(luò),用于進(jìn)一步提高定位精度。

3. 深度稀疏實(shí)驗(yàn) 實(shí)際視覺定位應(yīng)用中,并不總是有可靠的稠密深度可用,如果我們的算法在稀疏深度上依然可以表現(xiàn)的很好,則可以證明我們的方法具有較廣泛的適用性。我們把可用的深度隨機(jī)稀疏至原來的20%和60%后,重新訓(xùn)練網(wǎng)絡(luò),最終的結(jié)果如Table3所示,定位精度并沒有被嚴(yán)重惡化。

4. 自監(jiān)督方法的實(shí)驗(yàn) 在進(jìn)行warping計算時,我們用了輸入兩幀圖像的位姿預(yù)測結(jié)果來計算相對位姿變換,進(jìn)而做warping計算,單就光度差和SSIM損失項(xiàng)來說,這是一種自監(jiān)督的學(xué)習(xí)方法,那么,也可以一幀圖像用預(yù)測結(jié)果,另一幀用真值來計算相對位姿變換。通過實(shí)驗(yàn)對比這兩種方法,實(shí)驗(yàn)結(jié)果(詳細(xì)結(jié)果見論文)表明,自監(jiān)督策略的結(jié)果更優(yōu)。除了網(wǎng)絡(luò)被訓(xùn)練的次數(shù)更多這一原因外,它有助于網(wǎng)絡(luò)以一種更自然的方式學(xué)習(xí)相機(jī)位姿的連續(xù)性和一致性,因?yàn)閷τ诠惨暤膱D像,其相應(yīng)的位姿應(yīng)該是高度相關(guān)的。

結(jié)論與展望

本文提出了一種新的視覺定位算法,搭建一個新的網(wǎng)絡(luò)框架端到端的估計相機(jī)位姿,在對網(wǎng)絡(luò)約束關(guān)系的優(yōu)化中,通過融合3D場景幾何結(jié)構(gòu)、相機(jī)運(yùn)動和圖像信息,引入了3D場景幾何約束,幫助監(jiān)督網(wǎng)絡(luò)訓(xùn)練,提高網(wǎng)絡(luò)的定位精度。實(shí)驗(yàn)結(jié)果表明,我們的方法優(yōu)于以往的同類型工作。并且,在不同的網(wǎng)絡(luò)中加入新的約束關(guān)系后可以進(jìn)一步提高定位精度。

基于深度學(xué)習(xí)的視覺定位算法正在被廣泛而又深入的研究,無論是提升算法的精度還是增強(qiáng)實(shí)際場景的適用性,各方面的嘗試和努力都是迫切需要的。希望在未來的工作中,能夠通過融入語義信息或者采用從粗到精多階段級連的方法,在室內(nèi)外場景上實(shí)現(xiàn)更高精度更加魯棒的位姿估計,更多細(xì)節(jié)見論文.

論文原文:3D Scene Geometry-Aware Constraint for Camera Localization with Deep Learning 鏈接:https://arxiv.org/abs/2005.06147 參考文獻(xiàn) [1] Ke, Yan and R. Sukthankar. “PCA-SIFT: a more distinctive representation for local image descriptors.” Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), 2004. [2] A. Kendall, M. Grimes, and R. Cipolla, “Posenet: A convolutional network for real-time 6-dof camera relocalization,” in ICCV, 2015. [3] Bay, Herbert, et al. “Speeded-up robust features (SURF).” Computer vision and image understanding 110.3 (2008): 346-359.

[4] Rublee, Ethan, et al. “ORB:An efficient alternative to SIFT or SURF.” ICCV. Vol. 11. No. 1. 2011. [5] A. Kendall and R. Cipolla,“Modelling uncertainty in deep learning for camera relocalization,” ICRA, 2016. [6] I. Melekhov, J. Ylioinas, J. Kannala, and E. Rahtu, “Image-based localization using hourglass networks,” arXiv:1703.07971, 2017. [7] F. Walch, C. Hazirbas, et al.,“Image-based localization using lstms for structured feature correlation,” in ICCV, 2017. [8] Xue, Fei, et al. “Beyond Tracking: Selecting Memory and RefiningPoses for Deep Visual Odometry.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019

[9] A. Valada, N. Radwan, and W. Burgard, “Deep auxiliary learning for visual localization and odometry,” in ICRA, 2018. [10] N. Radwan, A. Valada, W. Burgard, “VLocNet++: Deep MultitaskLearning for Semantic Visual Localization and Odometry”, IEEE Robotics and Automation Letters (RA-L), 3(4): 4407-4414, 2018. [11] Brahmbhatt, Samarth, et al. “Geometry-aware learning of maps for camera localization.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018. [12] A. Kendall and R. Cipolla, “Geometric loss functions for camera pose regression with deep learning,” CVPR, 2017. [13] Ma, Fang chang, Guilherme Venturelli Cavalheiro, and Sertac Karaman.“Self-supervised sparse-to-dense: Self-supervised depth completion from lidar and monocular camera.” 2019 International Conference on Robotics and Automation (ICRA). IEEE, 2019. [14] Zhou, Tinghui, et al. “Unsupervised Learning of Depth and Ego-Motion from Video.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017. [15] Yin, Zhichao, and Jianping Shi. “Geonet: Unsupervised learning of dense depth, optical flow and camera pose.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018.

責(zé)任編輯:xj

原文標(biāo)題:機(jī)器視覺干貨 | 場景幾何約束在視覺定位中的探索

文章出處:【微信公眾號:機(jī)器人創(chuàng)新生態(tài)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28418

    瀏覽量

    207096
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    162

    文章

    4372

    瀏覽量

    120319
  • 視覺定位
    +關(guān)注

    關(guān)注

    5

    文章

    51

    瀏覽量

    12394

原文標(biāo)題:機(jī)器視覺干貨 | 場景幾何約束在視覺定位中的探索

文章出處:【微信號:robotplaces,微信公眾號:機(jī)器人創(chuàng)新生態(tài)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    從2D走向3D視覺傳感器

    ,視覺傳感器開始向3D發(fā)展,帶給家用場景下更豐富和完善的功能。 ? 視覺傳感器的發(fā)展 ? 視覺傳感器的概念最早在20世紀(jì)50年代后期開始形成
    的頭像 發(fā)表于 12-27 00:22 ?769次閱讀

    3D 視覺定位技術(shù):汽車零部件制造的智能變革引擎

    在汽車零部件制造領(lǐng)域,傳統(tǒng)工藝正面臨著前所未有的挑戰(zhàn)。市場對于零部件精度與生產(chǎn)效率近乎苛刻的要求,促使企業(yè)尋求突破之道。而 3D 視覺定位技術(shù),為汽車零部件制造開啟了精準(zhǔn)定位與智能化生
    的頭像 發(fā)表于 12-10 17:28 ?267次閱讀
    <b class='flag-5'>3D</b> <b class='flag-5'>視覺</b><b class='flag-5'>定位</b>技術(shù):汽車零部件制造的智能變革引擎

    一種全新開源SfM框架MASt3R

    運(yùn)動恢復(fù)結(jié)構(gòu)(SfM)是計算機(jī)視覺領(lǐng)域一個長期存在的問題,旨在根據(jù)每個相機(jī)拍攝的圖像來估計場景3D幾何結(jié)構(gòu)以及觀測該場景的相機(jī)的參數(shù)。由于
    的頭像 發(fā)表于 10-28 14:13 ?588次閱讀
    一種全新開源SfM框架MASt<b class='flag-5'>3</b>R

    3D可視化賦能智慧園區(qū)安防管理,開啟園區(qū)管理新篇章!

    ? ? ? ?3D可視化,主要是研究大規(guī)模非數(shù)值型信息資源的視覺呈現(xiàn),以及利用圖形方面的技術(shù)與方法,幫助人們理解和分析數(shù)據(jù)。 ? ? ? ?傳統(tǒng)園區(qū)的信息化往往數(shù)據(jù)不互通,業(yè)務(wù)難
    的頭像 發(fā)表于 07-17 10:57 ?331次閱讀

    紫光展銳助力全球首款A(yù)I裸眼3D手機(jī)發(fā)布

    1.4億臺,展示了該技術(shù)巨大的市場潛力和增長空間。近日,全球首款A(yù)I裸眼3D手機(jī)——中興遠(yuǎn)航3D重磅上市。憑借微米級3D光柵技術(shù)、Neovision 3D Anytime突破性的2
    的頭像 發(fā)表于 07-15 16:00 ?685次閱讀

    3d場景建??梢暬?,場景1:1還原

    3D場景建??梢暬募夹g(shù)原理、方法和應(yīng)用,旨在幫助讀者深入了解這一領(lǐng)域的專業(yè)知識。 1.技術(shù)原理 數(shù)學(xué)建模: 三維場景建?;跀?shù)學(xué)幾何原理,通過點(diǎn)、線、面等基本元素構(gòu)建物體的
    的頭像 發(fā)表于 07-12 14:49 ?302次閱讀

    蘇州吳中區(qū)多色PCB板元器件3D視覺檢測技術(shù)

    3D視覺檢測相較于2D視覺檢測,有其獨(dú)特的優(yōu)勢,不受產(chǎn)品表面對比度影響,精確檢出產(chǎn)品形狀,可以測出高度(厚度)、體積、平整度等。在實(shí)際應(yīng)用中可以與2
    的頭像 發(fā)表于 06-14 15:02 ?413次閱讀
    蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>檢測技術(shù)

    3D視覺引導(dǎo)方案解決工廠產(chǎn)線上下料難題

    3D視覺引導(dǎo)方案,下料器的擺放精度直接關(guān)系到產(chǎn)品的最終質(zhì)量和生產(chǎn)效率。如何在繁忙的生產(chǎn)線上,確保下料器能夠精準(zhǔn)無誤地將工件放置在指定位置,成為了擺在我們面前的一大挑戰(zhàn)。今天,我們就來揭秘我們的
    的頭像 發(fā)表于 05-27 15:47 ?426次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>視覺</b>引導(dǎo)方案解決工廠產(chǎn)線上下料難題

    機(jī)器人3D視覺引導(dǎo)系統(tǒng)框架介紹

    通過自主開發(fā)的3D掃描儀可獲準(zhǔn)確并且快速地獲取場景的點(diǎn)云圖像,通過3D識別算法,可實(shí)現(xiàn)在對點(diǎn)云圖中的多種目標(biāo)物體進(jìn)行識別和位姿估計。
    發(fā)表于 04-29 09:31 ?335次閱讀
    機(jī)器人<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>引導(dǎo)系統(tǒng)框架介紹

    解決方案|基于3D視覺技術(shù)的鋁合金板件刷油烘干自動化上下料

    針對鋁合金板件刷油烘干上下料過程中的自動化需求,我們提出了一套基于3D視覺引導(dǎo)的解決方案。該方案通過引入先進(jìn)的3D視覺技術(shù),實(shí)現(xiàn)了對板件的高精度識別和
    的頭像 發(fā)表于 04-20 17:45 ?331次閱讀
    解決方案|基于<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>技術(shù)的鋁合金板件刷油烘干自動化上下料

    包含具有多種類型信息3D模型

    的文件格式流程,其中包含具有多種類型信息3D模型,例如時間、成本、材料屬性、幾何形狀、施工進(jìn)度、熱屬性等。 BIM在AEC領(lǐng)域中發(fā)揮著重要作用。BIM文件允許AE提供項(xiàng)目中所有信息
    發(fā)表于 03-28 17:18

    工業(yè)自動化,3D視覺在五金件上下料中的應(yīng)用

    3D視覺引導(dǎo)五金件上下料是一種先進(jìn)的自動化解決方案,結(jié)合了3D視覺技術(shù)和機(jī)器人技術(shù),實(shí)現(xiàn)對五金件的高效、準(zhǔn)確上下料操作。以下是關(guān)于3D
    的頭像 發(fā)表于 02-21 11:38 ?492次閱讀
    工業(yè)自動化,<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>在五金件上下料中的應(yīng)用

    技術(shù)基因+自主創(chuàng)新,光鑒科技塑造3D視覺感知新范式

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)根據(jù)高工機(jī)器人產(chǎn)業(yè)研究所(GGII)的統(tǒng)計數(shù)據(jù),預(yù)計到2027年我國機(jī)器視覺市場規(guī)模將超過560億元,其中3D視覺市場規(guī)模將接近160億元,占比接近三成。目前,3
    的頭像 發(fā)表于 01-16 00:22 ?1317次閱讀
    技術(shù)基因+自主創(chuàng)新,光鑒科技塑造<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>感知新范式

    一種用于2D/3D圖像處理算法的指令集架構(gòu)以及對應(yīng)的算法部署方法

    二維(2D)和三維(3D)雙模視覺信息在自動駕駛、工業(yè)機(jī)器人、人機(jī)交互等前沿領(lǐng)域具有廣泛的應(yīng)用前景。
    的頭像 發(fā)表于 01-05 10:35 ?463次閱讀
    一種用于2<b class='flag-5'>D</b>/<b class='flag-5'>3D</b>圖像處理<b class='flag-5'>算法</b>的指令集架構(gòu)以及對應(yīng)的<b class='flag-5'>算法</b>部署方法

    ad中3d封裝放到哪個層

    在廣告中,3D封裝通常放置在視覺設(shè)計層。視覺設(shè)計是廣告中至關(guān)重要的一個層面,通過圖像、顏色和排版等視覺元素來引起目標(biāo)受眾的注意,并傳達(dá)廣告的信息
    的頭像 發(fā)表于 01-04 15:05 ?1056次閱讀