0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何通過立體視覺構(gòu)建小巧輕便的深度感知系統(tǒng)

suanjunihao ? 來源:suanjunihao ? 作者:suanjunihao ? 2022-08-23 16:45 ? 次閱讀

如何通過立體視覺構(gòu)建小巧輕便的深度感知系統(tǒng)

【導讀】有多種 3D 傳感器方案來實現(xiàn)深度感知系統(tǒng),包括立體視覺相機、激光雷達和TOF(飛行時間)相機。每個選擇都有其優(yōu)缺點,其中,嵌入式深度感知立體系統(tǒng)成本低,堅固耐用,適合戶外使用,并且能夠提供高分辨率的彩色點云。

pYYBAGMEk5uAOfMqAACFUQT2fP8562.jpg

目前市場上有各種現(xiàn)成的立體感知系統(tǒng)。有時系統(tǒng)工程師需求根據(jù)精度、基線(兩個相機間距)、視野和分辨率等因素,構(gòu)建定制系統(tǒng)來滿足特定的應(yīng)用需求。

在本文中,我們首先介紹了立體視覺系統(tǒng)的主要部分,并提供了有關(guān)使用硬件組成和開源軟件制作定制立體相機的說明。由于此設(shè)置專注于嵌入式系統(tǒng),因此它將實時計算任何場景的深度圖,而無需電腦主機。在另一篇文章中,我們將討論如何在空間較少的情況下構(gòu)建定制立體視覺系統(tǒng),以便與電腦主機一起使用。

立體視覺概述

立體視覺是通過從兩個視角比較場景中的信息,從數(shù)字圖像中提取 3D 信息。物體在兩個圖像平面中的相對位置可提供關(guān)于物體距離相機的深度的信息。

立體視覺系統(tǒng)概述如圖 1 所示,包括以下關(guān)鍵步驟:

校準:相機校準包括內(nèi)部校準和外部校準。內(nèi)部校準確定圖像中心、焦距和失真參數(shù),而外部校準確定相機的 3D 位置。這在許多計算機視覺應(yīng)用中是至關(guān)重要的一步,尤其是在需要有關(guān)場景的計量信息(例如深度)時。我們將在下文第 5 節(jié)詳細討論校準步驟。

糾正:立體糾正是指將圖像平面重新投影到與相機中心之間的線平行的公共平面上的過程。糾正后,對應(yīng)點位于同一行,大大降低了匹配的成本和模糊度。此步驟在提供的代碼中完成,用于構(gòu)建您自己的系統(tǒng)。

立體匹配:這是指在左右圖像之間匹配像素的過程,從而產(chǎn)生視差圖像。提供的代碼中將使用半全局匹配 (SGM) 算法來構(gòu)建您自己的系統(tǒng)。

電子元器件現(xiàn)貨上唯樣商城

三角測量:三角測量是指在給定 3D 空間中的點投影到兩個圖像上的情況下確定該點的過程。視差圖像將轉(zhuǎn)換為 3D 點云。

poYBAGMEk5yAZfzBAABDAQho4gI340.jpg

圖 1:立體視覺系統(tǒng)概述

設(shè)計示例

我們來看一個立體聲系統(tǒng)設(shè)計示例。以下是移動機器人在具有快速移動物體的動態(tài)環(huán)境中的應(yīng)用要求。有關(guān)場景大小為 2 m,相機到場景的距離為 3 m,在 3 m 處所需的精度為 1 cm。

有關(guān)立體精度的更多詳細信息,請參閱本文。深度誤差由下式給出:ΔZ=Z2/Bf * Δd,這取決于以下因素:

● Z 是范圍

● B 是基線

● f 是以像素為單位的焦距,與相機視野和圖像分辨率有關(guān)

有多種設(shè)計選項可以滿足這些要求。根據(jù)上述場景大小和距離要求,我們可以確定特定傳感器的鏡頭焦距。結(jié)合基線,我們可以使用上述公式計算 3 m 處的預(yù)期深度誤差,以驗證其是否滿足精度要求。

圖 2 顯示了兩個選項,使用基線較長的低分辨率相機或基線較短的高分辨率相機。第一個選項是較大的相機,但計算需求較低,而第二個選項是更緊湊的相機,但計算需求較高。對于此應(yīng)用,我們選擇了第二個選項,因為緊湊的尺寸更適合移動機器人,我們可以使用適用于 TX2 的 Quartet 嵌入式解決方案,該解決方案具有強大的板載 GPU 來滿足處理需求。

poYBAGMEk5yAc0oUAAA9NfCZad8230.jpg

圖 2:示例應(yīng)用的立體聲系統(tǒng)設(shè)計選項

硬件要求

在本例中,我們使用 IMX273 Sony Pregius 全局快門傳感器將兩臺 Blackfly S 板級 160 萬像素相機安裝在 12 cm 基線處的 3D 印刷桿上。這兩臺相機都有類似的 6 mm S 接口鏡頭。相機使用兩條 FPC 電纜連接到“適用于 TX2 的 Quartet 嵌入式解決方案”定制載板。為了同步左右相機以同時捕捉圖像,制作了一條連接兩個相機的同步電纜。圖 3 顯示了我們定制的嵌入式立體聲系統(tǒng)的前后視圖。

pYYBAGMEk5yAfxUEAADKCdbbKaE042.jpg

圖 3:定制嵌入式立體聲系統(tǒng)的前后視圖

下表列出了所有硬件組件:

pYYBAGMEk_-AdQ3PAABWeL4CX1Y522.png

應(yīng)調(diào)整兩個鏡頭,以將相機聚焦在您的應(yīng)用所需的距離范圍內(nèi)。擰緊每個鏡頭上的螺釘(圖 4 中以紅色圈出)以保持對焦。

pYYBAGMEk52AYfvLAAC29PDsNbc034.jpg

圖 4:顯示鏡頭螺釘?shù)牧Ⅲw聲系統(tǒng)側(cè)視圖

軟件要求

a. Spinnaker

Teledyne FLIR Spinnaker SDK 已預(yù)裝在適用于 TX2 的 Quartet 嵌入式解決方案中。Spinnaker 需要與相機進行通信

b. 支持 CUDA 的 OpenCV 4.5.2

SGM(我們正在使用的立體匹配算法)需要 OpenCV 4.5.1 或更高版本。下載包含本文代碼的 zip 文件,并將其解壓縮到 StereoDepth 文件夾。安裝 OpenCV 的腳本是 OpenCVInstaller.sh。在終端中鍵入以下命令:

● cd ~/StereoDepth

● chmod +x OpenCVInstaller.sh

● ./OpenCVInstaller.sh

安裝程序?qū)⒁竽斎牍芾韱T密碼。安裝程序?qū)㈤_始安裝 OpenCV 4.5.2。下載和構(gòu)建 OpenCV 可能需要幾個小時。

校準

抓取和校準立體圖像的代碼可在 “Calibration” 文件夾中找到。使用 SpinView GUI 識別左右相機的序列號。在我們的設(shè)置中,右相機是主相機,左相機是從相機。將主從相機序列號復(fù)制到文件 grabStereoImages.cpp 第 60 和 61 行。在終端中使用以下命令構(gòu)建可執(zhí)行文件:

● cd ~/StereoDepth/Calibration

● mkdir build

● mkdir -p images/{left, right}

● cd build

● cmake ..

● make

從此鏈接打印出棋盤狀圖案,并將其貼在平面上用作校準目標。為了在校準時獲得最佳效果,在 SpinView 中將 Exposure Auto 設(shè)置為 Off 并調(diào)整曝光,使棋盤狀圖案清晰且白色方塊不會過度曝光,如圖 5 所示。收集校準圖像后,增益和曝光可在 SpinView 中設(shè)置為自動。

poYBAGMEk52ASUURAAFDBKrwtzw006.jpg

圖 5:SpinView GUI 設(shè)置

要開始收集圖像,請鍵入

./grabStereoImages

代碼應(yīng)以大約 1 幀/秒的速度開始收集圖像。左側(cè)圖像存儲在 images/left 文件夾中,右側(cè)圖像存儲在 images/right 文件夾中。移動目標,使其出現(xiàn)在圖像的每個角落。您可以旋轉(zhuǎn)目標,從近處和遠處拍攝圖像。默認情況下,該程序捕獲 100 個圖像對,但可以使用命令行參數(shù)進行更改:

./grabStereoImages 20

這將僅收集 20 對圖像。請注意,這將覆蓋之前寫入文件夾中的所有圖像。部分示例校準圖像如圖 6 所示。

pYYBAGMEk56AEWd0AAEHJao6NL8292.jpg

圖 6:示例校準圖像

收集圖像后,通過鍵入以下內(nèi)容運行校準 Python 代碼:

● cd ~/StereoDepth/Calibration

● python cameraCalibration.py

這將生成 2 個名為 “intrinsics.yml” 和 “extrinsics.yml” 的文件,其中包含立體聲系統(tǒng)的內(nèi)部和外部參數(shù)。該代碼默認采用 30mm 棋盤方格,但可以根據(jù)需要進行編輯。在校準結(jié)束時,它會顯示 RMS 誤差,表明校準的好壞。良好校準的典型 RMS 誤差應(yīng)低于 0.5 像素。

實時深度圖

實時計算視差的代碼位于 “Depth” 文件夾中。將相機序列號復(fù)制到文件 live_disparity.cpp 第 230 和 231 行。在終端中使用以下命令構(gòu)建可執(zhí)行文件:

● cd ~/StereoDepth/Depth

● mkdir build

● cd build

● cmake ..

● make

將校準步驟中獲得的 “intrinsics.yml” 和 “extrinsics.yml” 文件復(fù)制到此文件夾。要運行實時深度圖演示,請鍵入

./live_disparity

它將顯示左相機圖像(原始未糾正圖像)和深度圖(我們的最終輸出)。部分示例輸出如圖 7 所示。與相機的距離根據(jù)深度圖右側(cè)的圖例進行顏色編碼。深度圖中的黑色區(qū)域意味著在該區(qū)域中沒有發(fā)現(xiàn)視差數(shù)據(jù)。得益于 NVIDIA Jetson TX2 GPU,它在 1440 × 1080 的分辨率下可運行高達 5 幀/秒,在 720 × 540 的分辨率下可運行高達 13 幀/秒。

要查看特定點的深度,請在深度圖中單擊該點,深度將會顯示出來,如圖 7 中最后一個示例所示。

poYBAGMEk56AdMxZAAGXNCMemYk204.jpg

圖 7:對左相機圖像和相應(yīng)的深度圖進行采樣。底部深度圖還會顯示特定點的深度。

摘要

使用立體視覺來形成深度信息感知的優(yōu)勢眾多,包括在戶外工作良好,能夠提供高分辨率的深度圖,可通過低成本的現(xiàn)成組件制作。當您需要開發(fā)一個定制化的嵌入式立體感知系統(tǒng),根據(jù)此處提供的說明進行操作,也將是一個相對簡單的任務(wù)。


審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5083

    文章

    19131

    瀏覽量

    305549
  • 立體視覺
    +關(guān)注

    關(guān)注

    0

    文章

    36

    瀏覽量

    9784
收藏 人收藏

    評論

    相關(guān)推薦

    雙目立體視覺原理大揭秘(二)

    。基于雙目立體視覺的三維重構(gòu)其基本原理也是模擬人眼并利用空間幾何模型推導出相應(yīng)的算法來解決實際問題。本文以服裝設(shè)計中關(guān)于人體輪廓還原案例做一說明。為了便于理解,本文僅說明案例中一個視角的雙目系統(tǒng),下圖是已經(jīng)
    發(fā)表于 11-21 16:22

    基于立體視覺的變形測量

    ` 本帖最后由 ketianjian 于 2016-3-3 10:01 編輯 關(guān)鍵詞: 機器視覺;攝影測量;計算機視覺立體視覺;變形測量; 大家好!有一段時間沒有跟大家分享交流機器視覺
    發(fā)表于 09-21 10:11

    雙目立體視覺的運用

    高速相機對目標位進行攝像,充當人的雙眼的功能,然后通過系統(tǒng)軟件處理,可以確定任意物體的三維輪廓,還可以得到輪廓上任意點的三維坐標。基于雙目立體視覺這種強大的技術(shù)功能,不但在軍事科研上有所運用,如航天遙測
    發(fā)表于 03-03 09:36

    采用OPT9221 ToF傳感器設(shè)計的立體視覺深度感知電路

    成像對于許多機器人應(yīng)用至關(guān)重要,能讓機器人執(zhí)行基本任務(wù),躲避障礙物,進行導航以及確?;景踩?顯然,提供成像的方式是采用低成本視頻攝像頭,或者再好點,使用兩個攝像頭實現(xiàn)立體視野和深度感知。 但后者
    發(fā)表于 11-27 06:20

    雙目立體視覺在嵌入式中有何應(yīng)用

    雙目立體視覺(BinocularStereoVision)是機器視覺的一種重要形式,因其可簡單地利用左右攝像機中的圖像信息計算得到相機視野中物體相對于攝像機的深度信息使得該技術(shù)擁有廣泛的應(yīng)用前景
    發(fā)表于 12-23 07:19

    基于HALCON的雙目立體視覺系統(tǒng)實現(xiàn)

    雙目立體視覺的研究一直是機器視覺中的熱點和難點。使用雙目立體視覺系統(tǒng)可以確定任意物體的三維輪廓,并且可以得到輪廓上任意點的三維坐標。因此雙目立體視覺系統(tǒng)可以應(yīng)用在
    發(fā)表于 04-08 17:51 ?130次下載
    基于HALCON的雙目<b class='flag-5'>立體視覺系統(tǒng)</b>實現(xiàn)

    圖像處理基本算法-立體視覺

    立體視覺是計算機視覺領(lǐng)域的一個重要課題,它的目的在于重構(gòu)場景的三維幾何信息。立體視覺的研究具有重要的應(yīng)用價值,其應(yīng)用包括移動機器人的自主導航系統(tǒng),航空及遙感測量,工業(yè)自動化
    發(fā)表于 11-17 10:09 ?5530次閱讀

    Humanplus人加為各類機器人提供立體視覺感知解決方案

    依托自主研發(fā)的嵌入式主動/被動雙目立體視覺技術(shù),人加已經(jīng)推出雙目AI攝像頭產(chǎn)品——“司眸”系列,可以為各類機器人提供立體視覺感知解決方案,讓機器人擁有人體感知、自主避障等
    的頭像 發(fā)表于 06-07 14:44 ?5912次閱讀

    雙相機立體視覺和結(jié)構(gòu)光立體視覺原理及優(yōu)勢對比

    目前的深度相機根據(jù)其工作原理可以分為三種:TOF相機、雙相機立體視覺、結(jié)構(gòu)光投射立體視覺。
    的頭像 發(fā)表于 05-14 09:04 ?8055次閱讀

    使用雙目立體視覺實現(xiàn)CCD測距系統(tǒng)設(shè)計的資料說明

    的CCD測距技術(shù)。雙目立體視覺的基本原理是模仿人眼與人類視覺立體感知過程,從兩個視點觀察同一景物,以獲取不同視角下的感知圖像,通過三角測量
    發(fā)表于 11-26 12:05 ?6次下載
    使用雙目<b class='flag-5'>立體視覺</b>實現(xiàn)CCD測距<b class='flag-5'>系統(tǒng)</b>設(shè)計的資料說明

    雙目立體視覺深度測量步驟介紹

    深度信息恢復(fù)是計算機視覺領(lǐng)域的一個重要研究內(nèi)容。使用傳統(tǒng)的光學成像系統(tǒng)對不同距離的物體成像時,需要機械移動會造成圖像放大率變化,導致深度測量產(chǎn)生誤差。近年來,電控調(diào)焦的液晶透鏡光學成像
    的頭像 發(fā)表于 06-14 13:43 ?2939次閱讀

    邊緣AI套件上的立體視覺深度感知

    電子發(fā)燒友網(wǎng)站提供《邊緣AI套件上的立體視覺深度感知.zip》資料免費下載
    發(fā)表于 06-12 14:36 ?0次下載
    邊緣AI套件上的<b class='flag-5'>立體視覺</b><b class='flag-5'>深度</b><b class='flag-5'>感知</b>

    如何通過立體視覺構(gòu)建小巧輕便深度感知系統(tǒng)

    在本文中,我們首先介紹了立體視覺系統(tǒng)的主要部分,并提供了有關(guān)使用硬件組成和開源軟件制作定制立體相機的說明。由于此設(shè)置專注于嵌入式系統(tǒng),因此它將實時計算任何場景的深度圖,而無需電腦主機。
    的頭像 發(fā)表于 07-13 16:49 ?704次閱讀
    如何<b class='flag-5'>通過</b><b class='flag-5'>立體視覺</b><b class='flag-5'>構(gòu)建</b><b class='flag-5'>小巧</b><b class='flag-5'>輕便</b>的<b class='flag-5'>深度</b><b class='flag-5'>感知</b><b class='flag-5'>系統(tǒng)</b>

    立體視覺系統(tǒng)的設(shè)計方案

    電子發(fā)燒友網(wǎng)站提供《立體視覺系統(tǒng)的設(shè)計方案.pdf》資料免費下載
    發(fā)表于 11-06 10:17 ?0次下載
    <b class='flag-5'>立體視覺系統(tǒng)</b>的設(shè)計方案

    計算機視覺中的立體視覺深度感知Python示例實現(xiàn)

    在人工智能和圖像處理的迷人世界中,這些概念在使機器能夠像我們的眼睛一樣感知我們周圍的三維世界中起著關(guān)鍵作用。和我們一起探索立體視覺深度感知背后的技術(shù),揭示計算機如何從二維圖像中獲得
    的頭像 發(fā)表于 11-21 10:50 ?646次閱讀