麻豆成人91久久精品二区三区 ,国产成人精品手机在线观看 ,精品国产一区二区三区香蕉下载

雙目立體視覺一直是機器視覺研究領域的發(fā)展熱點和難點，“熱”是因為雙目立體視覺有著及其廣闊的應用前景，且隨著光學、計算機科學等學科的不斷發(fā)展，雙目立體技術將不斷進步直到應用到人類生活的方方面面。“難”則是因為受到攝像機、鏡頭等硬件設備及一些相關算法的限制。

01 簡介

雙目立體視覺是機器視覺中的一個重要分支，自上世紀60年代中期開創(chuàng)以來，經(jīng)過幾十年的發(fā)展，如今在機器人視覺、航空測繪、軍事應及醫(yī)學成像、工業(yè)檢測上應用極其廣泛。雙目立體視覺基于視差原理并利用成像設備從不同的位置獲取被測物體的左右兩幅圖像，然后根據(jù)三角測量原理計算空間點在二維圖像的位置偏差，最后再利用位置偏差進行三維重建來獲取被測物體的三維幾何信息（本文不對雙目立體視覺的數(shù)學原理進行詳細介紹）。

雙目立體視覺的三大基本算法的原理及其代碼實現(xiàn)（基于opencv）

雙目立體視覺中常用的基于區(qū)域的局部匹配準則主要有圖像序列中對應像素差的絕對值之和SAD（sum of absolute differences）、對應像素差的平方之和SSD（sum of squared differences）及半全局匹配算法SGM（semi—global matching）。

2.1 SAD（sum of absolute differences）的原理

匹配算法SAD的基本思想是對經(jīng)行對準后的左右視圖圖像的對應像素塊的對應像素差的絕對值進行求和。

其數(shù)學公式如下：

SAD匹配算法的基本流程如下：

①輸入兩幅已經(jīng)校正實現(xiàn)行對準的左視圖（Left-Image）及右視圖（Right-Image）。

②對左視圖Left-Image進行掃描選定一個錨點并構建一個類似于卷積核的小窗口。

③用此小窗口覆蓋Left-Image，并選擇出小窗口覆蓋區(qū)域的全部像素點。

④同樣用此小窗口覆蓋Right-Image，并選擇出小窗口覆蓋區(qū)域的全部像素點。

⑤Left-Image覆蓋區(qū)域的像素減去Right-Image覆蓋區(qū)域的像素，并求出所有像素點的差的絕對值之和。

⑥移動Right-Image的小窗口并重復④—⑤的操作。（注意此處會設置一個搜索范圍，超過此范圍則跳出）

⑦找到這個范圍內SAD值最小的小窗口，此時便找到了與Left-Image錨點的最佳匹配的像素塊。

2.1.1 SAD（sum of absolute differences）的基于opencv的C++代碼實現(xiàn)

首先先定義一個SAD 算法的頭文件（SAD_Algorithm.h）：

#include"iostream"
#include"opencv2/opencv.hpp"
#include"iomanip"
using namespace std;
using namespace cv;
class SAD
{
public:
  SAD() :winSize(7), DSR(30) {}
  SAD(int _winSize, int _DSR) :winSize(_winSize), DSR(_DSR) {}
  Mat computerSAD(Mat &L, Mat &R); //計算SAD


private:
  int winSize; //卷積核的尺寸
  int DSR;     //視差搜索范圍
};


Mat SAD::computerSAD(Mat &L, Mat &R)
{
  int Height = L.rows;
  int Width = L.cols;


  Mat Kernel_L(Size(winSize, winSize), CV_8U, Scalar::all(0));
  Mat Kernel_R(Size(winSize, winSize), CV_8U, Scalar::all(0));
  Mat Disparity(Height, Width, CV_8U, Scalar(0)); //視差圖


  for (int i = 0; i= 0)
        {
          Kernel_R = R(Rect(x, j, winSize, winSize));
          Mat Dif;
          absdiff(Kernel_L, Kernel_R, Dif);//求差的絕對值之和
          Scalar ADD = sum(Dif);
          float a = ADD[0];
          MM.at(k) = a;
        }
      }
      Point minLoc;
      minMaxLoc(MM, NULL, NULL, &minLoc, NULL);
      int loc = minLoc.x;
      //int loc=DSR-loc;
      Disparity.at(j, i) = loc * 16;
    }
    double rate = double(i) / (Width);
    cout << "已完成" << setprecision(2) << rate * 100 << "%" << endl; //顯示處理進度
  }
  return Disparity;
}


調用示例：
#include"SAD_Algorithm.h"
int main(int argc, char* argv[])
{
  Mat Img_L = imread("Teddy_L.png", 0);   //此處調用的圖像已放入項目文件夾中
  Mat Img_R = imread("Teddy_R.png", 0);
  Mat Disparity;                            //創(chuàng)建視差圖


  SAD mySAD(7, 30);                        //給出SAD的參數(shù)


  Disparity = mySAD.computerSAD(Img_L, Img_R);
  imshow("Teddy_L", Img_L);
  imshow("Teddy_R", Img_R);
  imshow("Disparity", Disparity);        //顯示視差圖


  waitKey();
  system("pause");                        //按任意鍵退出
  return 0;
}

2.1.2 SAD算法的運行效果

可以看出SAD算法雖然運行較快，但效果較差。

2.2 SSD（sum of squared differences）的原理

SSD（sum of squared differences）算法大致與SAD（sum of absolute differences）相似。

其數(shù)學公式如下：

因SSD匹配算法與SAD匹配算法的過程及代碼實現(xiàn)相類似，考慮到篇幅長度的原因，故SSD算法的基本過程及代碼實現(xiàn)在本文中不在贅述，讀者可去自行實現(xiàn)。

2.3 SGBM（semi-global block matching）的原理

SGM(semi-global matching)是一種用于計算雙目立體視覺中的disparity的半全局匹配算法。其在opencv中的實現(xiàn)為SGBM（semi-global block matching）。

SGBM的原理：設置一個和disparity map（由每個像素點的disparity所構成）相關的全局能量函數(shù)，使這個能量函數(shù)最小。

原始文獻：Heiko Hirschmuller. Stereo processing by semiglobal matching and mutual information.Pattern Analysis and Machine Intelligence, IEEE Transactions on, 30(2):328–341, 2008.

其能量函數(shù)如下：

D--disparity map(視差圖)

p、q—圖像中的某個像素

Np—像素點Pd 相鄰像素點（一般認為是8連通）

C（P,Dp）--當前像素點的disparity為Dp時，該像素點的cost

P1、P2—懲罰系數(shù)，分別適用于當像素P相鄰像素中的disparity值與P的disparity差值為1和大于1時

I[]—當[]內的參數(shù)為真時返回1，否則返回0

SGBM算法的基本流程如下：

①預處理：使用sobel算子對源圖像進行處理，并將經(jīng)sobel算子處理后的圖像映射為新圖像，并得到圖像的梯度信息用于后續(xù)的計算代價。

②代價計算：使用采樣方法對經(jīng)預處理得到的圖像梯度信息計算梯度代價、使用采樣方法對源圖像計算SAD代價。

③動態(tài)規(guī)劃：默認四條路經(jīng)，并對路徑規(guī)劃的參數(shù)P1，P2進行設置（包括P1、P2、cn（圖像通道數(shù)量）以及SADWindowsize（SAD窗口大?。┑脑O置）。

④后處理：包括唯一性檢測、亞像素插值、左右一致性檢測、連通區(qū)域的檢測。

2.3.1 SGBM（semi-global block matching）的基于opencv的C++代碼實現(xiàn)

首先先定義一個SGBM算法的頭文件（SGBM_Algorithm.h）:

具體參數(shù)見代碼及其注釋（若讀者需優(yōu)化可自行調整），不再贅述

enum { STEREO_BM = 0, STEREO_SGBM = 1, STEREO_HH = 2, STEREO_VAR = 3, STEREO_3WAY = 4 };
#include"iostream"
#include"opencv2/opencv.hpp"
using namespace std;
using namespace cv;


void calDispWithSGBM(Mat Img_L, Mat Img_R, Mat &imgDisparity8U)
{
  Size imgSize = Img_L.size();
  int numberOfDisparities = ((imgSize.width / 8) + 15) & -16;
  Ptr sgbm = StereoSGBM::create(0, 16, 3);


  int cn = Img_L.channels();                        //左圖像的通道數(shù)
  int SADWindowSize = 9;
  int sgbmWinSize = SADWindowSize > 0 ? SADWindowSize : 3;


  sgbm->setMinDisparity(0);                         //minDisparity最小視差默認為0；


  sgbm->setNumDisparities(numberOfDisparities);     //numDisparity視差搜索范圍，其值必須為16的整數(shù)倍；


  sgbm->setP1(8 * cn*sgbmWinSize*sgbmWinSize);
  sgbm->setP2(32 * cn*sgbmWinSize*sgbmWinSize);     //一般建議懲罰系數(shù)P1、P2取此兩值，P1、P2控制視差圖的光滑度
                                                    //P2越大，視差圖越平滑


  sgbm->setDisp12MaxDiff(1);                        //左右一致性檢測最大容許誤差閾值


  sgbm->setPreFilterCap(31);                        //預處理濾波器的截斷值，預處理的輸出值僅保留
                                                    //[-preFilterCap, preFilterCap]范圍內的值，參數(shù)范圍：1 - 31


  sgbm->setUniquenessRatio(10);                     //視差唯一性百分比：視差窗口范圍內最低代價是次低代價的(1 + uniquenessRatio/100)倍時
                                                    //最低代價對應的視差值才是該像素點的視差，否則該像素點的視差為 0 ，不能為負值，一般去5——15


  sgbm->setSpeckleWindowSize(100);                  //視差連通區(qū)域像素點個數(shù)的大小：對于每一個視差點，當其連通區(qū)域的像素點個數(shù)小于
                                                    //speckleWindowSize時，認為該視差值無效，是噪點。


  sgbm->setSpeckleRange(32);                        //視差連通條件：在計算一個視差點的連通區(qū)域時，當下一個像素點視差變化絕對值大于
                                                    //speckleRange就認為下一個視差像素點和當前視差像素點是不連通的。


  sgbm->setMode(0);                                 //模式選擇


  sgbm->setBlockSize(sgbmWinSize);                  //設置SAD代價計算窗口，一般在3*3到21*21之間
                                                    //blockSize(SADWindowSize) 越小，也就是匹配代價計算的窗口越小，視差圖噪聲越大；
                                                    //blockSize越大，視差圖越平滑；
                                                    //太大的size容易導致過平滑，并且誤匹配增多，體現(xiàn)在視差圖中空洞增多


//三種模式選擇（HH、SGBM、3WAY）
  int algorithm = STEREO_SGBM;


  if (algorithm == STEREO_HH)
    sgbm->setMode(StereoSGBM::MODE_HH);
  else if (algorithm == STEREO_SGBM)
    sgbm->setMode(StereoSGBM::MODE_SGBM);
  else if (algorithm == STEREO_3WAY)
    sgbm->setMode(StereoSGBM::MODE_SGBM_3WAY);


  Mat imgDisparity16S = Mat(Img_L.rows, Img_L.cols, CV_16S);


  sgbm->compute(Img_L, Img_R, imgDisparity16S);


  //--Display it as a CV_8UC1 image：16位有符號轉為8位無符號
  imgDisparity16S.convertTo(imgDisparity8U, CV_8U, 255 / (numberOfDisparities*16.));
}


調用示例：
#include"SGBM_Algorithm.h"
int main()
{
  Mat Img_L = imread("Teddy_L.png", 0);
  Mat Img_R = imread("Teddy_R.png", 0);
  Mat Disparity8U = Mat(Img_L.rows, Img_R.cols, CV_8UC1);//創(chuàng)建一個Disparity圖像


  calDispWithSGBM(Img_L, Img_R, Disparity8U);
  imshow("Teddy_L", Img_L);
  imshow("Teddy_R", Img_R);
  imshow("Disparity", Disparity8U);


  waitKey();
  system("pause");  //按任意鍵退出
  return 0;
}

2.3.2 SGBM算法的運行效果

還順便調整了SADWindowsize的大小來給讀者探討并展示當設置不同SADWindowsize大小時對Disparity效果圖的影響，其結果如下（皆為MODE_SGBM模式下）：

由上述在不同SADWindowsize大小設置（其他參數(shù)保持不變）的效果圖對比下我們可得知如下結論：

SADWindowsize過小時，視差圖的噪聲較多；隨著SADWindowsize的增大，視圖越平滑，但當SADWindowsize過大時，視差圖中的空洞現(xiàn)象會增加；故在選擇SADWindowsize的大小時，應選取合適的大?。ńㄗh選擇SADWindowsize=9）。

03 雙目立體視覺的發(fā)展現(xiàn)狀

目前在國外，雙目立體視覺技術已廣泛運用于生產生活實際中，但在我國，雙目立體視覺技術仍處在起步階段，仍需要在座的各位發(fā)奮圖強、力爭創(chuàng)新。

3.1 雙目立體視覺的發(fā)展方向

就雙目立體視覺的發(fā)展現(xiàn)況和發(fā)展目標（達到類似于人眼的通用雙目立體視覺）仍是路漫漫其修遠兮，我認為進一步的發(fā)展方向可以歸納如下：

①探索新的更具有通用性的計算理論和匹配算法結構，以解決目前存在的灰度失真、噪聲干擾以及幾何畸變的問題。

②提高算法的性能，對算法進行優(yōu)化，盡可能向實時效果推進。

③建立更有效的雙目體視模型能更充分地反映立體視覺不確定性的本質屬性，為匹配提供更多的約束信息，降低立體匹配的難度。

④強調場景與任務的約束，建立適用于不同場景和任務的雙目立體視覺系統(tǒng)的標準和方法。

3.2 雙目立體視覺的國內外發(fā)展動態(tài)

雙目體視目前主要應用于四個領域：機器人導航、微操作系統(tǒng)的參數(shù)檢測、三維測量和虛擬現(xiàn)實。

目前在國外，日本大阪大學自適應機械系統(tǒng)研究院研制了一種自適應雙目視覺伺服系統(tǒng)，利用雙目體視的原理，如每幅圖像中相對靜止的三個標志為參考，實時計算目標圖像的雅可比短陣，從而預測出目標下一步運動方向，實現(xiàn)了對動方式未知的目標的自適應跟蹤。該系統(tǒng)僅要求兩幅圖像中都有靜止的參考標志，無需攝像機參數(shù)。

日本奈良科技大學信息科學學院提出了一種基于雙目立體視覺的增強現(xiàn)實系統(tǒng)（ar）注冊方法，通過動態(tài)修正特征點的位置提高注冊精度。

日本東京大學將實時雙目立體視覺和機器人整體姿態(tài)信息集成，開發(fā)了仿真機器人動態(tài)行長導航系統(tǒng)，為機器人根據(jù)實時情況建立實時地圖從而實現(xiàn)障礙物檢測。

日本岡山大學使用立體顯微鏡、兩個ccd攝像頭、微操作器等研制了使用立體顯微鏡控制微操作器的視覺反饋系統(tǒng)，用于對細胞進行操作，對鐘子進行基因注射和微裝配等。

麻省理工學院計算機系統(tǒng)提出了一種新的用于智能交通工具的傳感器融合方式，由雷達系統(tǒng)提供目標深度的大致范圍，利用雙目立體視覺提供粗略的目標深度信息，結合改進的圖像分割算法，從而實現(xiàn)在高速環(huán)境下對視頻圖像中的目標位置進行分割。

華盛頓大學與微軟公司合作為火星衛(wèi)星“探測者”號研制了寬基線立體視覺系統(tǒng)，使“探測者”號能夠在火星上對其即將跨越的幾千米內的地形進行精確的定位及導航。

在國內，浙江大學機械系統(tǒng)完全利用透視成像原理，采用雙目體視方法實現(xiàn)了對多自由度機械裝置的動態(tài)、精確位姿檢測，僅需從兩幅對應圖像中抽取必要的特征點的三維坐標，信息量少，處理速度快，尤其適于動態(tài)情況。

INDEMIND公司基于雙目立體視覺，開發(fā)了一種針對商用和家用服務機器人的視覺導航技術，在算法和硬件上，提出了一套自研的VSLAM算法和集合多種視覺傳感器的一體化模組，可以實現(xiàn)機器人視覺定位、語義識別、語義建圖、避障、交互等多種功能。

東南大學電子工程系基于雙目立體視覺，提出了一種灰度相關多峰值視差絕對值極小化立體匹配新方法，可對三維不規(guī)則物體（偏轉線圈）的三維空間坐標進行非接觸精密測量。

哈工大采用異構雙目活動視覺系統(tǒng)實現(xiàn)了全自主足球機器人導航。將一個固定攝像機和一個可以水平旋轉的攝像機，分別安裝在機器人的頂部和中下部，可以同時監(jiān)視不同方位視點，體現(xiàn)出比人類視覺優(yōu)越的一面。即使在實際比賽中當其他傳感器失效的情況下，僅僅依靠雙目協(xié)調仍然可以實現(xiàn)全自主足球機器人導航。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

機器視覺

機器視覺

+關注

關注
162

文章
4373

瀏覽量
120336
SSD

SSD

+關注

關注
21

文章
2862

瀏覽量
117435
C++語言

C++語言

+關注

關注
0

文章
147

瀏覽量
6992
OpenCV

OpenCV

+關注

關注
31

文章
635

瀏覽量
41355
預處理器

預處理器

+關注

關注
0

文章
13

瀏覽量
2232

原文標題：前沿丨關于雙目立體視覺的三大基本算法及發(fā)展現(xiàn)狀

文章出處：【微信號：gh_c87a2bc99401，微信公眾號：INDEMIND】歡迎添加關注！文章轉載請注明出處。

雙目立體視覺三大算法原理及其代碼實現(xiàn)

雙目立體視覺中常用的基于區(qū)域的局部匹配準則主要有圖像序列中對應像素差的絕對值之和SAD（sum of absolute differences）、對應像素差的平方之和SSD（sum of squared differences）及半全局匹配

發(fā)表于 07-01 09:34 ?2195次閱讀

<b class='flag-5'>雙目</b><b class='flag-5'>立體視覺</b><b class='flag-5'>三</b>大<b class='flag-5'>算法</b>原理及其代碼實現(xiàn)

雙目立體視覺原理大揭秘（一）

不同的處理即可。非常感謝CCAS雙目視覺軟件對我們研究解析的大力支持，關于這方面的內容可以去試試CCAS雙目視覺軟件，感興趣的朋友可以去網(wǎng)上找找相關資料。事實上，雙目

發(fā)表于 11-21 16:20

雙目立體視覺原理大揭秘（二）

。基于雙目立體視覺的三維重構其基本原理也是模擬人眼并利用空間幾何模型推導出相應的算法來解決實際問題。本文以服裝設計中關于人體輪廓還原案例做一

發(fā)表于 11-21 16:22

雙目立體視覺的運用

高速相機對目標位進行攝像，充當人的雙眼的功能，然后通過系統(tǒng)軟件處理，可以確定任意物體的三維輪廓，還可以得到輪廓上任意點的三維坐標?；?b class='flag-5'>雙目立體視覺這種強大的技術功能，不但在軍事科研上有

發(fā)表于 03-03 09:36

LABVIEW能做雙目立體視覺嗎

最近在做一個雙目立體視覺項目，LABVIEW有模塊嗎，有哪位大神用LABVIEW做過

發(fā)表于 01-13 19:44

雙目立體視覺在嵌入式中有何應用

。特別是經(jīng)過近幾十年來的發(fā)展,立體視覺在機器人視覺、航空測繪、反求工程、軍事運用、醫(yī)學成像和工業(yè)檢測等領域中的運用越來越廣,但是雙目立體視覺

發(fā)表于 12-23 07:19

雙目立體視覺中靶標的設計與識別

0 引言雙目立體視覺測量是基于視差原理，由多幅圖像獲取物體三維幾何信息的方法。在計算機視覺系統(tǒng)中，雙目

發(fā)表于 09-26 17:07 ?1377次閱讀

基于HALCON的雙目立體視覺系統(tǒng)實現(xiàn)

雙目立體視覺的研究一直是機器視覺中的熱點和難點。使用雙目立體視覺系統(tǒng)可以確定任意物體的三維輪廓，

發(fā)表于 04-08 17:51 ?130次下載

雙目立體視覺傳感器精度分析與參數(shù)設計

根據(jù)雙目立體視覺傳感器三角立體視差模型，建立了結構參數(shù)誤差的傳遞函數(shù)，分析了雙目視覺傳感器結構參數(shù)及其誤差傳遞規(guī)律對傳感器綜合測量精度的影響

發(fā)表于 09-06 14:38 ?75次下載

基于雙目立體視覺的橋梁裂縫測量

針對國內外橋梁裂縫測量效率低、成本高、精度低等現(xiàn)狀，提出了一種基于雙目立體視覺技術的橋梁裂縫測量系統(tǒng)。采用相機標定、圖像匹配、三維坐標計算等雙目

發(fā)表于 01-16 14:59 ?0次下載

使用雙目立體視覺實現(xiàn)CCD測距系統(tǒng)設計的資料說明

雙目立體視覺測量是人類利用雙眼獲取環(huán)境三維信息的主要途徑。隨著計算機視覺理論的發(fā)展，雙目

發(fā)表于 11-26 12:05 ?6次下載

雙目立體計算機視覺的立體匹配研究綜述

雙目立體視覺技術具有成本低、適用性廣的優(yōu)點，在物體識別、目標檢測等方面應用廣泛，成為計算機視覺領域的研究熱點。立體匹配是雙目

發(fā)表于 04-12 09:47 ?3次下載

雙目立體視覺的定義與理解

總結一下，我們現(xiàn)在認識了三種制造立體視覺的方法，分別是視覺陷阱、全息投影和產生視差。雙目立體視覺這一有著廣闊應用前景的學科，隨著光學，電子

發(fā)表于 10-31 15:20 ?3130次閱讀

雙目立體視覺原理 HALCON的雙目視覺系統(tǒng)研究

　　立體視覺技術是機器人技術研究中最為活躍的一個分支，是智能機器人的重要標志。雙目立體視覺是通過對同一目標的兩幅圖像提取、識別、匹配和解釋，進行三維環(huán)境信息的重建。其過程主要包括視頻捕

發(fā)表于 07-19 14:18 ?2次下載

雙目立體視覺是什么？單目視覺與雙目立體視覺的區(qū)別？

雙目更多的是基于物理測量，而單目視覺則是基于邏輯推理，通過大量的數(shù)據(jù)訓練，先識別出目標，再根據(jù)目標的大小和高度估算距離。因此，單目視覺的漏檢率高于雙目

發(fā)表于 08-17 09:40 ?3911次閱讀