前言
在計(jì)算機(jī)視覺中,直方圖的有著很廣泛的的應(yīng)用,通常用來統(tǒng)計(jì)圖像中的某些特征,比如邊緣特征、色彩特征、梯度特征等等。
直方圖通過一種統(tǒng)計(jì)的方法,來表征圖形的特征。這篇文章簡單來探討一下直方圖以及它的一個(gè)應(yīng)用--反向投影。
直方圖
直返圖的計(jì)算其實(shí)很簡單,和我們數(shù)學(xué)中的直方圖差不多,就是統(tǒng)計(jì)某一特征,在這里我們用統(tǒng)計(jì)灰度值舉例子。
首先來看一段畫直方圖的代碼:
#include
#include
using namespace cv;
using namespace std;
int main(int argc, char **argv)
{
Mat img = imread("football2.png");
cout << "img size " << img.size() << endl;
cvtColor(img, img, COLOR_BGR2GRAY);
imshow("img", img);
Rect rect(330, 270, 160, 160); //lofated of football
Mat img_obj = img(rect);
imshow("img_obj", img_obj);
int bin = 4;
int channels = 0;
int size = 256 / bin;
float hranges[] = {0, 256};
const float *ranges[] = {hranges};
const float *ranges_back = {hranges};
// 計(jì)算直方圖
MatND hist;
calcHist(&img_obj, 1, &channels, Mat(), hist, 1, &size, ranges);
double minValue = 0;
double maxValue = 0;
minMaxLoc(hist, &minValue, &maxValue, 0, 0);
cout << "maxValue: " << maxValue << endl;
Mat img_hist(maxValue, size, CV_8UC3, Scalar(0, 0, 0));
for (int i = 0; i < size; i++)
{
float bin_value = hist.at<float>(i);
rectangle(img_hist,Point(i, maxValue), Point(i+1, maxValue-bin_value), Scalar(0, 255, 0));
}
imshow("img_hist", img_hist);
......
waitKey(0);
return 0;
}
直方圖有個(gè)一概念,就是bin,其實(shí)是組距的意思,代碼中是4,就是按照[0, 4)、[4, 8)、[8, 12)......[251,255)為x軸來做統(tǒng)計(jì)的。
整個(gè)代碼其實(shí)簡單,OpenCV畫直方圖的函數(shù)是calcHist,我們要了解函數(shù)的用法以及每個(gè)參數(shù)的意思,在這了不在贅述。另外,它的原理其實(shí)不難,如果想自己實(shí)現(xiàn)一下,應(yīng)該也是比較簡單的。
反向投影
在這篇博客https://blog.csdn.net/zhangjunp3/article/details/79862424是這樣說的
反向投影其實(shí)是直方圖運(yùn)算的逆過程。直方圖運(yùn)算是統(tǒng)計(jì)每個(gè)灰度值對(duì)應(yīng)的像素個(gè)數(shù),而反向投影則是將像素個(gè)數(shù)回送到該像素個(gè)數(shù)對(duì)應(yīng)灰度區(qū)間的像素位置。
反向投影是直方圖運(yùn)算的逆過程,這個(gè)是最最要的內(nèi)容,上面講的已經(jīng)差不多了,下面我們自己來實(shí)現(xiàn)一下反向投影。
接著上面直方圖的代碼繼續(xù):
......
//將直方圖歸一化為[0, 255]區(qū)間,方面下面可視化
normalize(hist, hist, 0, 255, NORM_MINMAX, -1, Mat());
Mat img_back_proj = img.clone();
for (int i = 0; i < img_back_proj.rows; i++)
{
uchar *p = img_back_proj.ptr
代碼的核心就是這句話:p[j] = hist.at(p[j] / bin);
將p[j]位置的像素值帶到直放圖的x軸,得到該像素值在直方圖中的個(gè)數(shù),用統(tǒng)計(jì)的個(gè)數(shù)取代原先的像素值。
代碼的運(yùn)行結(jié)果如下:
可以看出來,在這個(gè)例子中足球的匹配效果還是很好的,
在這個(gè)例子中,我們用的是灰度值做的直方圖,另外的一些特征,比如顏色,邊緣都是可以用來做統(tǒng)計(jì)的。
審核編輯:劉清
-
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1700瀏覽量
46086 -
OpenCV
+關(guān)注
關(guān)注
31文章
635瀏覽量
41488
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論