0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計算機視覺常用算法_計算機視覺有哪些分類

姚小熊27 ? 來源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2020-07-30 17:34 ? 次閱讀

計算機視覺常用算法

計算機視覺算法在圖像識別方面的一些難點:

1)視角變化:同一物體,攝像頭可以從多個角度來展現(xiàn);

2)大小變化:物體可視的大小通常是會變化的(不僅是在圖片中,在真實世界中大小也是由變化的);

3)形變:很多東西的形狀并非一成不變,會有很大變化;

4)遮擋:目標物體可能被遮擋。有時候只有物體的一部分(可以小到幾個像素)是可見的; 5)光照條件:在像素層面上,光照的影響非常大;

6)背景干擾:物體可能混入背景之中,使之難以被辨認;

7)類內(nèi)差異:一類物體的個體之間的外形差異很大,如椅子。這一類物體有許多不同的對象,每個都有自己的外形

人臉識別算法主要包含三個模塊:

人臉檢測(Face Detection):確定人臉在圖像中的大小和位置,也就是在圖像中預(yù)測anchor;

人臉對齊(Face Alignment):它的原理是找到人臉的若干個關(guān)鍵點(基準點,如眼角,鼻尖,嘴角等),然后利用這些對應(yīng)的關(guān)鍵點通過相似變換(Similarity Transform,旋轉(zhuǎn)、縮放和平移)將人臉盡可能變換到標準人臉;

人臉特征表征(Feature Representation):它接受的輸入是標準化的人臉圖像,通過特征建模得到向量化的人臉特征,最后通過分類器判別得到識別的結(jié)果。關(guān)鍵點是怎樣得到不同人臉的有區(qū)分度的特征,比如:鼻子、嘴巴、眼睛等。

早期算法:

子空間(線性降維)

PCA(主成成分分析) :盡量多地保留原始數(shù)據(jù)的保留主要信息,降低冗余信息;

LDA(線性判別分析):增大類間差距,減小類內(nèi)差距。

非線性降維: 流形學習、加入核函數(shù)。

ICA(獨立成分分析):比PCA效果好,比較依賴于訓練測試場景,且對光照、人臉的表情、姿態(tài)敏感,泛化能力不足。

HMM(隱馬爾科夫) : 和前面這些算法相比,它對光照變化、表情和姿態(tài)的變化更魯棒。

早期:數(shù)據(jù)和模型結(jié)構(gòu);

后期:loss,從而得到不同人臉的有區(qū)分度的特征。

常用算法總結(jié)

計算機視覺中的相關(guān)算法的源代碼

計算機視覺常用算法博客

特征提?。ㄕ业饺舾蓚€關(guān)鍵點)

(1) SIFT (尺度不變特征變換) 具有尺度不變性,可在圖像中檢測出關(guān)鍵點。

(2) SURF(加速穩(wěn)健特征,SIFT加速版)

核心:構(gòu)建Hessian矩陣,判別當前點是否為比鄰域更亮或更暗的點,由此來確定關(guān)鍵點的位置。

優(yōu):特征穩(wěn)定;

缺:對于邊緣光滑的目標提取能力較弱。

(3) ORB

結(jié)合Fast與Brief算法,并給Fast特征點增加了方向性,使得特征點具有旋轉(zhuǎn)不變性,并提出了構(gòu)造金字塔方法,解決尺度不變性。

ORB算法的速度是sift的100倍,是surf的10倍。

經(jīng)顯示觀察到,ORB算法在特征點標記時數(shù)量較少,如圖:

SIFT、SURF、ORB實現(xiàn)

(4) FAST角點檢測

FAST的方法主要是考慮像素點附近的圓形窗口上的16個像素

如果要提高檢測速度的話,只需要檢測四個點就可以了,首先比較第1和第9個像素,如果兩個點像素強度都在中心像素強度t變化范圍內(nèi)(及都同中心點相似),則說明這不是角點,如果接下來檢測第5和13點時,發(fā)現(xiàn)上述四點中至少有三個點同中心點不相似,則可以說明這是個角點。

非極大值抑制:如果存在多個關(guān)鍵點,則刪除角響應(yīng)度較小的特征點。

(5) HOG (方向梯度直方圖)

(6) LBP(局部二值特征)論述了高維特征和驗證性能存在著正相關(guān)的關(guān)系,即人臉維度越高,驗證的準確度就越高。

(7)Haar

計算機視覺有哪些分類

人類視覺所具有的強大功能和完美的信息處理方式引起了智能研究者的極大興趣,人們希望以生物視覺為藍本研究一個人工視覺系統(tǒng)用于機器人中,期望機器人擁有類似人類感受環(huán)境的能力。機器人要對外部世界的信息進行感知,就要依靠各種傳感器。就像人類一樣,在機器人的眾多感知傳感器中,視覺系統(tǒng)提供了大部分機器人所需的外部相界信息。因此視覺系統(tǒng)在機器人技術(shù)中具有重要的作用。

依據(jù)視覺傳感器的數(shù)量和特性,目前主流的移動機器人視覺系統(tǒng)有單目視覺、雙目立體視覺、多目視覺和全景視覺等。

單目視覺,單目視覺系統(tǒng)只使用一個視覺傳感器。單目視覺系統(tǒng)在成像過程中由于從三維客觀世界投影到N維圖像上,從而損失了深度信息,這是此類視覺系統(tǒng)的主要缺點(盡管如此,單目視覺系統(tǒng)由于結(jié)構(gòu)簡單、算法成熟且計算量較小,在自主移動機器人中已得到廣泛應(yīng)用,如用于目標跟蹤、基于單目特征的室內(nèi)定位導航等。同時,單目視覺是其他類型視覺系統(tǒng)的基礎(chǔ),如雙目立體視覺、多目視覺等都是在單目視覺系統(tǒng)的基礎(chǔ)上,通過附加其他手段和措施而實現(xiàn)的。

雙目立體視覺。雙目視覺系統(tǒng)由兩個攝像機組成,利用三角測量原理獲得場景的深度信息,并且可以重建周圍景物的三維形狀和位置,類似人眼的體視功能,原理簡單。雙目視覺系統(tǒng)需要精確地知道兩個攝像機之間的空間位置關(guān)系,而且場景環(huán)境的3D信息需要兩個攝像機從不同角度,同時拍攝同一場景的兩幅圖像,并進行復雜的匹配,才能準確得到立體視覺系統(tǒng)能夠比較準確地恢復視覺場景的三維信息,在移動機器人定位導航、避障和地圖構(gòu)建等方面得到了廣泛的應(yīng)用用。然而,立體視覺系統(tǒng)的難點是對應(yīng)點匹配的問題,該問題在很大程度上制約著立體視覺在機器人領(lǐng)域的應(yīng)用前景。

多目視覺系統(tǒng)。多目視覺系統(tǒng)采用三個或三個以上攝像機,三目視覺系統(tǒng)居多,主要用來解決又目立體視覺系統(tǒng)中匹配多義性的問題,提高匹配精度。多目視覺系統(tǒng)最早由莫拉維克研究,他為“StanfordCart”研制的視覺導航系統(tǒng)采用單個攝像機的“滑動

立體視覺”來實現(xiàn),雅西達提出了三目立體視覺系統(tǒng)解決對應(yīng)點匹配的問題,真正突破了《目立體視覺系統(tǒng)的局限,并指出以邊界點作為匹配特征的三目視覺系統(tǒng)中,其三元的配的準確率比較高,艾雅湜提出了用多邊形近似宕的邊界點段作為特征的三目匹配算法,并用到移動機器人中,取得了較好的效果,三目視覺系統(tǒng)的優(yōu)點是充分利用了第三個攝像機的信息,減少了錯誤匹配,解決了雙目視覺系統(tǒng)匹配的多義性,提高了定位精度,但三目視覺系統(tǒng)要合理安置三個攝像機的相對位置,其結(jié)構(gòu)配置比雙目視覺系統(tǒng)更煩瑣,而且匹配算法更復雜需要消耗更多的時間,實時性更差

全景視覺,全景視覺系統(tǒng)是具有較大水平視場的多方向成像系統(tǒng),突出的優(yōu)點是有較大的視場,可以達到360度,這是其他常規(guī)鏡頭無法比擬的,全景視覺系統(tǒng)可以通過圖像拼的方法或者通過折反射光學元件實現(xiàn)。圖像拼接的方法使用單個或多個相機旋轉(zhuǎn),對場景進行大角度掃描,獲取不同方向上連續(xù)的多幀圖像,再用拼接技術(shù)得到全景圖。折反射全景視覺系統(tǒng)由CCD攝像機、折反射光學元件等組成,利用反射鏡成像原理,可以觀察360度場景,成像速度快,能達到實時要求,具有十分重要的應(yīng)用前景,可以應(yīng)用在機器人導航中。全景視覺系統(tǒng)本質(zhì)上也是一種單目視覺系統(tǒng),也無法得到場景的深度信息。其另一個特點是獲取的圖像分辨率較低,并且圖像存在很大的畸變,從而會影響圖像處理的穩(wěn)定性和精度。在進行圖像處理時首先需要根據(jù)成像模型對畸變圖像進行校正,這種較正過程不但會影響視覺系統(tǒng)的實時性,而且還會造成信息的損失。另外這種視覺系統(tǒng)對全景反射鏡的加工精度要求很多,若雙曲反射鏡面的精度達不到要求,利用理想模型對圖像校正則會存在較大偏差。

混合視覺系統(tǒng),混合視覺系統(tǒng)吸收各種視覺系統(tǒng)的優(yōu)點,采用兩種或兩種以上的視覺系統(tǒng)組成復合視覺系統(tǒng),多采用單目或雙目視覺系統(tǒng),同時配備其他視覺系統(tǒng)。全景視覺系統(tǒng)由球面反射系統(tǒng)組成,其中全景視覺系統(tǒng)提供大視角的環(huán)境信息,雙目立體視覺系統(tǒng)和激光測距儀檢測近距離的障礙物,清化大學的朱志剛使用一個攝像機研制了多尺度視覺傳感系統(tǒng)POST,實現(xiàn)了雙目注視、全方位環(huán)視和左右兩側(cè)的時代全景成像,為機器人提供了導航。全景視覺系統(tǒng)具有全景視覺系統(tǒng)視場范圍大的優(yōu)點,同時又具備雙目視覺系統(tǒng)精度高的長處,但是該類系統(tǒng)配置復雜,費用比較高。

在不久的將來,多智時代一定會徹底走入我們的生活,有興趣入行未來前沿產(chǎn)業(yè)的朋友,可以收藏多智時代,及時獲取人工智能、大數(shù)據(jù)、云計算物聯(lián)網(wǎng)的前沿資訊和基礎(chǔ)知識,讓我們一起攜手,引領(lǐng)人工智能的未來!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人臉識別
    +關(guān)注

    關(guān)注

    76

    文章

    4012

    瀏覽量

    81903
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1698

    瀏覽量

    45993
收藏 人收藏

    評論

    相關(guān)推薦

    計算機視覺哪些優(yōu)缺點

    計算機視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?960次閱讀

    計算機視覺技術(shù)的AI算法模型

    計算機視覺技術(shù)作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機視覺技術(shù)依賴于
    的頭像 發(fā)表于 07-24 12:46 ?854次閱讀

    機器視覺計算機視覺什么區(qū)別

    機器視覺計算機視覺是兩個密切相關(guān)但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發(fā)表于 07-16 10:23 ?534次閱讀

    計算機視覺的五大技術(shù)

    計算機視覺作為深度學習領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計算機視覺五大技術(shù)的詳細解析,包括圖像
    的頭像 發(fā)表于 07-10 18:26 ?1368次閱讀

    計算機視覺的工作原理和應(yīng)用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學科的研究領(lǐng)域,它利用計算機和數(shù)學算法來模擬人類視覺系統(tǒng)對圖像和視頻進行識別、
    的頭像 發(fā)表于 07-10 18:24 ?1984次閱讀

    計算機視覺與人工智能的關(guān)系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領(lǐng)域的知識。人工智能則是研究如何使計算
    的頭像 發(fā)表于 07-09 09:25 ?651次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計算機視覺 計算機
    的頭像 發(fā)表于 07-09 09:22 ?454次閱讀

    計算機視覺和圖像處理的區(qū)別和聯(lián)系

    數(shù)據(jù)的過程。計算機視覺的目標是使計算機能夠像人類一樣“看到”和理解圖像或視頻內(nèi)容。 1.2 圖像處理 圖像處理,也稱為數(shù)字圖像處理,是應(yīng)用數(shù)學和計算機
    的頭像 發(fā)表于 07-09 09:16 ?1314次閱讀

    計算機視覺在人工智能領(lǐng)域哪些主要應(yīng)用?

    計算機視覺是人工智能領(lǐng)域的一個重要分支,它主要研究如何讓計算機能夠像人類一樣理解和處理圖像和視頻數(shù)據(jù)。計算機視覺技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用
    的頭像 發(fā)表于 07-09 09:14 ?1370次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領(lǐng)域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?1305次閱讀

    計算機視覺怎么給圖像分類

    圖像分類計算機視覺領(lǐng)域中的一項核心任務(wù),其目標是將輸入的圖像自動分配到預(yù)定義的類別集合中。這一過程涉及圖像的特征提取、特征表示以及分類器的設(shè)計與訓練。隨著深度學習技術(shù)的飛速發(fā)展,圖像
    的頭像 發(fā)表于 07-08 17:06 ?693次閱讀

    深度學習在計算機視覺領(lǐng)域的應(yīng)用

    深度學習技術(shù)的引入,極大地推動了計算機視覺領(lǐng)域的發(fā)展,使其能夠處理更加復雜和多樣化的視覺任務(wù)。本文將詳細介紹深度學習在計算機視覺領(lǐng)域的應(yīng)用,
    的頭像 發(fā)表于 07-01 11:38 ?812次閱讀

    機器視覺計算機視覺的區(qū)別

    很多方面有著相似之處,如基礎(chǔ)理論、技術(shù)框架等,但它們在學科分類、應(yīng)用領(lǐng)域、側(cè)重點等方面存在明顯的區(qū)別。本文將對機器視覺計算機視覺進行詳細的對比分析,以便讀者更好地理解兩者的差異。
    的頭像 發(fā)表于 06-06 17:24 ?1334次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數(shù)據(jù)等技術(shù)的快速發(fā)展,計算機
    的頭像 發(fā)表于 06-06 17:17 ?975次閱讀

    計算機視覺的十大算法

    隨著科技的不斷發(fā)展,計算機視覺領(lǐng)域也取得了長足的進步。本文將介紹計算機視覺領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場景和優(yōu)缺點。這些
    的頭像 發(fā)表于 02-19 13:26 ?1241次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大<b class='flag-5'>算法</b>