0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于圖像識(shí)別與圖像處理的簡(jiǎn)述

新機(jī)器視覺 ? 來源:CSDN技術(shù)社區(qū) ? 作者:Away-Far ? 2021-03-27 09:17 ? 次閱讀

圖像識(shí)別過程分為圖像處理和圖像識(shí)別兩個(gè)部分。

4a6d5e0c-8e94-11eb-8b86-12bb97331649.png

圖像處理(imageProcessing)利用計(jì)算機(jī)對(duì)圖像進(jìn)行分析,以達(dá)到所需的結(jié)果。

圖像處理可分為模擬圖像處理和數(shù)字圖像處理,而圖像處理一般指數(shù)字圖像處理。

這種處理大多數(shù)是依賴于軟件實(shí)現(xiàn)的。

其目的是去除干擾、噪聲,將原始圖像編程適于計(jì)算機(jī)進(jìn)行特征提取的形式,主要包括圖像采樣、圖像增強(qiáng)、圖像復(fù)原、圖像編碼與壓縮和圖像分割。

1)圖像采集

圖像采集是數(shù)字圖像數(shù)據(jù)提取的主要方式。數(shù)字圖像主要借助于數(shù)字?jǐn)z像機(jī)、掃描儀、數(shù)碼相機(jī)等設(shè)備經(jīng)過采樣數(shù)字化得到的圖像,也包括一些動(dòng)態(tài)圖像,并可以將其轉(zhuǎn)為數(shù)字圖像,和文字、圖形、聲音一起存儲(chǔ)在計(jì)算機(jī)內(nèi),顯示在計(jì)算機(jī)的屏幕上。圖像的提取是將一個(gè)圖像變換為適合計(jì)算機(jī)處理的形式的第一步。

2)圖像增強(qiáng)

圖像在成像、采集、傳輸、復(fù)制等過程中圖像的質(zhì)量或多或少會(huì)造成一定的退化,數(shù)字化后的圖像視覺效果不是十分滿意。為了突出圖像中感興趣的部分,使圖像的主體結(jié)構(gòu)更加明確,必須對(duì)圖像進(jìn)行改善,即圖像增強(qiáng)。通過圖像增強(qiáng),以減少圖像中的圖像的噪聲,改變?cè)瓉韴D像的亮度、色彩分布、對(duì)比度等參數(shù)。圖像增強(qiáng)提高了圖像的清晰度、圖像的質(zhì)量,使圖像中的物體的輪廓更加清晰,細(xì)節(jié)更加明顯。圖像增強(qiáng)不考慮圖像降質(zhì)的原因,增強(qiáng)后的圖像更加賞欣悅目,為后期的圖像分析和圖像理解奠定基礎(chǔ)。

3)圖像復(fù)原

圖像復(fù)原也稱圖像恢復(fù),由于在獲取圖像時(shí)環(huán)境噪聲的影響、運(yùn)動(dòng)造成的圖像模糊、光線的強(qiáng)弱等原因使得圖像模糊,為了提取比較清晰的圖像需要對(duì)圖像進(jìn)行恢復(fù),圖像恢復(fù)主要采用濾波方法,從降質(zhì)的圖像恢復(fù)原始圖。圖像復(fù)原的另一種特殊技術(shù)是圖像重建,該技術(shù)是從物體橫剖面的一組投影數(shù)據(jù)建立圖像。

4)圖像編碼與壓縮

數(shù)字圖像的顯著特點(diǎn)是數(shù)據(jù)量龐大,需要占用相當(dāng)大的存儲(chǔ)空間。但基于計(jì)算機(jī)的網(wǎng)絡(luò)帶寬和的大容量存儲(chǔ)器無法進(jìn)行數(shù)據(jù)圖像的處理、存儲(chǔ)、傳輸。為了能快速方便地在網(wǎng)絡(luò)環(huán)境下傳輸圖像或視頻,那么必須對(duì)圖像進(jìn)行編碼和壓縮。目前,圖像壓縮編碼已形成國(guó)際標(biāo)準(zhǔn),如比較著名的靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG,該標(biāo)準(zhǔn)主要針對(duì)圖像的分辨率、彩色圖像和灰度圖像,適用于網(wǎng)絡(luò)傳輸?shù)臄?shù)碼相片、彩色照片等方面。由于視頻可以被看作是一幅幅不同的但有緊密相關(guān)的靜態(tài)圖像的時(shí)間序列,因此動(dòng)態(tài)視頻的單幀圖像壓縮可以應(yīng)用靜態(tài)圖像的壓縮標(biāo)準(zhǔn)。圖像編碼壓縮技術(shù)可以減少圖像的冗余數(shù)據(jù)量和存儲(chǔ)器容量、提高圖像傳輸速度、縮短處理時(shí)間。

5)圖像分割技術(shù)

圖像分割是把圖像分成一些互不重疊而又具有各自特征的子區(qū)域,每一區(qū)域是像素的一個(gè)連續(xù)集,這里的特性可以是圖像的顏色、形狀、灰度和紋理等。圖像分割根據(jù)目標(biāo)與背景的先驗(yàn)知識(shí)將圖像表示為物理上有意義的連通區(qū)域的集合。即對(duì)圖像中的目標(biāo)、背景進(jìn)行標(biāo)記、定位,然后把目標(biāo)從背景中分離出來。目前,圖像分割的方法主要有基于區(qū)域特征的分割方法、基于相關(guān)匹配的分割方法和基于邊界特征的分割方法[2]。由于采集圖像時(shí)會(huì)受到各種條件的影響會(huì)是圖像變的模糊、噪聲干擾,使得圖像分割是會(huì)遇到困難。在實(shí)際的圖像中需根據(jù)景物條件的不同選擇適合的圖像分割方法。圖像分割為進(jìn)一步的圖像識(shí)別、分析和理解奠定了基礎(chǔ)。

圖像識(shí)別將圖像處理得到的圖像進(jìn)行特征提取和分類。識(shí)別方法中基本的也是常用的方法有統(tǒng)計(jì)法(或決策理論法)、句法(或結(jié)構(gòu))方法、神經(jīng)網(wǎng)絡(luò)法、模板匹配法和幾何變換法。

1)統(tǒng)計(jì)法(StatisticMethod)

該方法是對(duì)研究的圖像進(jìn)行大量的統(tǒng)計(jì)分析,找出其中的規(guī)律并提取反映圖像本質(zhì)特點(diǎn)的特征來進(jìn)行圖像識(shí)別的。它以數(shù)學(xué)上的決策理論為基礎(chǔ),建立統(tǒng)計(jì)學(xué)識(shí)別模型,因而是一種分類誤差最小的方法。常用的圖像統(tǒng)計(jì)模型有貝葉斯(Bayes)模型和馬爾柯夫(Markow)隨機(jī)場(chǎng)(MRF)模型。但是,較為常用的貝葉斯決策規(guī)則雖然從理論上解決了最優(yōu)分類器的設(shè)計(jì)問題,其應(yīng)用卻在很大程度受到了更為困難的概率密度估計(jì)問題的限制。同時(shí),正是因?yàn)榻y(tǒng)計(jì)方法基于嚴(yán)格的數(shù)學(xué)基礎(chǔ),而忽略了被識(shí)別圖像的空間結(jié)構(gòu)關(guān)系,當(dāng)圖像非常復(fù)雜、類別數(shù)很多時(shí),將導(dǎo)致特征數(shù)量的激增,給特征提取造成困難,也使分類難以實(shí)現(xiàn)。尤其是當(dāng)被識(shí)別圖像(如指紋、染色體等)的主要特征是結(jié)構(gòu)特征時(shí),用統(tǒng)計(jì)法就很難進(jìn)行識(shí)別。

2)句法識(shí)別法(Syntactic Recognition)

該方法是對(duì)統(tǒng)計(jì)識(shí)別方法的補(bǔ)充,在用統(tǒng)計(jì)法對(duì)圖像進(jìn)行識(shí)別時(shí),圖像的特征是用數(shù)值特征描述的,而句法方法則是用符號(hào)來描述圖像特征的。它模仿了語言學(xué)中句法的層次結(jié)構(gòu),采用分層描述的方法,把復(fù)雜圖像分解為單層或多層的相對(duì)簡(jiǎn)單的子圖像,主要突出被識(shí)別對(duì)象的空間結(jié)構(gòu)關(guān)系信息。模式識(shí)別源于統(tǒng)計(jì)方法,而句法方法則擴(kuò)大了模式識(shí)別的能力,使其不僅能用于對(duì)圖像的分類,而且可以用于對(duì)景物的分析與物體結(jié)構(gòu)的識(shí)別。但是,當(dāng)存在較大的干擾和噪聲時(shí),句法識(shí)別方法抽取子圖像(基元)困難,容易產(chǎn)生誤判率,難以滿足分類識(shí)別精度和可靠度的要求。

3)神經(jīng)網(wǎng)絡(luò)方法(NeuralNetwork)

該方法是指用神經(jīng)網(wǎng)絡(luò)算法對(duì)圖像進(jìn)行識(shí)別的方法。神經(jīng)網(wǎng)絡(luò)系統(tǒng)是由大量的,同時(shí)也是很簡(jiǎn)單的處理單元(稱為神經(jīng)元),通過廣泛地按照某種方式相互連接而形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),雖然每個(gè)神經(jīng)元的結(jié)構(gòu)和功能十分簡(jiǎn)單,但由大量的神經(jīng)元構(gòu)成的網(wǎng)絡(luò)系統(tǒng)的行為卻是豐富多彩和十分復(fù)雜的。它反映了人腦功能的許多基本特征,是人腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)的簡(jiǎn)化、抽象和模擬。句法方法側(cè)重于模擬人的邏輯思維,而神經(jīng)網(wǎng)絡(luò)側(cè)重于模擬和實(shí)現(xiàn)人的認(rèn)知過程中的感知覺過程、形象思維、分布式記憶和自學(xué)習(xí)自組織過程,與符號(hào)處理是一種互補(bǔ)的關(guān)系。由于神經(jīng)網(wǎng)絡(luò)具有非線性映射逼近、大規(guī)模并行分布式存儲(chǔ)和綜合優(yōu)化處理、容錯(cuò)性強(qiáng)、獨(dú)特的聯(lián)想記憶及自組織、自適應(yīng)和自學(xué)習(xí)能力,因而特別適合處理需要同時(shí)考慮許多因素和條件的問題以及信息不確定性(模糊或不精確)問題。在實(shí)際應(yīng)用中,由于神經(jīng)網(wǎng)絡(luò)法存在收斂速度慢、訓(xùn)練量大、訓(xùn)練時(shí)間長(zhǎng),且存在局部最小,識(shí)別分類精度不夠,難以適用于經(jīng)常出現(xiàn)新模式的場(chǎng)合,因而其實(shí)用性有待進(jìn)一步提高。

4)模板匹配法(TemplateMatching)

它是一種最基本的圖像識(shí)別方法。所謂模板是為了檢測(cè)待識(shí)別圖像的某些區(qū)域特征而設(shè)計(jì)的陣列,它既可以是數(shù)字量,也可以是符號(hào)串等,因此可以把它看為統(tǒng)計(jì)法或句法的一種特例。所謂模板匹配法就是把已知物體的模板與圖像中所有未知物體進(jìn)行比較,如果某一未知物體與該模板匹配,則該物體被檢測(cè)出來,并被認(rèn)為是與模板相同的物體。模板匹配法雖然簡(jiǎn)單方便,但其應(yīng)用有一定的限制。因?yàn)橐砻魉形矬w的各種方向及尺寸,就需要較大數(shù)量的模板,且其匹配過程由于需要的存儲(chǔ)量和計(jì)算量過大而不經(jīng)濟(jì)。同時(shí),該方法的識(shí)別率過多地依賴于已知物體的模板,如果已知物體的模板產(chǎn)生變形,會(huì)導(dǎo)致錯(cuò)誤的識(shí)別。此外,由于圖像存在噪聲以及被檢測(cè)物體形狀和結(jié)構(gòu)方面的不確定性,模板匹配法在較復(fù)雜的情況下往往得不到理想的效果,難以絕對(duì)精確,一般都要在圖像的每一點(diǎn)上求模板與圖像之間的匹配量度,凡是匹配量度達(dá)到某一閾值的地方,表示該圖像中存在所要檢測(cè)的物體。經(jīng)典的圖像匹配方法利用互相關(guān)計(jì)算匹配量度,或用絕對(duì)差的平方和作為不匹配量度,但是這兩種方法經(jīng)常發(fā)生不匹配的情況,因此,利用幾何變換的匹配方法有助于提高穩(wěn)健性。

5)典型的幾何變換方法主要有霍夫變換HT (Hough Transform)。

霍夫變換是一種快速形狀匹配技術(shù),它對(duì)圖像進(jìn)行某種形式的變換,把圖像中給定形狀曲線上的所有點(diǎn)變換到霍夫空間,而形成峰點(diǎn),這樣,給定形狀的曲線檢測(cè)問題就變換為霍夫空間中峰點(diǎn)的檢測(cè)問題,可以用于有缺損形狀的檢測(cè),是一種魯棒性(Robust)很強(qiáng)的方法。為了減少計(jì)算量和和內(nèi)存空間以提高計(jì)算效率,又提出了改進(jìn)的霍夫算法,如快速霍夫變換(FHT)、自適應(yīng)霍夫變換(AHT)及隨機(jī)霍夫變換(RHT)。其中隨機(jī)霍夫變換RHT(RandomizedHough Transform)是20世紀(jì)90年代提出的一種精巧的變換算法,其突出特點(diǎn)不僅能有效地減少計(jì)算量和內(nèi)存容量,提高計(jì)算效率,而且能在有限的變換空間獲得任意高的分辨率。
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1296

    瀏覽量

    56823
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    521

    瀏覽量

    38312

原文標(biāo)題:圖像識(shí)別過程(概述)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI圖像識(shí)別攝像機(jī)

    ?AI圖像識(shí)別攝像機(jī)是一種集成了先進(jìn)算法和深度學(xué)習(xí)模型的智能監(jiān)控設(shè)備。這些攝像機(jī)不僅能夠捕捉視頻畫面,還能實(shí)時(shí)分析和處理所拍攝的內(nèi)容,從而實(shí)現(xiàn)對(duì)特定對(duì)象、場(chǎng)景或行
    的頭像 發(fā)表于 11-08 10:38 ?314次閱讀
    AI<b class='flag-5'>圖像識(shí)別</b>攝像機(jī)

    AI大模型在圖像識(shí)別中的優(yōu)勢(shì)

    AI大模型在圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對(duì)AI大模型在圖像識(shí)別中優(yōu)勢(shì)的介紹: 一、高效性與準(zhǔn)確性 處理
    的頭像 發(fā)表于 10-23 15:01 ?835次閱讀

    圖像識(shí)別算法有哪幾種

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的核心技術(shù)之一,它通過分析和處理圖像數(shù)據(jù),實(shí)現(xiàn)對(duì)圖像中的目標(biāo)、場(chǎng)景和物體的識(shí)別和分類。
    的頭像 發(fā)表于 07-16 11:22 ?1219次閱讀

    圖像檢測(cè)和圖像識(shí)別的原理、方法及應(yīng)用場(chǎng)景

    圖像檢測(cè)和圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要概念,它們?cè)谠S多應(yīng)用場(chǎng)景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測(cè) 圖像檢測(cè)(Object Detection)是指在
    的頭像 發(fā)表于 07-16 11:19 ?4679次閱讀

    圖像識(shí)別算法都有哪些方法

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進(jìn)行分類、識(shí)別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,圖像識(shí)別算法已經(jīng)取得了顯著的進(jìn)展。本文將介紹
    的頭像 發(fā)表于 07-16 11:14 ?5826次閱讀

    圖像識(shí)別算法的提升有哪些

    引言 圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù)之一,旨在使計(jì)算機(jī)能夠自動(dòng)地識(shí)別和理解圖像中的內(nèi)容。隨著計(jì)算機(jī)硬件的發(fā)展和深度學(xué)習(xí)技術(shù)的突破,圖像識(shí)別算法的性能得到了顯著提升。本文將介紹
    的頭像 發(fā)表于 07-16 11:12 ?694次閱讀

    圖像識(shí)別算法的優(yōu)缺點(diǎn)有哪些

    圖像識(shí)別算法可以快速地處理大量圖像數(shù)據(jù),提高工作效率。與傳統(tǒng)的人工識(shí)別方法相比,圖像識(shí)別算法可以在短時(shí)間內(nèi)完成對(duì)大量
    的頭像 發(fā)表于 07-16 11:09 ?1796次閱讀

    圖像識(shí)別算法的核心技術(shù)是什么

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究方向,其目標(biāo)是使計(jì)算機(jī)能夠像人類一樣理解和識(shí)別圖像中的內(nèi)容。圖像識(shí)別算法的核心技術(shù)包括以下幾個(gè)方面: 特征提取 特征提取是
    的頭像 發(fā)表于 07-16 11:02 ?695次閱讀

    圖像識(shí)別技術(shù)包括自然語言處理

    圖像識(shí)別技術(shù)與自然語言處理是人工智能領(lǐng)域的兩個(gè)重要分支,它們?cè)诤芏喾矫嬗兄芮械穆?lián)系,但也存在一些區(qū)別。 一、圖像識(shí)別技術(shù)與自然語言處理的關(guān)系 1.1
    的頭像 發(fā)表于 07-16 10:54 ?894次閱讀

    圖像識(shí)別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    一、引言 圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行分析和處理的技術(shù)。隨著計(jì)算機(jī)技術(shù)、人工智能技術(shù)、大數(shù)據(jù)技術(shù)等的發(fā)展,圖像識(shí)別技術(shù)在各個(gè)領(lǐng)域的應(yīng)用越來越廣泛。在醫(yī)療領(lǐng)域,
    的頭像 發(fā)表于 07-16 10:48 ?1027次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別和理解圖像中的對(duì)象、場(chǎng)景和活動(dòng)。 圖像預(yù)
    的頭像 發(fā)表于 07-16 10:46 ?1224次閱讀

    圖像識(shí)別屬于人工智能嗎

    的過程。它涉及到圖像的獲取、預(yù)處理、特征提取、分類和識(shí)別等多個(gè)環(huán)節(jié)。 1.2 重要性 圖像識(shí)別技術(shù)在人工智能領(lǐng)域具有重要的地位,它使計(jì)算機(jī)能夠“看”和“理解”
    的頭像 發(fā)表于 07-16 10:44 ?1223次閱讀

    opencv圖像識(shí)別有什么算法

    圖像識(shí)別算法: 邊緣檢測(cè) :邊緣檢測(cè)是圖像識(shí)別中的基本步驟之一,用于識(shí)別圖像中的邊緣。常見的邊緣檢測(cè)算法有Canny邊緣檢測(cè)器、Sobel邊緣檢測(cè)器和Laplacian邊緣檢測(cè)器。 特
    的頭像 發(fā)表于 07-16 10:40 ?1140次閱讀

    如何利用CNN實(shí)現(xiàn)圖像識(shí)別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識(shí)別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化等操作,自動(dòng)提取圖像中的特征,進(jìn)而實(shí)現(xiàn)高效的圖像識(shí)別。本
    的頭像 發(fā)表于 07-03 16:16 ?1464次閱讀

    圖像識(shí)別技術(shù)原理 圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域

    。圖像識(shí)別技術(shù)已經(jīng)在各個(gè)領(lǐng)域廣泛應(yīng)用,其應(yīng)用領(lǐng)域包括但不限于以下幾個(gè)方面。 一、智能安防領(lǐng)域 圖像識(shí)別技術(shù)在智能安防領(lǐng)域得到了廣泛的應(yīng)用。通過對(duì)監(jiān)控?cái)z像頭中的圖像進(jìn)行實(shí)時(shí)分析和處理,可
    的頭像 發(fā)表于 02-02 11:01 ?2628次閱讀