機(jī)器視覺(jué)系統(tǒng)中,視覺(jué)信息的處理技術(shù)主要依賴于圖像處理方法,它包括圖像增強(qiáng)、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺(jué)效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。
1、圖像的增強(qiáng)
圖像的增強(qiáng)用于調(diào)整圖像的對(duì)比度,突出圖像中的重要細(xì)節(jié),改善視覺(jué)質(zhì)量。通常采用灰度直方圖修改技術(shù)進(jìn)行圖像增強(qiáng)。
圖像的灰度直方圖是表示一幅圖像灰度分布情況的統(tǒng)計(jì)特性圖表,與對(duì)比度緊密相連。
通常,在計(jì)算機(jī)中表示的一幅二維數(shù)字圖像可表示為一個(gè)矩陣,其矩陣中的元素是位于相應(yīng)坐標(biāo)位置的圖像灰度值,是離散化的整數(shù),一般取0,1,……,255。這主要是因?yàn)橛?jì)算機(jī)中的一個(gè)字節(jié)所表示的數(shù)值范圍是0~255。另外,人眼也只能分辨32個(gè)左右的灰度級(jí)。所以,用一個(gè)字節(jié)表示灰度即可。
但是,直方圖僅能統(tǒng)計(jì)某級(jí)灰度像素出現(xiàn)的概率,反映不出該像素在圖像中的二維坐標(biāo)。因此,不同的圖像有可能具有相同的直方圖。通過(guò)灰度直方圖的形狀,能判斷該圖像的清晰度和黑白對(duì)比度。
如果獲得一幅圖像的直方圖效果不理想,可以通過(guò)直方圖均衡化處理技術(shù)作適當(dāng)修改,即把一幅已知灰度概率分布圖像中的像素灰度作某種映射變換,使它變成一幅具有均勻灰度概率分布的新圖像,實(shí)現(xiàn)使圖象清晰的目的。
2、圖像的平滑
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過(guò)程中,因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。眾所周知,實(shí)際獲得的圖像在形成、傳輸、接收和處理的過(guò)程中,不可避免地存在著外部干擾和內(nèi)部干擾,如光電轉(zhuǎn)換過(guò)程中敏感元件靈敏度的不均勻性、數(shù)字化過(guò)程的量化噪聲、傳輸過(guò)程中的誤差以及人為因素等,均會(huì)使圖像變質(zhì)。因此,去除噪聲,恢復(fù)原始圖像是圖像處理中的一個(gè)重要內(nèi)容。
在本世紀(jì)四、五十年代發(fā)展起來(lái)的線性濾波器以其完善的理論基礎(chǔ),數(shù)學(xué)處理方便,易于采用FFT和硬件實(shí)現(xiàn)等優(yōu)點(diǎn),一直在圖像濾波領(lǐng)域占有重要地位,其中以WIENER濾波器理論和卡爾曼濾波理論為代表。但是線性濾波器存在著計(jì)算復(fù)雜度高,不便于實(shí)時(shí)處理等缺點(diǎn)。雖然它對(duì)高斯噪聲有良好的平滑作用,但對(duì)脈沖信號(hào)干擾和其它形式的噪聲干擾抑制效果差,信號(hào)邊緣模糊。為此,1971年,著名學(xué)者TUKEY提出非線笥濾波器——中值濾波器,即把局部區(qū)域中灰度的中值作為輸出灰度,并將其與統(tǒng)計(jì)學(xué)理論結(jié)合起來(lái),使用迭代方法,比較理想地將圖像從噪聲中恢復(fù)出來(lái),并且能保護(hù)圖像的輪廓邊界,不使其變模糊。近年來(lái),非線性濾波理論在機(jī)器視覺(jué)、醫(yī)學(xué)成像、語(yǔ)音處理等領(lǐng)域有了廣泛的應(yīng)用,同時(shí),也反過(guò)來(lái)促使該理論的研究向縱深方向發(fā)展。
3、圖像的數(shù)據(jù)編碼和傳輸
數(shù)字圖像的數(shù)據(jù)量是相當(dāng)龐大的,一幅512*512個(gè)像素的數(shù)字圖像的數(shù)據(jù)量為256 K字節(jié),若假設(shè)每秒傳輸25幀圖像,則傳輸?shù)男诺浪俾蕿?2.4M比特/秒。高信道速率意味著高投資,也意味著普及難度的增加。因此,傳輸過(guò)程中,對(duì)圖像數(shù)據(jù)進(jìn)行壓縮顯得非常重要。數(shù)據(jù)的壓縮主要通過(guò)圖像數(shù)據(jù)的編碼和變換壓縮完成。
圖像數(shù)據(jù)編碼一般采用預(yù)測(cè)編碼,即將圖像數(shù)據(jù)的空間變化規(guī)律和序列變化規(guī)律用一個(gè)預(yù)測(cè)公式表示,如果知道了某一像素的前面各相鄰像素值之后,可以用公式預(yù)測(cè)該像素值。采用預(yù)測(cè)編碼,一般只需傳輸圖像數(shù)據(jù)的起始值和預(yù)測(cè)誤差,因此可將8比特/像素壓縮到2比特/像素。
變換壓縮方法是將整幅圖像分成一個(gè)個(gè)小的(一秀取8*8或16*16)數(shù)據(jù)塊,再將這些數(shù)據(jù)塊分類、變換、量化,從而構(gòu)成自適應(yīng)的變換壓縮系統(tǒng)。該方法可將一幅圖像的數(shù)據(jù)壓縮到為數(shù)不多的幾十個(gè)特傳輸,在接收端再變換回去即可。
4、邊緣銳化
圖像邊緣銳化處理主要是加強(qiáng)圖像中的輪廓邊緣和細(xì)節(jié),形成完整的物體邊界,達(dá)到將物體從圖像中分離出來(lái)或?qū)⒈硎就晃矬w表面的區(qū)域檢測(cè)出來(lái)的目的。它是早期視覺(jué)理論和算法中的基本問(wèn)題,也是中期和后期視覺(jué)成敗的重要因素之一。
5、圖像的分割
圖像分割是將圖像分成若干部分,每一部分對(duì)應(yīng)于某一物體表面,在進(jìn)行分割時(shí),每一部分的灰度或紋理符合某一種均勻測(cè)度度量。某本質(zhì)是將像素進(jìn)行分類。分類的依據(jù)是像素的灰度值、顏色、頻譜特性、空間特性或紋理特性等。圖像分割是圖像處理技術(shù)的基本方法之一,應(yīng)用于諸如染色體分類、景物理解系統(tǒng)、機(jī)器視覺(jué)等方面。
圖像分割主要有兩種方法:一是鑒于度量空間的灰度閾值分割法。它是根據(jù)圖像灰度直方圖來(lái)決定圖像空間域像素聚類。但它只利用了圖像灰度特征,并沒(méi)有利用圖像中的其它有用信息,使得分割結(jié)果對(duì)噪聲十分敏感;二是空間域區(qū)域增長(zhǎng)分割方法。它是對(duì)在某種意義上(如灰度級(jí)、組織、梯度等)具有相似性質(zhì)的像素連通集構(gòu)成分割區(qū)域,該方法有很好的分割效果,但缺點(diǎn)是運(yùn)算復(fù)雜,處理速度慢。其它的方法如邊緣追蹤法,主要著眼于保持邊緣性質(zhì),跟蹤邊緣并形成閉合輪廓,將目標(biāo)分割出來(lái);錐體圖像數(shù)據(jù)結(jié)構(gòu)法和標(biāo)記松弛迭代法同樣是利用像素空間分布關(guān)系,將邊鄰的像素作合理的歸并。而基于知識(shí)的分割方法則是利用景物的先驗(yàn)信息和統(tǒng)計(jì)特性,首先對(duì)圖像進(jìn)行初始分割,抽取區(qū)域特征,然后利用領(lǐng)域知識(shí)推導(dǎo)區(qū)域的解釋,最后根據(jù)解釋對(duì)區(qū)域進(jìn)行合并。
6、圖像的識(shí)別
圖像的識(shí)別過(guò)程實(shí)際上可以看作是一個(gè)標(biāo)記過(guò)程,即利用識(shí)別算法來(lái)辨別景物中已分割好的各個(gè)物體,給這些物體賦予特定的標(biāo)記,它是機(jī)器視覺(jué)系統(tǒng)必須完成的一個(gè)任務(wù)。
按照?qǐng)D像識(shí)別從易到難,可分為三類問(wèn)題。第一類識(shí)別問(wèn)題中,圖像中的像素表達(dá)了某一物體的某種特定信息。如遙感圖像中的某一像素代表地面某一位置地物的一定光譜波段的反射特性,通過(guò)它即可判別出該地物的種類。第二類問(wèn)題中,待識(shí)別物是有形的整體,二維圖像信息已經(jīng)足夠識(shí)別該物體,如文字識(shí)別、某些具有穩(wěn)定可視表面的三維體識(shí)別等。但這類問(wèn)題不像第一類問(wèn)題容易表示成特征矢量,在識(shí)別過(guò)程中,應(yīng)先將待識(shí)別物體正確地從圖像的背景中分割出來(lái),再設(shè)法將建立起來(lái)的圖像中物體的屬性圖與假定模型庫(kù)的屬性圖之間匹配。第三類問(wèn)題是由輸入的二維圖、要素圖、2·5維圖等,得出被測(cè)物體的三維表示。這里存著如何將隱含的三維信息提取出來(lái)的問(wèn)題,當(dāng)是今研究的熱點(diǎn)。
目前用于圖像識(shí)別的方法主要分為決策理論和結(jié)構(gòu)方法。決策理論方法的基礎(chǔ)是決策函數(shù),利用它對(duì)模式向量進(jìn)行分類識(shí)別,是以定時(shí)描述(如統(tǒng)計(jì)紋理)為基礎(chǔ)的;結(jié)構(gòu)方法的核心是將物體分解成了模式或模式基元,而不同的物體結(jié)構(gòu)有不同的基元串(或稱字符串),通過(guò)對(duì)未知物體利用給定的模式基元求出編碼邊界,得到字符串,再根據(jù)字符串判斷它的屬類。這是一種依賴于符號(hào)描述被測(cè)物體之間關(guān)系的方法。
責(zé)任編輯:lq6
-
圖像識(shí)別
+關(guān)注
關(guān)注
9文章
520瀏覽量
38273 -
數(shù)據(jù)編解碼
+關(guān)注
關(guān)注
0文章
2瀏覽量
6187 -
機(jī)器視覺(jué)系統(tǒng)
+關(guān)注
關(guān)注
1文章
83瀏覽量
18867
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論