1、數(shù)字圖像處理的目的
數(shù)字圖像處理主要完成的任務有:
(1)提高圖像的視覺質量以達到人眼主觀滿意或較滿意的效果。例如,圖像的增強﹑圖像的復原﹑圖像的幾何變換,圖像的代數(shù)運算,圖像的濾波處理等有可能使受到污染、干擾等因素影響產(chǎn)生的低清晰度、變形等圖像質量問題得到有效的改善。
(2) 提取圖像中目標的某些特征,以便于計算機分析或機器人識別。這些處理也可以劃歸于“圖像分析”的范疇。例如,邊緣檢測,圖像分割,紋理分析常用作模式識別、計算機視覺等高級處理的預處理。
(3)為了存儲和傳輸龐大的圖像和視頻信息,常常對這類數(shù)據(jù)進行有效的壓縮。常用的方法有統(tǒng)計編碼預測編碼和正交變換編碼等。
(4)信息的可視化。如溫度場、流速場、生物組織內(nèi)部等許多信息并非可視,但轉化為視覺形式后可以充分利用人們對可視模式快速識別的自然能力,更便于人們觀察,分析、研究、理解大規(guī)模數(shù)據(jù)和許多復雜現(xiàn)象。信息可視化結合了科學可視化,人機交互,數(shù)據(jù)挖掘、圖像技術,圖形學,認知科學等諸多學科的理論和方法,是研究人與計算機表示的信息,以及它們相互影響的技術。
(5)信息安全的需要,主要反映在數(shù)字圖像水印和圖像信息隱藏。這是圖像工程出現(xiàn)的新熱點之一。數(shù)字水印是利用多媒體數(shù)字產(chǎn)品中普遍存在的冗余數(shù)據(jù)與隨機性,把水印信息可見或不可見的嵌入到數(shù)字作品中﹐以期達到保護數(shù)字產(chǎn)品的版權或完整性的一種技術。在計算機通信﹑密碼學等學科也有其用武之地。
在這些目的中,華南理工大學土木視覺實驗室的工作重點放在提取圖像特征和信息的可視化。其中提取圖像特征用于識別結構的響應信息用于結構狀態(tài)識別,信息可視化用于圖像輔助檢測,圖像輔助教學,圖像輔助科研等。具體工作將在后續(xù)公眾號文章中分享。
2 、數(shù)字圖像處理的特點
數(shù)字圖像處理利用數(shù)字計算機或其他專用的數(shù)字設備處理圖像,與模擬方式相比具有以下鮮明的特點。
(1)處理精度高
圖像采集設備可將一幅模擬圖像數(shù)字化為任意大小和精度的二維數(shù)組供處理設備加工。根據(jù)應用的需求,數(shù)字化的像素數(shù)可以從幾十到幾百萬,甚至上千萬,每個像素的等級可以量化為從1位到16位甚至更高,活動圖像的幀率可以從十幾赫茲到六十赫茲,高速攝像達幾千赫茲到上萬赫茲。
而對處理設備來說,不同數(shù)據(jù)量的圖像其處理程序大致是一樣的。圖像精度高這一點在現(xiàn)階段土木工程中并不突出,由于現(xiàn)有測量儀器的精度也已經(jīng)足夠高了。基于圖像識別技術的位移測量精度受限于儀器與被測物距離,測量光線等因素,測量精度并不理想。
(2)重現(xiàn)性能好
理論上,數(shù)字圖像處理不會因圖像的存儲、傳輸?shù)冗^程而導致圖像質量的退化。圖像的質量主要受數(shù)字化過程時取樣樣本數(shù)﹑量化精度,處理過程中的處理精度等的限制。由于在一定范圍內(nèi),人眼和機器視覺的分辨率都是有限的,因此只要保持足夠的處理精度,圖像重現(xiàn)性就會很好﹐能保證圖像的原貌。
(3)靈活性高
與模擬圖像處理相比較﹐由于圖像處理軟件功能強大、擴展性好﹑用戶界面友好,數(shù)字圖像處理不僅能完成一般的線性和非線性處理,而且一切可以用程序實現(xiàn)的智能信息處理方法都可以加以采用。
(4)圖像信息量大
在數(shù)字圖像處理中,一幅圖像可以看成是由圖像矩陣中的像素組成的,通常每個像素用紅﹑綠,藍三種顏色表示,每種顏色用8bit表示灰度級,一幅1024像素×1024像素不經(jīng)壓縮的真彩色圖像,數(shù)據(jù)量達3MB。一幅3240像素×2340像素的遙感圖像,采用4bit量化,占用約3.8MB的存儲空間。一幅中等分辨率的VGA640像素×480像素的256色圖像的數(shù)據(jù)量為300KB。
傳送一路PCM彩色電視圖像的速率達108Mbit/s,則每秒的數(shù)據(jù)量可達13.5MB。大數(shù)據(jù)量和傳輸速率對計算機的計算速度,網(wǎng)絡帶寬﹑媒體存儲容量等提出了很高的要求,如果精度及分辨率再提高,所需處理時間將大幅度增加,因此數(shù)據(jù)壓縮成為不可缺少的處理環(huán)節(jié)。
這段表述中僅僅提到了圖像自身存儲所需信息量大,其實圖像中所含信息本身具有高冗余性、同步性、高相關性、魯棒性等特點,這些特點才是土木工程中應用圖像處理技術的關鍵。
(5)數(shù)字圖像信號占用的頻帶較寬
在模擬域,視頻信號的帶寬比音頻信號的帶寬要大幾個數(shù)量級。為了保證圖像的質量,根據(jù)采樣定理,數(shù)字化后﹐數(shù)字視頻占用的頻帶進一步加寬。所以,在成像﹑傳輸﹑存儲、處理,顯示等各個環(huán)節(jié)的實現(xiàn)上,技術難度較大,成本較高,寬頻帶對處理和傳輸設備提出了更高的要求,因此頻帶壓縮技術也是數(shù)字圖像處理的一個值得注意的問題。這一特點是由信息量大導致的。
(6) 處理費時
由于圖像數(shù)據(jù)量較大,因此處理比較費時。特別是采用區(qū)域處理方法時,由于處理結果與中心像素鄰域有關而導致花費的時間更多。要實現(xiàn)快速甚至實時處理圖像,就要對圖像處理系統(tǒng)提出更高的要求,多處理器并行處理器、嵌入式系統(tǒng)等專用處理系統(tǒng)為提高圖像處理速度提供了有效的解決方法。這一特點同樣是由信息量大導致的。
3、數(shù)字圖像處理的主要研究內(nèi)容
數(shù)字圖像處理的研究內(nèi)容大體可分為以下幾個方面。
(1)圖像信息的獲取和存儲
圖像的獲取是將自然界的圖像通過光學系統(tǒng)成像并由電子器件或系統(tǒng)轉化為模擬圖像信號,再由模擬/數(shù)字轉換器得到原始的數(shù)字圖像信號,也稱為圖像的采集。圖像信息的突出特點是數(shù)據(jù)量巨大,一般主要采用磁帶,磁盤或光盤進行存儲。為解決海量存儲問題,主要研究數(shù)據(jù)壓縮、圖像格式及圖像數(shù)據(jù)庫技術等。
(2)圖像頻域變換
圖像陣列很大,直觀性強,但圖像的頻率,紋理等特性在空間域中難以獲得和處理﹐計算量也很大。各種圖像變換的方法,如離散傅里葉變換﹑離散余弦變換,小波變換等,可以間接地將空間域的處理轉換到變換域進行更有效的處理。
通過二維離散傅里葉變換(DFT),可以將空間域的圖像變換為圖像頻譜,再在頻率域進行各種數(shù)字濾波以獲得圖像質量的改善、數(shù)據(jù)量的壓縮或突出某些特征便于后期處理。通過離散傅里葉變換,可以將圖像變換到頻率域,通過不同頻段的不同處理,可以達到滿意的效果。
(3)圖像幾何變換
圖像幾何變換的目的是改變一幅圖像的大小或形狀。例如,通過平移、旋轉、放大、縮小、鏡像等,可以進行兩幅以上圖像內(nèi)容的配準﹐以便于進行圖像之間內(nèi)容的對比檢測。在印章的真?zhèn)巫R別以及相似商標檢測中,通常都會采用這類的處理。另外,對于圖像中景物的幾何畸變進行校正,對圖像中的目標物大小測量等,也需要進行圖像幾何變換處理。
(4)圖像增強
圖像增強處理主要是突出圖像中感興趣的信息,而減弱或去除不需要的信息,從而使有用的信息得到加強,便于區(qū)分或解釋。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節(jié)明顯;而強化低頻分量可減少圖像中的噪聲影響,即對高頻噪聲起到平滑作用,其主要方法有直方圖修正,偽彩色增強法﹑圖像平滑,圖像銳化等技術。
(5)圖像復原
圖像復原處理主要是去掉干擾和模糊,恢復圖像的本來面目,以達到清晰化的目的。圖像退化的原因是過程有噪聲﹑運動造成的模糊、光學系統(tǒng)的幾何失真等,如果對其有一定的了解,通過理論推導或實驗數(shù)據(jù)甚至可以建立退化的數(shù)學模型,那么可以采用某種濾波方法在一定程度上從降質的圖像恢復原始圖像。
(6)圖像壓縮編碼
數(shù)據(jù)量龐大是數(shù)字圖像的顯著特點之一。在多媒體技術中,現(xiàn)有的大容量存儲器和寬帶網(wǎng)絡技術仍不能滿足對圖像數(shù)據(jù)處理,存儲和傳輸?shù)男枰D像信息具有較強的相關特性,存在大量冗余信息,因此通過改變圖像數(shù)據(jù)的表示方法,可對圖像的數(shù)據(jù)冗余進行壓縮。另外,利用人類的視覺特性,可對圖像的視覺冗余進行壓縮,由此來達到減小描述圖像數(shù)據(jù)量的目的。
(7)圖像分割
圖像可以看成是由背景和一個或多個目標組成的。圖像分割是按一定的規(guī)則將圖像分成若干個有意義或感興趣的區(qū)域的過程,每個區(qū)域可代表一個對象。通過圖像分割,圖像中如邊緣﹑區(qū)域等有意義的特征部分被提取出來,
(8)圖像重建
圖像重建的目的是根據(jù)二維平面圖像數(shù)據(jù)構造出三維物體的圖像。例如,在醫(yī)學影像技術中的CT成像技術,就是將多幅斷層二維平面數(shù)據(jù)重建成可描述人體組織器官三維結構的圖像。三維重建技術成為目前虛擬現(xiàn)實技術以及科學可視化技術的重要基礎。
(9)圖像隱藏
圖像隱藏的目的是將一幅圖像或者某些可數(shù)字化的媒體信息隱藏在一幅圖像中。在保密通信中,將需要保密的圖像在不增加數(shù)據(jù)量的前提下﹐隱藏在一幅可公開的圖像之中,同時要求達到不可見性及抗干擾性。圖像隱藏的重要應用之一是數(shù)字水印技術。數(shù)字水印在維護數(shù)字媒體版權方面起著非常重要的作用。
4、數(shù)字圖像處理系統(tǒng)
圖像處理技術具有不接觸、快速、直觀、準確的優(yōu)點,同時由于環(huán)境條件等因素的影響,圖像質量不可能很高,必須采用數(shù)字圖像處理技術進行幾何校正、恢復、增強等加工,從而還原圖像的本來面目。
(1)圖像數(shù)字化設備(攝像單元):掃描儀,數(shù)碼相機,攝像機與圖像采集卡等。
(2)圖像處理計算機:PC、工作站等,它可以實現(xiàn)通信(通信模塊通過局域網(wǎng)等實現(xiàn)網(wǎng)絡傳輸圖像數(shù)據(jù)),存儲(存儲模塊采用磁盤,光盤等)和圖像的處理與分析(主要是運算,用算法的形式描述,用軟件實現(xiàn))。
(3)圖像輸出設備:顯示器,打印機等。
5 、數(shù)字圖像處理的發(fā)展趨勢
數(shù)字圖像處理技術是20世紀60年代初開始發(fā)展起來的,經(jīng)過了初創(chuàng)期﹑發(fā)展期、普及期及廣泛應用幾個階段。經(jīng)過幾十年的研究與發(fā)展,數(shù)字圖像處理的理論和方法進一步完善,應用范圍更加廣闊;已經(jīng)成為一門新興的交叉學科,現(xiàn)已進人實用階段。
近幾年來,隨著計算機和各個相關領域研究的迅速發(fā)展,科學計算可視化、多媒體技術等研究和應用的興起,數(shù)字圖像處理從一個專門領域的學科,變成了一種新型的科學研究和人機界面的工具,其研究和應用呈現(xiàn)出蓬勃發(fā)展的嶄新勢頭。數(shù)字圖像處理的發(fā)展趨勢主要反映在以下幾個方面。
(1)從低分辨率向高分辨率方向發(fā)展
隨著圖像傳感器分辨率和計算機運算速度的不斷提高,圖像存儲器內(nèi)存、計算機內(nèi)存及外設存儲容量不斷增大,數(shù)字圖像由低分辨率向高分辨率不斷發(fā)展,數(shù)字圖像處理的運算量也越來越大,對處理和顯示設備的要求也越來越高。
(2)從二維(2D)向三維(3D)方向發(fā)展
三維圖像獲取及處理技術主要通過全息攝影實現(xiàn),或通過斷層掃描與圖像重建實現(xiàn)。隨著圖像技術和計算機技術的發(fā)展,三維圖像的展示將極大提升用戶的浸入感。
(3)從靜止圖像向動態(tài)圖像方向發(fā)展
隨著傳感器分辨率和主機運算速度的提高,計算機內(nèi)存及外存容量的增大,數(shù)字圖像處理由以靜止圖像處理為主發(fā)展到靜止圖像和動態(tài)圖像并存并相互補充相互促進的局面。
(4)從單態(tài)圖像向多態(tài)圖像方向發(fā)展
多態(tài)圖像是指對于同一目標,景物或場景,采用不同的圖像傳感器或在不同條件下獲取圖像,然后對這些圖像進行綜合處理和應用。
參考文獻
[1]吳娛。 數(shù)字圖像處理[M]。 北京郵電大學出版社,2017.10,北京
土木視覺實驗室
—版權聲明—
僅用于學術分享,版權屬于原作者。
若有侵權,請聯(lián)系刪除或修改!
編輯:jq
-
數(shù)字圖像處理
+關注
關注
7文章
103瀏覽量
18925
原文標題:數(shù)字圖像處理技術概述
文章出處:【微信號:gh_f39db674fbfd,微信公眾號:尖刀視】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論