0引??言
?南疆是中國(guó)最大的紅棗生產(chǎn)基地,目前紅棗病蟲害已經(jīng)成為制約南疆紅棗產(chǎn)業(yè)發(fā)展的主要因素。受到病蟲干擾后,紅棗內(nèi)部會(huì)發(fā)生一系列變化,這種變化積累到一定程度后會(huì)直接表現(xiàn)在外觀上,甚至?xí)饤棙浒l(fā)生變化,例如嚴(yán)重的病蟲害會(huì)導(dǎo)致棗樹的樹葉發(fā)生病變。眾所周知,植物進(jìn)行光合作用依靠的就是綠葉,一旦綠葉受損,將會(huì)嚴(yán)重影響有機(jī)物積累,使得果實(shí)甚至果樹的生長(zhǎng)發(fā)育受到威脅。病變會(huì)使紅棗的光譜發(fā)生變化,因此利用高光譜系統(tǒng)可以對(duì)紅棗病蟲害實(shí)現(xiàn)最有效的監(jiān)管。
1?紅棗病蟲害高光譜圖像采集
高光譜圖像采集的過程如下:?第?1?步,依靠構(gòu)建起來的高光譜圖像系統(tǒng)對(duì)每個(gè)待測(cè)的紅棗進(jìn)行圖樣采集,同時(shí)為了更加便于研究圖像,還要進(jìn)行相應(yīng)的操作。第?2?步,將經(jīng)過處理操作后的圖像敏感區(qū)域進(jìn)行灰度值計(jì)算,這個(gè)灰度值也直接反映了紅棗的光譜圖像信息,具體而言就是首先要確定樣本,而樣本一般要滿足?2?個(gè)要求:?(?一)?單個(gè)病變斑點(diǎn)的灰度值應(yīng)該在?30?個(gè)左右;?(?二)?像素的灰度值在樣本空間中具有均衡的特征。對(duì)于標(biāo)準(zhǔn)的紅棗取樣就與此存在一定的差異性,應(yīng)該從整個(gè)紅棗的頭部、中部以及下部取?3?個(gè)標(biāo)準(zhǔn)樣本作為研究對(duì)象。對(duì)于參照對(duì)象的選取應(yīng)當(dāng)遵循隨機(jī)性的原則,但是要控制參照對(duì)象相同且適宜,即保證取樣的部位應(yīng)當(dāng)均勻包含?30?個(gè)像素光譜灰度值。對(duì)于同種樣本還要保持樣本容量為?50,由于在取樣的過程中涉及到多種病害,各個(gè)病害的樣本又構(gòu)成獨(dú)立的樣本空間,因此?6?個(gè)樣本總的樣本容量即為?300。第?3?步,從各個(gè)不同病害以及正常空白對(duì)照的樣本中隨機(jī)選出?30?個(gè)試驗(yàn)樣本,其他的樣本用作驗(yàn)證測(cè)試。由于在圖像的采集過程中不可避免地存在聲音干擾,所以要準(zhǔn)確分析圖像就要不可避免地進(jìn)行處理。通常的去噪方法是在有光與無光的環(huán)境中分別采集相應(yīng)的圖像,分別記作?W、D,然后利用公式計(jì)算高光譜反射率:
2?紅棗病蟲害高光譜特征譜段的最佳篩選
在南疆紅棗病蟲害高光譜數(shù)據(jù)采集過程中,由于受各種環(huán)境因素及人為因素的制約,采樣數(shù)據(jù)存在隨機(jī)誤差。為了提高紅棗高光譜譜段篩選的準(zhǔn)確性,通常采用均值置信區(qū)間估計(jì)法則將采樣誤差限制在允許范圍內(nèi)。假定樣本容量足夠大(?n≥85時(shí),則所有隨機(jī)分布的均值能夠呈現(xiàn)正態(tài)分布的收斂圖。采集的圖像信息的概率為?P,因此可以得到在任意的第?i?波段光譜反射率均值?μi置信區(qū)間與置信水平?α?的關(guān)系為:
式中:?Xi為第?i?波段經(jīng)過高光譜反射率所有測(cè)量結(jié)果的平均值;?Zα?/2為抽樣誤差;?Si為測(cè)量樣本標(biāo)準(zhǔn)差(?nm)?;?α?為顯著性程度。μi的置信區(qū)間為:
?
由于波段取值具有一定的限制,那么所有紅棗病蟲害高光譜波段的置信區(qū)間也就直接成為高光譜反射率均值置信區(qū)間帶,并且以?μi作為比對(duì)光譜基準(zhǔn)。所謂特征選擇就是從研究對(duì)象中選取一部分作為試驗(yàn)對(duì)象,因此試驗(yàn)樣本應(yīng)當(dāng)小于總個(gè)體數(shù)。當(dāng)進(jìn)行圖像采集時(shí),往往會(huì)得到含有大量圖像的數(shù)據(jù),這就為數(shù)據(jù)分析帶來了極大的難度。如果不進(jìn)行特征篩選,就會(huì)在現(xiàn)有的波段中夾雜很多無用的波段,并直接影響計(jì)算效率,加大計(jì)算難度,同時(shí)還可能使有效的波段被忽略。最普遍的方式就是刪去均值置信區(qū)間帶的重疊波段,因?yàn)檫@種處理方法不會(huì)影響圖像整體的物理信息。采用?Manhattan?距離法構(gòu)建病蟲害紅棗與紅棗樣本數(shù)據(jù)庫光譜基準(zhǔn)的相似度,Manhattan?距離用如下公式計(jì)算:
式中:?D(i)為?Manhattan?距離,nm;?Xi為光譜基準(zhǔn)第?i?波段光譜反射率?n?次測(cè)量均值;?xi為病蟲害紅棗第?i?波段光譜反射率;?A?為篩選后的波段的所有組合。一般而言,Manhattan?距離直接反映了病害紅棗與數(shù)據(jù)庫中的樣本差異的大小程度,原則上是距離越小越精確。常用的方法就是判斷所計(jì)算出來的結(jié)果是否在置信區(qū)間中,如果在其中則說明準(zhǔn)確,樣本與標(biāo)準(zhǔn)較相近,反之則不準(zhǔn)確。
式中:?P?為最小最大區(qū)間相似度;?M?為紅棗特征區(qū)分波段總數(shù);?Yi為病蟲害紅棗的第?i?波段的光譜反射率;?H(?Yi)?反映了第?i?波段的反射率有沒有達(dá)到基準(zhǔn)光譜的要求,其取值只有?2個(gè),是一種真假關(guān)系,在區(qū)域內(nèi)為真,取值為?1,反之為?0。
3?高光譜特征提取及波段選擇算法
3.1?特征波段的選擇
經(jīng)過系統(tǒng)處理的高光譜圖像一般被儲(chǔ)存在一個(gè)三維空間中,其中任何一個(gè)波段都與光譜特征具有一一對(duì)應(yīng)的線性關(guān)系。所以,選擇光譜圖像的實(shí)質(zhì)是對(duì)圖像波段進(jìn)行篩選,選出的波段在整個(gè)樣本波段中具有典型特點(diǎn)。對(duì)選出的圖像要進(jìn)行相應(yīng)的操作處理,對(duì)選擇的波段數(shù)量也有一定限制。利用這種方法一方面降低了數(shù)據(jù)的復(fù)雜度,另一方面最大程度保留了最準(zhǔn)確的信息。最后利用逐步判斷剔除法篩選波段,對(duì)相應(yīng)的波段進(jìn)行測(cè)試,在進(jìn)行提取篩選時(shí)的主要判斷標(biāo)準(zhǔn)就是判斷各個(gè)波段在整體波段中作用的強(qiáng)弱。假如在經(jīng)過若干次處理后,整個(gè)樣本空間不再發(fā)生任何形式的變化,那么就可以認(rèn)為當(dāng)前空間中剩下的波段就是篩選后期望得到的波段。
3.2?特征波段的提取
特征波段的提取建立在各光譜波段間進(jìn)一步優(yōu)化調(diào)整與整合的基礎(chǔ)上,是對(duì)一個(gè)光譜特征空間實(shí)現(xiàn)降維的方式,這種逐步判斷剔除的實(shí)質(zhì)也是降低原始圖像數(shù)據(jù)的復(fù)雜度,并對(duì)圖像進(jìn)行優(yōu)化處理。它是在不影響整體結(jié)果的前提下調(diào)整圖像數(shù)據(jù),因此降低了數(shù)據(jù)的復(fù)雜度,方便分析數(shù)據(jù),此外這種處理所得到的新數(shù)據(jù)也具有相互獨(dú)立的典型特點(diǎn)。
3.3?波段選擇算法分析
假設(shè)?X?=?(?x1,x2,…,xN)?=?(?X1,X2,…,XP)T為?P?維隨機(jī)變量,反映了采集的病害紅棗圖像。設(shè)總的樣本像元數(shù)為?N;總的波段數(shù)為?P;?xi(?i?=?1,2,…,N)?代表波段的第?i?個(gè)像元;?Xk(?k?=?1,2,…,P)?表示波段的具體序號(hào)。X?均值向量和協(xié)方差陣公式如下:?
設(shè)?λ1,λ2,…,λP(?λ1≥λ2≥…≥λP≥0)?為∑x的特征根,t1,t2,…,tP為相應(yīng)的單位特征向量。主成分變換如下:
Y?=?(?Y1,Y2,…,YP)T=?AX
式中:?A?為主成分變換矩陣,前提是?Y1,Y2,…,YP不相關(guān)且方差?D(?Yi)?(?i?=?1,2,…,P)?要大;?Y?分量?Y1,Y2,…,YP分別是?X的第?1,第?2,…,第?P?主成分的充分必要條件是:?A?=?TT=?(?t1,t2,…,t)?。
在主成分分析中:
式中:?Vm為主成分?Y1,…,Ym貢獻(xiàn)率的疊加,這是在進(jìn)行波段選擇時(shí)的主要考量參數(shù),若?Vm大于閥值的前?m?個(gè)主成分置換原來圖像,則大大簡(jiǎn)化了運(yùn)算,然而確實(shí)失去了原始圖像的數(shù)據(jù)信息。為了有效解決這一問題,就開發(fā)一種新的波段選擇法,它是從原始波段中選取一部分作為樣本,因此沒有更改原有波段的信息。設(shè)?δn是∑x對(duì)角線上的值,主成分?Yk與原來第?i?個(gè)波段Xi的相關(guān)系數(shù)
并且有:
就會(huì)導(dǎo)出所有?m?個(gè)主成分(?Y1,…,Ym)?原始第?i?個(gè)波段的貢獻(xiàn)率?Vi,是?Xi分別與?Y1,…,Ym相關(guān)系數(shù)的平方和,即:
Vi是實(shí)現(xiàn)波段選擇的主要參數(shù),代表了當(dāng)前波段在整體中發(fā)揮的作用。具體來說,假如?V5=?0.4,就反映了第?5?個(gè)波段中?40%?的數(shù)據(jù)信息都在樣本空間中,發(fā)揮的作用為?40%?。假如是波段的總數(shù)與樣本空間的波段數(shù),就會(huì)得到?1,說明樣本空間的所有信息都來自該波段信息的疊加,但是這種研究沒有任何實(shí)際意義。在通常情況下,取?Vm≈0.?99,m?<<?P,這就保證了所計(jì)算的結(jié)果?Vi具有實(shí)際意義,可以作為波段選擇的主要依據(jù)。在進(jìn)行波段篩選時(shí),還要制定一個(gè)具體的標(biāo)準(zhǔn),在此記為?Tm,當(dāng)?Vm≥Tm時(shí),就可以得到主要成分的數(shù)目,然后分別計(jì)算各個(gè)主要成分的?Vi,根據(jù)這個(gè)參數(shù)進(jìn)行波段選擇。由于這種計(jì)算方法避免了對(duì)圖像的處理或變換,因此大大降低了運(yùn)算難度,簡(jiǎn)化了運(yùn)算量,提高了運(yùn)算的準(zhǔn)確率。
4?結(jié)果與分析
4.1?特征選擇及其判別結(jié)果分析
最后將剩下的用于驗(yàn)證試驗(yàn)的波段進(jìn)行處理,將其放在預(yù)定的置信區(qū)間內(nèi)的一半波段數(shù)據(jù)進(jìn)行處理、分析,根據(jù)Wilks'Lambda?統(tǒng)計(jì)量,選定南疆紅棗棗銹病、棗瘋病、黑斑病、縮果病和正常紅棗?12?個(gè)特征波長(zhǎng)?480、495、510、520、560、570、635、660、735、740、745、760?nm,特征曲線如圖?1?所示。利用選擇的?12?個(gè)特征波段的光譜參數(shù),對(duì)南疆紅棗棗銹病、棗瘋病、黑斑病、縮果病和正常紅棗無病區(qū)域進(jìn)行距離判別分析,表?1?即為新建的數(shù)據(jù)模型函數(shù)表達(dá)式。然后利用判斷公式進(jìn)行重新檢測(cè),檢測(cè)后的判斷結(jié)果見表?2。從表?2?可以看出,所有的判斷沒有任何誤差。將未參加建模的?150?個(gè)圖像樣本作為測(cè)試集,對(duì)模型進(jìn)行檢驗(yàn)測(cè)試,結(jié)果對(duì)紅棗棗銹病、棗瘋病、正常紅棗的識(shí)別正確率是?100%?,對(duì)紅棗縮果病和黑斑病的識(shí)別正確率分別為?93%?、87%?,測(cè)試樣本的平均識(shí)別正確率為?96%?,這就強(qiáng)有力地證明試驗(yàn)構(gòu)建的線性判別模型具有實(shí)質(zhì)性的效果。
圖1???5類樣本的光譜反射率均值
表1???5類樣本的逐步判別函數(shù)
表?2?訓(xùn)練和測(cè)試樣本集的逐步判別結(jié)果
4.2?特征提取及其判別結(jié)果分析
與驗(yàn)證試驗(yàn)類似,將剩下的一部分樣本置于相同的置信區(qū)間中進(jìn)行數(shù)據(jù)處理分析,然后利用?PROC?CANDISC?判別研究,利用?Can1和?Can2典型變量組建的線性判別模型見表3。然后基于判定函數(shù)對(duì)各個(gè)試驗(yàn)以及驗(yàn)證樣本進(jìn)行二次檢驗(yàn),結(jié)果示,這種模型對(duì)紅棗棗銹病、棗瘋病等眾多典型病害的檢測(cè)完全準(zhǔn)確,這也有力地證明了此模型的構(gòu)建完全達(dá)到了預(yù)期功效。
表?3???5類樣本?Candisc?判別函數(shù)
4.3?波段選擇算法分析
利用波段選擇法能夠輕易地確定主要成分的波段,然后再輔之以?PCA?的波段選擇算法進(jìn)行深層次處理分析。在這種新的波段選擇算法中,應(yīng)當(dāng)提前設(shè)置?Tm、Tv的具體數(shù)值,這也是進(jìn)行波段選擇的前提條件。在確定主要成分之后對(duì)其進(jìn)行分類處理,新的處理結(jié)果見表?4,可以發(fā)現(xiàn)這種處理方案實(shí)現(xiàn)了對(duì)數(shù)據(jù)的優(yōu)化調(diào)整,保證了原始圖像的相關(guān)信息沒有任何改變。
表4??PCA的波段選擇算法
5結(jié)論與討論
利用高光譜成像技術(shù)并結(jié)合主成分分析波段選擇算法識(shí)別南疆紅棗棗銹病、棗瘋病、黑斑病、縮果病和無病區(qū)域。研究開發(fā)的高光譜圖像采集系統(tǒng),實(shí)現(xiàn)了對(duì)采集圖像的處理功能。然后經(jīng)過各種判別方法的操作,對(duì)波段的進(jìn)一步分析篩選,對(duì)所得到的波段進(jìn)一步調(diào)整,構(gòu)成新的模型?-?線性距離判別模型。這種新的模型無論是訓(xùn)練效果還是測(cè)試樣本的檢測(cè)效果都讓人滿意。此外,它依靠建立的判別函數(shù)還實(shí)現(xiàn)了對(duì)其他樣本的分析與判別等功能,其識(shí)別正確率均達(dá)?100%?,從而確立了南疆紅棗病蟲害特征譜段選擇的最佳模式。
萊森光學(xué)(深圳)有限公司是一家提供光機(jī)電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應(yīng)用系統(tǒng)的研發(fā)、生產(chǎn)和銷售。
審核編輯:符乾江
評(píng)論
查看更多