一、引言
草原生態(tài)系統(tǒng)是陸地生態(tài)系統(tǒng)的重要組成部分。我國草地面積約為4億hm2,每年平均可為畜牧業(yè)發(fā)展提供3.5億噸優(yōu)質(zhì)牧草。但由于自然因素與人為因素影響,全球草原生態(tài)系統(tǒng)出現(xiàn)退化問題,逐漸形成荒漠草原。據(jù)統(tǒng)計,我國超過90%的草原出現(xiàn)不同程度退化現(xiàn)象。其中,內(nèi)蒙古自治區(qū)草原總面積約為8.8×107hm2,退化面積約占73.5%。草原退化對農(nóng)牧民生活及農(nóng)牧業(yè)經(jīng)濟發(fā)展造成嚴重威脅?;哪菰乇砦邏K主要包括各種群植被、裸土、鼠洞。草原退化主要表現(xiàn)為植被矮小、植被整體覆蓋度逐漸減少、鼠洞數(shù)量增加等。因此,地表微斑塊精確識別與分類是荒漠草原研究的重要指標。傳統(tǒng)荒漠草原研究主要依靠人工實地監(jiān)測,精確度較高但費時費力。為滿足大空間尺度觀測需求,遙感技術(shù)應(yīng)用于草原研究。遙感采用非接觸、遠距離探測技術(shù),可實時獲取圖像數(shù)據(jù),與人工調(diào)查相比具有成本低、實驗不受人主觀因素影響等優(yōu)點。常用遙感方式為衛(wèi)星遙感,分辨率在1m左右,應(yīng)用于大面積植被動態(tài)監(jiān)測。荒漠草原使用衛(wèi)星遙感監(jiān)測具有局限性。
近年來,低空無人機遙感系統(tǒng)逐漸興起,彌補了衛(wèi)星遙感與人工調(diào)查間尺度空缺。以無人機搭載高光譜成像儀組建無人機高光譜遙感系統(tǒng)拍攝圖像,不僅分辨率高、數(shù)據(jù)源豐富,而且方便快捷、不損壞原有實驗環(huán)境,可重復進行實驗。
隨著深度學習的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)不斷應(yīng)用于高光譜圖像分類處理任務(wù)。CNN是能夠進行深度學習的人工神經(jīng)網(wǎng)絡(luò),能做到自動提取圖像特征。本文通過構(gòu)建無人機高光譜遙感系統(tǒng),采集荒漠草原地表微斑塊高光譜圖像,建立輕量化卷積神經(jīng)網(wǎng)絡(luò)模型―高分辨率圖像卷積神經(jīng)網(wǎng),用于地表微斑塊識別與分類任務(wù),為荒漠草原退化監(jiān)測提供理論基礎(chǔ)。
二、材料與方法
2.1 研究區(qū)概況
試驗區(qū)域如圖1,地處內(nèi)蒙古自治區(qū)烏蘭察布市格根塔拉草原(N41.78o、E111.88o),草原類型為荒漠草原。植被種群稀疏低矮,平均高度10cm。草類主要為短花針茅、無芒隱子草等。鼠類主要有長爪沙鼠、達烏爾黃鼠等。
圖1 試驗區(qū)域衛(wèi)星圖
2.2數(shù)據(jù)采集
高光譜圖像數(shù)據(jù)采集時間:2022年的7月至8月,中午11:00~14:00。采集條件:光照充足、無云霧遮擋,少風或微風。試驗區(qū)域總面積為2.5hm2。在試驗區(qū)域內(nèi),隨機設(shè)置50組樣方,樣方尺寸為1m×1m。樣方內(nèi)部含有植被、裸土、鼠洞,外部使用實驗輔助物(地墊與小旗)進行標記。此外,實驗輔助標記物還有充當草原環(huán)境中因人為活動導致外來垃圾的作用。無人機飛行高度30m,空間分辨率1.73cm,采集地物樣方光譜圖像尺寸大小為696lines×775samples×256bands,且對每個樣方拍攝3次,以提高數(shù)據(jù)的可用性。
2.3 反射率矯正
無人機飛行拍攝過程中因受環(huán)境因素影響導致部分拍攝圖像發(fā)生扭曲變形,故首先將變形及拍攝質(zhì)量較差圖像進行人工去除,其次,將初步篩選數(shù)據(jù)(包括黑幀、白幀、樣方原始圖像)導入SpecView軟件進行輻射校正。校正計算如公式:
式中:R為反射率校正后圖像,Iraw為原始圖像,Iwhite為白幀圖,Idark為黑幀圖。
圖像經(jīng)反射率校正后,使用ENVI5.3軟件提取每類地物純凈像元各100個進行空間統(tǒng)計(因鼠洞像元較少,故提取20個進行研究),并使用OriginPro2021軟件繪制每類地物反射率曲線如圖2所示。
圖2 地物反射率校正圖
從圖2中可看出每類地物反射率差異明顯,其中,地墊反射率波動較大。小旗在460Band后急劇上升,560Band后增長趨于平穩(wěn)。裸土與植被反射率差異處為543~687Band,植被存在明顯‘波峰’與‘波谷’。鼠洞反射率增長最為緩慢。每類地物同波段反射率變化不一為后續(xù)地物分類提供可能。
2.4 數(shù)據(jù)預處理
高光譜圖像具有豐富的光譜和空間信息,通常包含幾十到數(shù)百個連續(xù)光譜波段,但波段間存在較高的相關(guān)性和冗余度,這將使模型在訓練階段容易出現(xiàn)Hughes現(xiàn)象。因此,高光譜數(shù)據(jù)使用前應(yīng)做數(shù)據(jù)降維處理。本文采用廣泛應(yīng)用于高光譜數(shù)據(jù)降維的主成分分析算法作為特征提取的方法,有效剔除冗余信息。同時為有效防止圖像邊緣大量扭曲混合像元對實驗影響,對數(shù)據(jù)尺寸進行剪裁,最終獲取高光譜圖像數(shù)據(jù)。
根據(jù)研究目的,本次實驗將草原地物分為植被、裸土、地墊、小旗、鼠洞共五類。通過ENVI5.3軟件對圖像進行ROI感興趣區(qū)域標簽處理,每類樣本數(shù)量分別為31600、27419、686、179、32個,共計59916個樣本。本次實驗將50%的地物樣本劃分為訓練集,為保證實驗可靠性將訓練集中50%的數(shù)據(jù)劃分為驗證集。在圖像識別與分類處理任務(wù)中,深度學習效果嚴重依賴于樣本數(shù)量,當訓練樣本較少時,易使網(wǎng)絡(luò)陷入局部最優(yōu)。本實驗為增加訓練樣本數(shù)量,通過圖像隨機翻轉(zhuǎn)方法進行數(shù)據(jù)增強,使訓練集樣本數(shù)量增加至14979個。此外,為一定程度上解決小樣本數(shù)據(jù)集過擬合問題,對樣本數(shù)據(jù)進行隨機打亂處理。樣本數(shù)據(jù)如表1所示。
表1 樣本數(shù)據(jù)表
三、草原物種分類模型
卷積神經(jīng)網(wǎng)絡(luò)特征提取方法是影響模型優(yōu)劣的關(guān)鍵因素。本文針對荒漠草原地表微斑塊分類問題,提出高分辨率圖像卷積神經(jīng)網(wǎng)絡(luò)模型。該模型主要特點包括使用帶有不同大小卷積核的深度可分離卷積作為各分支結(jié)構(gòu),以降低計算量和參數(shù)量。通過逐步使用不同感受野的卷積核,將圖像底層特征提取為高層語義特征。同時,引入殘差結(jié)構(gòu)將底層特征與高層語義特征進行融合,以防止卷積運算中的特征丟失和網(wǎng)絡(luò)模型退化問題的發(fā)生。在卷積層最后,使用轉(zhuǎn)置卷積將提取的高層語義特征圖映射為高分辨率特征圖像,從而降低圖像中混合像元對最終分類效果的影響,并提高模型分類精度。該模型屬于低參數(shù)量的輕量化網(wǎng)絡(luò)模型,共包含兩層分支結(jié)構(gòu)與一層組合結(jié)構(gòu)。分支結(jié)構(gòu)內(nèi)部包括輸入層、三個深度可分離卷積層、兩個殘差結(jié)構(gòu)、最大池化層與轉(zhuǎn)置卷積層。組合結(jié)構(gòu)中包括維度拼接層、全連接層與分類層。此外,每層卷積運算結(jié)束后,均進行批量歸一化(BatchNormalization)與激活函數(shù)(Relu)操作,避免梯度消失與爆炸,加快模型收斂速度。具體網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3所示,網(wǎng)絡(luò)模型運行參數(shù)如表2所示。
圖3 高分辨率圖像卷積神經(jīng)網(wǎng)絡(luò)
表2網(wǎng)絡(luò)模型參數(shù)
結(jié)果與分析
4.1 實驗結(jié)果
本模型在訓練實驗過程中,除模型訓練初期驗證集損失出現(xiàn)震蕩外,訓練集與驗證集整體呈下降趨勢。在第20個epoch后趨于平穩(wěn),此時共花費144s,訓練集損失值穩(wěn)定變化在0.023~0.025,驗證集損失值穩(wěn)定變化在0.062~0.065。為保證訓練模型穩(wěn)定,30個epoch全部訓練完畢共花費214s。訓練結(jié)果如圖4所示。PLSR模型效果最佳。而在兩種草地類型下的N和K含量以及溫性草原下P含量構(gòu)建的RF模型均表現(xiàn)最優(yōu)。
圖4 HR-CNN模型訓練損失曲線
4.2 實驗分析
為驗證本模型有效性,在采用相同數(shù)據(jù)預處理及實驗環(huán)境基礎(chǔ)上,采用ResNet34、GoogLeNet兩種常用高光譜圖像分類算法進行對比。同時,為驗證深度可分卷積與常規(guī)卷積所構(gòu)模型區(qū)別,將深度可分卷積改為常規(guī)卷積,構(gòu)建常規(guī)2D卷積神經(jīng)網(wǎng)絡(luò)模型(2D-CNN)進行對比驗證,因二者具有相同模型結(jié)構(gòu),故在生成模型所占內(nèi)存及運行參數(shù)量方面具有較大差異。
本文在不同模型分類混淆矩陣(如圖5所示)基礎(chǔ)上,通過對其進行運算,分別以整體分類精度(Overallaccuracy,OA)(公式)、F1得分(F1-score,F1)(公式)及Kappa系數(shù)(公式)作為評價指標。
其中:TP為預測正樣本,TN為預測負樣本,F(xiàn)P為真實正樣本,F(xiàn)N為真實負樣本,N為樣本總數(shù)量。
為便于模型間對比驗證,本文對Kappa系數(shù)進行放大100倍處理。各模型F1分類精度如表3所示,OA及Kappa系數(shù)分類精度對比結(jié)果如圖6所示。此外,在相同數(shù)據(jù)預處理及圖像分類預測結(jié)果條件下,模型構(gòu)建優(yōu)劣與訓練時間、模型運行參數(shù)量所占內(nèi)存有關(guān)。訓練時間越短且內(nèi)存占有量越小,構(gòu)建模型越好。四類模型訓練時間及內(nèi)存占有量如表4所示。
圖5 混淆矩陣對比
由表3可知,四類模型對高光譜圖像中具有較大數(shù)據(jù)量的植被、裸土均具有較高識別精度。但對于小樣本數(shù)據(jù)集(地墊、小旗、鼠洞),四類模型圖像識別精度具有較大差異,但HR-CNN模型各地物分類精度均表現(xiàn)優(yōu)異。其中,ResNet34、GoogLeNet網(wǎng)絡(luò)模型對于鼠洞識別精度較低,相較HR-CNN模型精度分別降低13.40%、18.10%。
表3 F1分類精度對比表
由圖6可知,(c)2D-CNN與(d)HR-CNN模型OA與Kappa值相差不大,但(a)ResNet34相較HR-CNN模型OA與Kappa值分別降低1.91%、0.97,(b)GoogLeNet相較HR-CNN模型OA與Kappa值分別降低0.47%、0.93。
圖6 OA及Kappa系數(shù)分類精度
實驗中,四類模型在訓練階段模型損失逐漸降低并趨于平穩(wěn)(損失平穩(wěn)即為模型構(gòu)建完畢)。各模型構(gòu)建完成時間(表4),其中HR-CNN模型訓練時間最短為144s,僅占ResNet34、GoogLeNet、2D-CNN模型訓練時間的34.12%、34.29%、86.23%。HR-CNN模型內(nèi)存占有量最小為19.5MB,相比ResNet34、GoogLeNet、2D-CNN分別降低92.11%、79.21%、43.64%。HR-CNN模型運行參數(shù)所占內(nèi)存最小為6.06MB,較ResNet34、GoogLeNet、2D-CNN分別降低92.57%、79.03%、46.18%。
表4模型訓練時間及內(nèi)存占有量對比表
為驗證模型分類效果,對高光譜圖像進行可視化分類研究。由圖7可看出,HR-CNN模型對草原地物分類表現(xiàn)良好。
圖7高光譜圖像原圖與模型分類預測圖
結(jié)論
本文旨在通過構(gòu)建無人機高光譜遙感系統(tǒng),并結(jié)合深度學習中的卷積神經(jīng)網(wǎng)絡(luò),提出一種高分辨率圖像卷積神經(jīng)網(wǎng)絡(luò)(HR-CNN)用于荒漠草原地表微斑塊分類識別研究。實驗證明該網(wǎng)絡(luò)模型在此類任務(wù)中具有較高的識別精度和計算效率。該模型通過引入殘差結(jié)構(gòu),在高光譜圖像中使用不同大小的卷積核提取各地物影像特征。轉(zhuǎn)置卷積用于重組特征,以生成高分辨率的特征圖,并通過通道拼接的方式減少特征丟失。此外,引入了深度可分離卷積以減少網(wǎng)絡(luò)參數(shù)量,提升模型性能。與2D-CNN、ResNet34和GoogLeNet網(wǎng)絡(luò)模型相比,HR-CNN在訓練時間和模型內(nèi)存占用方面有顯著改進。本模型的輕量化設(shè)計對于荒漠草原地表微斑塊的精細分類研究具有重要意義,為進一步深入研究荒漠草原地物分類、識別和反演提供了新思路。
推薦:
便攜式高光譜成像系統(tǒng)iSpecHyper-VS1000
專門用于公安刑偵、物證鑒定、醫(yī)學醫(yī)療、精準農(nóng)業(yè)、礦物地質(zhì)勘探等領(lǐng)域的最新產(chǎn)品,主要優(yōu)勢具有體積小、幀率高、高光譜分辨率高、高像質(zhì)等性價比特點采用了透射光柵內(nèi)推掃原理高光譜成像,系統(tǒng)集成高性能數(shù)據(jù)采集與分析處理系統(tǒng),高速USB3.0接口傳輸,全靶面高成像質(zhì)量光學設(shè)計,物鏡接口為標準C-Mount,可根據(jù)用戶需求更換物鏡。
審核編輯 黃宇
-
無人機
+關(guān)注
關(guān)注
230文章
10489瀏覽量
181387 -
高光譜
+關(guān)注
關(guān)注
0文章
335瀏覽量
9968
發(fā)布評論請先 登錄
相關(guān)推薦
評論