黃亦其 李婕 趙建曄



摘要 以入侵植物薇甘菊高光譜圖像為研究對象,基于4種預處理方法對薇甘菊高光譜圖像進行降低噪聲處理,分別研究了基于主成分分析的特征提取方法和基于BP神經網絡的分類模型,篩選出薇甘菊高光譜識別的最優預處理方法,以實現薇甘菊的快速準確識別。結果顯示,預處理方法為一階、二階微分的識別率分別為81.2%和76.92%;標準正態變量變換(SNV)和一階微分+SG平滑的識別率分別為89.74%和87.18%。多次試驗得到基于SNV預處理方法的識別率最穩定,即得到最優預處理方法為SNV。
關鍵詞 高光譜技術;薇甘菊目標識別;特征集選取;BP神經網絡模型
中圖分類號 S126 ?文獻標識碼 A
文章編號 0517-6611(2020)05-0246-04
doi:10.3969/j.issn.0517-6611.2020.05.069
開放科學(資源服務)標識碼(OSID):
Abstract With invasive plants Mikania mikania Kunt hyperspectral image as the research object,based on four kinds of pretreatment method of M.micrantha hyperspectral image noise reduction processing,we studied the feature extraction method based on principal component analysis and the classification model based on BP neural network.The optimal pretreatment method for M.micrantha hyperspectral identification was screened,in order to realize fast and exact recognition of M.micrantha.The experimental results showed that the recognition rates of first and second orders were 81.2% and 76.92%,respectively.The recognition rates of standard normal variable transformation (SNV) and first order differential +SG smoothing were 89.74% and 87.18%,respectively.Multiple experiments showed that the recognition rate of SNVbased pretreatment method was stable,in other words,the optimal pretreatment method was SNV.
Key words Hyperspectral technology;Mikania micrantha Kunt target recognition;Feature set selection;BP neural network
薇甘菊(Mikania micrantha Kunt)與附主植物在可見光下視覺辨識度低,分布無規律,受復雜多變的野外環境限制,一般檢測方法很難實現對薇甘菊實時精準監測。人工踏查[1]是比較普遍的針對薇甘菊的監測方法之一,但其受地形影響,無法對薇甘菊的分布及危害進行準確的定量評測。由于具有光譜分辨率高、波段多、信息量豐富等特點,高光譜監測技術應用于薇甘菊入侵的監測上具有很大的優勢。
目前,監測方法主要有圖像識別法、高光譜監測法、雷達數據輔助識別法和中低分辨率時序序列數據分析法等[2]。 Chance等[3]利用小型光譜成像儀(CASI)的圖像,在加拿大不列顛哥倫比亞省薩里的非森林植被環境中提取喜馬拉雅黑莓(Rubus armeniacus)、英國常春藤(Hedera helix)和其他物種的光譜,對所有的光譜通過光譜通道選擇算法處理,結果表明對英國常青藤和喜馬拉雅黑莓的檢測準確率分別為80.0%和76.4%。而Narumalani等[4]對光譜圖像進行去噪處理,基于光譜角匹配法檢測了某區域內4種入侵物種及其分布,總體準確率為74%。
高光譜數據降維方法主要分為2種[5]:一種是基于變換的特征提取法,即通過數據變換產生一個新的特征空間,將全部波段的特征屬性完成從高維空間到低維空間轉換,從而保留盡可能高的分類精度。特征提取中典型的算法有包括主成分分析(principal components analysis,PCA)[6]、奇異值分解(singular value decomposition,SVD)[7]等。另一類是基于非變換的特征選擇,也稱局部特征波段選取。常見的波段選擇方法包括基于信息量的波段選擇以及基于類間可分性的波段選擇[5]。鑒于此,筆者使用主成分分析法完成特征提取,以較低的維數達到較好的識別結果,提高識別效率。
準確地識別外來入侵植物是對其開展監測工作的前提與基礎,任智偉等[5]通過將基于用PCA法和信息量改進PCA法對高光譜圖像數據降維的結果輸入最小距離分類器比較其分類精度來對比分析2種降維方法的效果。喻俊等[8]先利用S-Golay濾波剔除異常光譜數據,再采用光譜微分法與植被指數法構建光譜特征最后應用人工神經網絡法結合因子分析法對典型植被進行分類識別。而吳培強等[9]以黃河口濕地為研究區分別建立支持向量機、人工神經網絡和光譜角制圖3種分類模型開展利用全波段的和所選擇特征波段的分類對比試驗。筆者通過成像光譜儀獲取以薇甘菊為識別目標的高光譜圖像,人工篩選獲取薇甘菊類和非薇甘菊類高光譜數據來用作識別薇甘菊目標的研究,并基于主成分分析方法(PAC)對其做適當的降維處理。
1 薇甘菊數據的采集
高光譜圖像的采集采用人工手持德國Cubert公司生產的S185高速成像光譜儀。共采集到薇甘菊高光譜圖像27張,分辨率為1 000×1 000。部分薇甘菊高光譜圖像樣本如圖1所示。觀察統計顯示,樣本中包括3類其他植物葉子以及其中1類植物的花,還有一些黑色背景。
Cube Ware是與S185配套的光譜分析軟件。通過易于操作的用戶界面來記錄和分析高光譜圖像。主要用到信號即圖像處理模塊,即從Cube Ware中獲取的高光譜數據樣本的預處理,數據降維、BP神經網絡模型的構建等都在Matlab 2018a中實現。
1.1 高光譜數據樣本獲取
通過Cube Ware軟件打開樣本集的薇甘菊高光譜圖像,隨機從18張圖像中以像素點為單位采集高光譜數據,每個像素點對應1條高光譜曲線,每1條曲線所對應的光譜數據都能以ASCII碼的格式保存(圖2)。共采集到高光譜數據樣本720個,該研究主要對薇甘菊進行識別,因此圖片中出現的其他類植物分別記為其他類植物1,其他類植物2,其他類植物3葉子和其他類植物3葉子花,具體的樣本采集數目見表1。
在主成分分析的基礎上還可以通過主成分得分圖初步地對樣本進行分析判別。由圖5可知,薇甘菊與非薇甘菊類(圖中的其他類)樣本均以坐標原點為中心聚集分布,證明第一、二主成分對高光譜數據具有一定的聚類效果。比較發現,標準正態變量變換聚類效果較好。同時,各主成分得分圖中非薇甘菊類樣本比薇甘菊類聚集更緊密,聚類效果更明顯,但2類樣本間交叉重疊明顯,還需要基于支持向量機分類器對其進行精確分類。
4 BP神經網絡建模
BP(back propagation)神經網絡是1986年由Rumelhart和McClelland為首的科學家提出的概念,是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,是目前應用最廣泛的神經網絡[16]。BP神經網絡是一種多層前饋,并通過誤差反傳訓練的一種網絡,其主要方法是梯度下降法,使網絡的實際輸出值和期望輸出值的誤差均方差達到最小[16]。該研究使用了BP算法信號的前向傳播和誤差的反向傳播2個部分,計算誤差輸出時按從輸入到輸出的方向進行,而調整權值和閾值則從輸出到輸入的方向進行[17]。BP神經網絡結構如圖6所示。
將4種預處理后的主成分作為BP神經網絡的輸入建立神經網絡模型,并相互對比,確定最優分類準確率的預處理方法。BP神經網絡建模后,進行參數調節,隱藏層均設置為10,輸出層神經元個數均設置為2,而后調試隱藏層和輸出層學習率、訓練次數等重要參數。對神經網絡的參數進行反復調整直到獲得最佳分類準確率。基于4種預處理方法分別建立4個神經網絡模型。建模時按2∶1分為訓練集和測試集。
從表2可以看出,基于SNV和一階微分+SG預處理方法進行分類得到的分類準確率較優,但是就維度而言,SNV預處理方法的維度降到9,比一階微分+S-G卷積平滑預處理方法降維程度要好。通過比較得到二階微分對薇甘菊的識別效果最差。
從圖7和8可以看出,通過SNV方法處理過得薇甘菊數據,得到的識別程度相比于一階微分+S-G卷積平滑的更加穩定。結合上述分析,得出基于SNV對薇甘菊的識別效果更好。并得到最優的預處理方法為SNV,且主成分個數為9時,對薇甘菊的識別效果最佳。
5 結論
該研究主要以外來入侵植物薇甘菊為研究對象,對野外環境下高光譜數據進行分析研究。研究了高光譜數據的異常數據樣本剔除及預處理方法,基于高光譜數據降維特征提取方法,基于BP神經網絡的模型建立方法。該研究得出了以下結論:
(1)采集野外薇甘菊高光譜圖像過程中,應用馬氏距離剔除法剔除異常樣本,分別剔除了薇甘菊類9個異常樣本,以及非薇甘菊類9個異常樣本,得到用于后續研究的光譜數據樣本共702組,薇甘菊類351組,非薇甘菊類351組。
(2)通過4種預處理方法對高光譜數據預處理,從而達到了降噪、消除基線漂移等預期的效果,但其對識別模型建立的影響還需要進一步驗證分析。
(3)對上述所得4個特征集分別進行了基于主成分分析法的高光譜數據降維,得到最大主成分為前25個主成分用于識別薇甘菊的特征集。比較分析顯示,標準正態變量預處理方法使得高光譜數據聚類效果更好。
(4)對降維方法降維后特征集建立基于BP神經網絡分類模型。在針對主成分分析降維后的4個特征集分別建立BP神經網絡分類模型,確定了4個特征集中最終的主成分數目以達到特征集進一步降維的目的,并且得出所選主成分數目對應的測試集識別準確率。其中SNV-BP對應的測試集不但識別準確率高且其所建立的BP分類模型最穩定,最終確定基于前9個主成分數目基礎上測試集識別準確率最佳為89.74%,從而驗證了BP神經網絡能夠對野外薇甘菊進行識別。
參考文獻
[1]柳帥,林輝,孫華,等.基于Pleiades-1衛星數據薇甘菊信息提取[J].中南林業科技大學學報,2014,34(11):116-119.
[2]孫玉芳,姜麗華,李剛,等.外來植物入侵遙感監測預警研究進展[J].中國農業資源與區劃,2016,37(8):223-229.
[3]CHANCE C M,COOPS N C,CROSBY K,et al.Spectral wavelength selection and detection of two invasive plant Species in an urban area[J].Canadian journal of remote sensing,2016,42(1):27-40.
[4] NARUMALANI S,MISHRA D R,WILSON R,et al.Detecting and mapping four invasive species along the floodplain of North Platte River,Nebraska[J].Weed technology,2009,23(1):99-107.
[5]任智偉,吳玲達.基于信息量改進主成分分析的高光譜圖像特征提取方法[J].兵器裝備工程學報,2018,39(7):151-154.
[6]張兵.高光譜圖像處理與信息提取前沿[J].遙感學報,2016,20(5):1062-1090.
[7]VILLA A,CHANUSSOT J,JUTTEN C,et al.On the use of ICA for hyperspectral image analysis[C]//2009 IEE international geoscience and remote sensing symposium.Cape Town,South Africa:IEEE,2009.
[8]喻俊,李曉敏,張權,等.基于實測高光譜數據的太湖湖濱帶典型植被分類[J].江蘇農業科學,2017,45(5):240-244.
[9]吳培強,張杰,馬毅,等.基于地物光譜可分性的CHRIS高光譜影像波段選擇及其分類應用[J].海洋科學,2015,39(2):20-24.
[10]閔順耕,李寧,張明祥.近紅外光譜分析中異常值的判別與定量模型優化[J].光譜學與光譜分析,2004,24(10):1205-1209.
[11]FILZMOSER P,HRON K.Outlier detection for compositional data using robust methods[J].Mathematical geosciences,2008,40(3):233-248.
[12]況潤元,曾帥,趙哲,等.基于實測高光譜數據的鄱陽湖濕地植被光譜差異波段提取[J].湖泊科學,2017,29(6):1485-1490.
[13]陳彥兵,況潤元,曾帥.基于高光譜數據的鄱陽湖濕地典型植被識別分析[J].人民長江,2018,49(20):19-23.
[14]顧紹紅,王永生,王光霞.主成分分析模型在數據處理中的應用[J].測繪科學技術學報,2007,24(5):387-390.
[15]唐紅,鄭文斌,李憲霞.主成分分析在光全散射特征波長選擇中的應用[J].光學精密工程,2010,18(8):1691-1698.
[16]邱晨,羅璟,趙朝文,等.基于BP神經網絡的空氣質量模型分類預測研究[J].軟件,2019,40(2):129-132.
[17]來純曉,武振國,金松林,等.基于 BP 神經網絡的小麥抗寒性模型構建[J].河南科技學院學報(自然科學版),2019,47(3):72-78.