劉世川,王 慶,魏 薇,唐 晴,劉 浪,何輝羽,蘆佳飛
(長江大學 地球科學學院,湖北 武漢 430100)
森林病蟲害是森林健康和林業生產的宿敵。松材線蟲是對松樹危害較大的外來入侵物種之一,感染松樹后會造成松樹針葉黃褐色或紅褐色,在6個月內即導致病樹整株干枯死亡。且該病蟲繁殖速度快,傳播途徑廣,傳播范圍廣,難以防治,是使松林大片被毀的重要害蟲。張增光[1]提出基于過程模型的松材線蟲災害的遙感早期識別,利用光譜分析和葉子含水量用知識規則的決策樹方法對植物進行分類,但只運用光譜分析提取結果未使用其空間特征等其他特征。馬箐[2]結合遙感影像,對不同染病時期的馬尾松單株進行單株測定、生態因子調查、蒸騰速率測定和光譜特征建模,模型復雜且受環境濕度、溫度的影像較大。吳瓊[3]基于深度神經網絡分類算法監測病蟲害樹木,但是需求的數據量大且參數過多時難以訓練。李豐毅[4]將多光譜圖像進行光譜特征、紋理特征和空間特征分析,但紋理特征計算復雜且效果不明顯。
所以基于多特征提取的高分辨率遙感影像松材線蟲病樹識別,對松材線蟲病樹的植被指數、顏色模型、空間分布特征進行多特征分析,篩選疑似病樹的方法速度快、針對性強,可以實現高效率、高精度的提取病樹。既能減少人工篩查的成本,更能監測人工無法到達的深山林區,提升了篩查病害樹木的效率,及時發現病害樹木和枯死樹木,防止病害進一步擴大感染范圍,減少病蟲害造成的經濟損失。
松材線蟲的侵染能明顯引起寄主植株葉綠素、類胡蘿卜素發生改變,從而導致植物光譜特征發生變化。健康松樹的反射光譜在綠光區(510~570 nm)有一個較低的反射峰值;紅光區(640~680 nm)有一個較低的吸收谷值;感染松材線蟲后松樹綠光區的反射峰會逐漸減弱,紅光區的吸收谷卻會逐漸增強[5]。高分辨率影像上的病樹像元會表現出聚集性的空間特性,由此可篩去部分噪點,并且滿足周圍一定范圍內有健康樹木的空間分布特性。
植被指數就是利用綠色植被在不同波段的反射和吸收特性,對傳感器不同波段進行組合運算,增強植被的信息。其本質上是綜合考慮各有關光譜信號,把多波段反射率做一定的數學變換,使其在增強植被信息的同時,使非植被信息最小化。目前較為常見的歸一化植被指數NDVI(Normalized Vegetation Index)、比值植被指數 RVI(ratio vegetation index)、差值植被指數DVI(Difference Vegetation Index)、增強型植被指數 EVI(enhanced vegetation index)、過綠指數 EXG(Excess Green)、歸一化綠紅差異指數 NGRDI(Normalized Green-red Difference Index)、仿照NGRDI構造的歸一化綠藍差異指數 NGBDI (Normalized Green-blue Difference Index)及紅綠比值指數 RGRI(Red-green Ratio Index)[6],計算公式如表1。
在可見光范圍,松材線蟲病樹死亡前的顏色變化主要包括:先是褪色發黃,此現象可以出現在單枝或少量枝條上,也可出現在整株,針葉進而枯萎變成紅褐色?,F在絕大部分的彩色圖像是基于RGB顏色三基色模型,但RGB空間中3個分量之間存在很強的相關性,因而不適于直接用于基于3個分量獨立運算的圖像分割。利用各種變換,可以由RGB空間推導出其他顏色空間如表2。

表1 植被指數計算公式(其中R、G、B分別為紅、綠、藍三色的光譜反射率)

表2 顏色空間模型
Relief算法是一種高效的過濾式特征選擇方法,由Kira和Rendell提出用于二分類問題的特征選擇算法[4]。根據各個特征和類別的相關性賦予特征不同的權重,權重小于某個閾值的特征將被移除。Relief算法中特征和類別的相關性是基于特征對近距離樣本的區分能力。計算公式如下:
δj=∑i-diff(Xji,Xji,nh)2+diff(Xji,Xji,nm)2
(1)
式(1)中,若xi與其猜中近鄰xi,nh在屬性j上的距離小于xi與其非同類別的最近鄰xi,nm的距離,則說明屬性j對區分同類與異類樣本是有利的,反之則不利,因此公式的值越大則說明該屬性的分類能力越強[5]。
利用Relief特征選擇算法得到單個樣本對每個特征的評價值,將所有樣本對同一個特征的評價值進行平均就得到了該屬性的相關統計分量,分量值越大,分類能力就越強,從而選出最優特征用以分類病樹像元和非病樹像元。
通過人工篩選高分辨率航空樣本影像(含紅色、綠色、藍色和近紅外波段),取樣得到病樹、健康樹、房屋、裸土地和柏油路的樣本像元區域。計算樣本像元區域的光譜特征,利用Relief特征選擇算法,得到二分類病樹和非病樹的最佳特征。將最佳特征的病樹像元樣本集進行統計分析,取得合適閾值構建病樹的光譜特征模型,用以在目標影像上篩選出病樹像元。再運用空間聚類算法對像元進行聚類分析,并剔除周圍一定范圍內不附著健康樹像元的病樹像元,最后得到結果像元集(圖1)。

圖1 技術路線
將2019年10月份拍攝于30°1′33″~ 30°1′46″N/111°43′9″~111°44′24″E和30°38′6″~ 30°38′23″N/111°33′48″~111°34′16″E附近的高分辨率遙感影像數據進行RGB真彩色顯示,采用人工取樣的形式,得到病樹、健康樹、藍頂房屋、灰頂房屋、裸土、柏油路和小路的像元區域(圖2)并統計出像元樣本數量(表3)。

圖2 人工取樣示意

表3 各地物像元樣本總數
特征:將各植被指數和各顏色模型所包含的各分量作為單獨特征種類,總計21種特征。數量:由于樣本數量參差不齊,以及考慮到運算耗時,各類地物選取300份樣本總計2100份樣本。Relief特征選擇算法得出各特征所對應的權重(表4、圖3)。

表4 各特征權重

圖3 各特征權重統計
經過實驗和比較,選擇權重較高的OHTA、NDVI、DVI作為病樹模型參數,各參數的箱線圖見圖4。

圖4 各參數箱線圖
提取各參數的10%至90%作為置信區間,采用較為成熟的DBScan聚類算法[11]進行病樹的空間聚集性篩選算法,并結合周圍一定范圍內有一定數量上的健康樹木像元,對拍攝地點30°1′N/111°43′E附近的三幅高分辨率遙感影像篩選病樹,將自動識別結果與人工目判結果進行對比(圖5、表5),得到統計結果(表6)。

注:左中紅斑為人工識別,右中白斑為自動識別

表5 人工篩選和自動識別結果對比

表6 自動識別相對人工篩選數據統計 %
基于光譜特征與空間特征的高分辨率遙感影像松材線蟲病樹識別總體來看,耗時是人工目視判讀的45%左右,數量識別的相對準確度為80%左右,實現了高效率、較高準確度識別松材線蟲病樹。本次識別過程中得出以下結論。
(1) 由于EXG與OHTA的I3分量計算方法一樣,所以在各特征權重統計圖權重一樣,在作為特征參數識別病樹時舍棄了重復的EXG指數。
(2) 針對健康樹木的光譜樣本缺少對松材線蟲病樹的針對性,采用隨機取樣,作為病樹空間分布特征的參數效果不佳。
(3) 光譜特征閾值與前期光譜實驗樣本質量關系緊密,光譜實驗采樣的樣本僅局限于所識別目標30°1′N/111°43′E附近的單幅圖像,如果擴大采樣范圍和樣本數量,將有利于提升多特征識別準確度和應用范圍。