劉金滄,王成波,常原飛
(1. 廣東省國土資源測繪院,廣東 廣州 510500; 2. 中國科學院遙感與數字地球研究所,北京 100101)
隨著遙感技術的發展,高分辨率遙感影像逐漸成為監測森林病蟲災害的主要數據源,通過對影像上感病導致變色的樹木特征描述及分類識別,可實現變色松樹提取,進而獲取樹木染病、枯死等信息。近年來,深度學習發展迅速,在遙感影像分類與識別中得到應用,深度學習的主流算法模型有受限波爾茲曼機、深度信念網絡、卷積神經網絡及自動編碼器4種[1]。但深度神經網絡模型待訓練參數極多,往往需要大量樣本數據。對于尚未積累足夠樣本數據的應用領域,采用深度學習方法存在一定的困難。在遙感影像目標識別、圖像分割或分類工作中,一般分類器通過與圖像特征結合從而達到融合上下文信息的目的,模型本身不考慮空間信息的問題。概率圖模型的引入,實現了在模型中加入上下文信息的概念,考慮了像素空間相關性。條件隨機場模型(conditional random field,CRF)[2]為后驗概率建模,能夠同時考慮標記和觀測數據的上下文信息,可用于各種具有不同統計特性的圖像的分類,具有普遍適用性,對圖像分類效果較好,已經成功用于序列數據標記、自然圖像分割[3]、醫學影像處理[4]等。目前,國內外學者也嘗試將CRF引入遙感圖像處理,展開了對高分辨率、多光譜、高光譜、SAR影像中CRF的使用和改進[5-8],旨在遙感圖像處理過程中更為正確和有效地發揮空間信息作用。
松材線蟲病是全球森林生態系統中最具危險性、毀滅性的有害物種[9]。松樹感病后,針葉快速變成黃紅色。在我國,松樹占森林資源的1/4[10],為了有效預防和控制松材線蟲病,需對其進行全面而又快速的監測。無人機遙感作為一項新興的對地觀測技術,可大幅減少森林資源調查的外業工作量,大大提高工作效率[11]。無人機影像地物清晰、細節明顯、信息豐富,為松材線蟲病的及時快速監測提供了有效的途徑,但考慮到影像中裸地陰影明顯、樹冠變化過大及樹木之間邊界復雜等問題,對病害松樹提取帶來了一定困難,需要選擇合適的提取算法。
CRF模型通過融合多種特征提取變色松樹,主要包括:①對無人機影像進行處理,提取描述圖像的多種特征;②將所提取的特征映射到高維或低維空間中組成新的特征向量;③利用CRF模型對最終特征向量進行分類,并獲得相應的標記,主要工作為特征提取、CRF模型的構建與實現。分類模型過程如圖1所示。
圖像特征是復雜圖像的簡化表達,特征提取和選擇是高分辨率遙感影像識別和分類的基礎和關鍵。正常情況下不同地物具有不同的顏色特征,但也經常會出現同物異譜、同譜異物現象[12]。為更加有利于變色松樹專題信息提取,本文綜合考慮了顏色特征和紋理特征。
1.2.1 顏色特征
顏色特征是圖像檢索、識別中應用最廣泛的視覺特征,在變色松樹提取試驗中,顏色特征是區分病害松樹與健康松樹的重要特征,本文顏色特征直接采用影像上的R、G、B三通道特征。
1.2.2 紋理特征
高分辨率影像中紋理結構種類豐富,由不同的紋理基元按照不同規則和組合方式重復出現而形成,本文使用的紋理特征為Gabor特征、局部二值模式(LBP)特征和方向梯度直方圖(HOG)特征。
(1) Gabor特征。Gabor變換兼具在空域和頻域中的分辨能力,2-D Gabor濾波器通過調整濾波器的空間與頻率參數,可以獲得空域和頻域的最優聯合分辨率,以達到空域和頻域的局部最優化,表達出能夠充分描述圖像的紋理信息[13]。由于小波變換的窗口大小可以隨著窗口中心頻率的變化而自適應地調節,通常采用Gabor小波濾波器提取紋理圖像[14]。Gabor濾波器提取紋理特征主要是濾波器的設計,包括濾波函數、數目、方向和間隔。
(2) LBP特征。LBP通過統計局部區域內結構出現的頻次來表達圖像特性,主要是對像素點與其局部區域內像素點的灰度級大小對比而產生。LBP特征提取首先將檢測窗口劃分為16×16的小區域(cell),對單個cell中的每個像素,將其4鄰域或8鄰域內點的灰度與該點(也可以是環形鄰域)進行順時針或逆時針的比較,如果中心點像素值比鄰點大,則鄰點的值為1,反之則為0,這樣每個點都會獲得一個8位二進制數,轉換為十進制,得到每個像素的LBP值;然后通過對每個cell中每個數字出現的頻率進行統計,得到cell的直方圖后,再對該直方圖進行歸一化處理;最后連接所有cell的統計直方圖得到整幅圖的LBP紋理特征。
(3) HOG特征。HOG特征[15]通過計算和統計圖像局部區域的梯度方向直方圖來表達特征,具有圖像幾何和光學的形變不變性。HOG特征提取首先將圖像分成小的連通區域,即細胞單元,然后計算每個細胞單元中所有像素的梯度或邊緣的方向直方圖。由于局部光照的變化及前景和背景對比度的變化,使得梯度強度的變化范圍非常大,采用重疊的局部對比度歸一化技術對梯度強度作歸一化,最后把這些直方圖組合起來構成HOG特征描述器。
1.3.1 CRF原理
CRF模型最早由文獻[2]提出,是一種判別式概率無向圖學習模型,CRF通過Gibbs分布直接對后驗概率P(X|Y)建模。
定義y={y1,y2,…,yk}為觀察特征集的隨機變量,x={x1,x2,…,xk)}為標簽集合的隨機變量,對每個隨機變量yi∈y標簽集合中的標簽相對應,P(x|y)表示給定條件y下的隨機變量x的條件概率。根據Hammersley-Clifford定理,標記場的后驗概率服從Gibbs分布為
(1)
式中,Z為歸一化函數;Z(y)=∑yexp{-∑c∈C
ψc(xc,y,θ)};θ為模型參數;基團c為一些隨機變量的集合;C為所有基團c的集合;數據項ψc(xc,y,θ)為在基團c上定義的勢函數。相應的Gibbs能量函數為
(2)
以較常見的二階CRF為例,二階CRF能夠考慮像素的空間鄰域信息,只有關聯勢能和交互勢能,則其能量函數包含了關聯勢能ψi和交互勢能ψij
(3)
式中,V為由圖像的像素組成的集合;ε為相鄰的像素對,對像素而言一般是4鄰域或8鄰域。
1.3.2CRF建模
CRF關聯勢能ψi()通過一個局部判別分類器來表示,通常表達為基于顏色、位置和紋理等多特征的成本函數,表達觀測變量yi與標簽xi之間的關聯屬性,反映給定yi和參數w條件下標記為xi的概率,表示為
ψi(xi,yj,w)=lnP(xi|yj,w)
(4)
由于SVM在高分辨率遙感數據中具有較好的分類效果,因此參考文獻[8]定義關聯勢能,由SVM訓練參數得到的歸一化概率。交互勢能ψij()通常依據鄰接觀測變量,以及其標簽變量之間的相關性關系來表示,體現了模型對上下文信息利用的能力。一般定義為
ψij(xixjyi,yj,λ)=λTgij(yi,yj)δxi≠xj
(5)
式中,λ為交互勢能中待估計參數;δ為0-1指示函數,若xi≠xj,δ為1,否則為0;gij(yi,yj)為特征相似性描述函數,其定義是描述相鄰變量相關性的關鍵,通常定義通過距離衡量特征之間的相似性,表達為
(6)
式中,β幅圖像中鄰接像素對的顏色對比度的均值,β=(2〈‖yi-yj‖2〉)-1。
為了減輕交互項過平滑的問題,在關聯項和交互項之間加入權重λ,則后驗概率最終可表達如下
P(x|y,w,v)∝exp
(7)
無人機影像變色松樹提取過程如圖2所示,主要分為5步:
(1) 數據獲取:無人機航攝獲取監測區域0.1 m分辨率的影像數據。
(2) 數據處理:通過影像匹配、空三加密、正射糾正、影像拼接和圖像增強等處理,制作0.1 m分辨率正射影像圖。
(3) 數據準備:制作標記變色樹木、健康樹木的樣本數據,單個樣本的大小為500×500像素,用于變色松樹提取的訓練和測試。
(4) 變色松樹提取:首先進行多種特征提取,增加不同類別地物特征描述的差異;然后利用有效的分類算法將變色樹木與正常樹木區分開,以完成變色松樹專題信息提取。
(5) 結果分析:結合目視解譯,對變色木提取結果進行分析,以提供疑似遭受病蟲害的松樹,為實地調查提供有利線索。
標記樣本數據如圖3所示。其中,部分暗灰色為松樹枯萎或失葉后剩下枝杈呈現的效果,一般是樹木長期染病枯死所致。另外,由于影像分辨率較高,樹木之間的空隙、陰影明顯,將其分為其他類。綜上,將影像標記為4類:兩種變色木(發灰木、發黃木),健康木和其他(陰影、空隙)。
本次試驗標記樣本數據集總數為860個,隨機選取總樣本的70%作為模型訓練數據,剩余的樣本則為測試數據。變色松樹提取試驗設置Gabor紋理的σ=2π,方向數為4,頻率為5,共20維,HOG特征9維,LBP特征4維。提取的多維特征通過白化、聚類操作形成用于圖像分類的特征向量。
試驗將CRF提取的結果與幾種常用的分類算法提取結果進行對比,包括支持向量機(SVM)、boost算法、隨機森林(RF),如圖4所示。從圖4可以看出,前3種不考慮相鄰像元相關性的分類算法得到的分類結果的椒鹽現象比較嚴重,分類效果不佳,而CRF的分類結果更加平滑,視覺效果更好。從影像可以看出,變色樹松樹的數量較少,前3種方法對變灰松樹與陰影、空隙等紋理的區分效果不佳,在邊界處變灰樹木與其他的地類產生混淆。相對于前3種試驗結果,只利用RGB顏色特征的CRF模型整體分類結果有所改善,說明CRF模型對變色松樹的分類效果較好,但其同樣存在對變灰松樹的提取結果不太理想的問題。在顏色特征的基礎上,加入多種紋理特征后的CRF模型分類結果對變灰木區分能力有所提高。紋理特征的加入增加了類別之間的差異,能夠改善分類器的性能。
對應5種分類結果的定量精度評價見表1,結合圖4分類結果,可以看出:定義交互勢能的CRF模型考慮了鄰域像素之間的空間關系,分類結果比不考慮交互勢能的普通分類器(SVM、boost、RF)分類精度更好,模型精度總體比其他基于像元的分類器高,多特征的CRF模型精度提高超過5%,基于多特征CRF方法有利于提高變色松樹的提取效果和精度。與考慮顏色特征的CRF模型分類結果相比,基于多特征CRF方法在分類精度上提高了約3.55%,這表明文中所述紋理特征能夠有效改善模型的分類精度。無論是從分類結果的視覺效果,還是從分類精度評價來看,基于多特征的CRF模型都能夠獲取較好的變色松樹識別結果。

表1 松樹林無人機RGB影像的分類精度 (%)
利用無人機航攝獲取森林高分辨率影像,并選用合適的分類方法對影像進行病害變色松樹自動提取,為快速監測松材線蟲病提供了有效途徑。其中關鍵在于尋找適用高分辨率航空影像分類的算法,基于多特征CRF模型能夠客觀準確地對病害松樹進行分類,作為傳統的目視解譯方法的補充,能夠大大減少人工判讀的工作量,有利于提高松樹病蟲害監測的效率與精度。