殷君君, 彭嘉耀, 楊 健, 劉希韞
(1. 北京科技大學計算機與通信工程學院, 北京 100083; 2. 清華大學電子工程系, 北京 100084)
極化合成孔徑雷達(Synthetic Aperture Radar,SAR)是一種多參數、多通道的成像雷達系統,具有全天候、全天時的工作特點,具有較強的地物穿透能力,在目標識別、城市規劃、地質勘探、植被生長評估、軍事探測、海洋監測等眾多領域有著廣泛的應用。近年來,極化SAR圖像地物分類已經成為雷達遙感圖像領域的研究熱點,且已經出現了很多較為成熟的算法。對于極化SAR農田分類,普遍存在著農田塊形狀不規則、區域較小、分布不均勻等問題,同時多時相圖像分類[1]也是難點之一。針對這些問題,我們對混合模型與基于馬爾科夫隨機場(Markov Random Field,MRF)的分類算法進行了研究,并提出了基于局部競爭思想的MAP分類器。
根據所使用的特征不同,極化SAR圖像分類方法可歸納為兩類:基于統計特性的分類和基于極化散射機制的分類[2-3]。極化SAR圖像的統計特性是根據其數據的統計模型推導出來的,在圖像分類中起到很重要的作用。其中,應用最廣泛的是測量矢量的多元高斯分布和協方差(或相干)矩陣的復Wishart分布。1988年,Kong等人[4]提出了基于復高斯分布的單視極化SAR圖像最大似然(Maximum Likelihood,ML)分類器。1994年,Lee等人[5]將最大似然規則推廣到SAR多視情況,提出了基于復Wishart分布的ML監督分類方法,這是極化SAR數據分類研究的一座里程碑。基于復Wishart分布的Wishart距離度量也被廣泛地用于監督和非監督分類中,基于該距離度量的分類技術稱為Wishart分類器。1999年,Lee等人[6]提出了基于H/α分解和Wishart分類器的迭代分類算法,Ferro-famil等人[7]將該方法用于雙極化數據分類。2004年,Lee等人[8]提出了基于Freeman分解和復Wishart分布的ML分類器的極化SAR圖像分類算法,這種算法是一種性能十分優良的分類算法,能很好地保持各類地物的極化散射特性,是目前最為經典的極化SAR分類算法之一。
Wishart分類器和Gaussian分類器是兩種經典的基于極化統計分布的Bayes最優分類算法,后來的許多算法都直接或間接用到了這兩種統計模型。包括一些針對不均勻區域建模提出的乘積模型和混合模型,如K分布[9]、G分布[10]、WGΓ分布[11]、混合Gaussian模型[12-13]和混合Wishart模型[14-15]。為了充分利用圖像的空間上下文信息,很多學者將MRF引入了極化SAR圖像分類算法的框架中。2001年,Dong等人[16]第一次將MRF用于極化SAR圖像分類。2008年,Wu等人[17]將MRF與復Wishart分布結合提出了WMRF模型,并將該模型與基于區域的分類框架相結合,得到了較好的分類結果。Li等人[18]將高斯混合模型(Gaussian Mixture Model,GMM)與MRF相結合,構造了GMM-MRF模型,Song等人[19]基于WGΓ分布構造了混合WGΓ(Mixture WGΓ,MWGΓ)模型,然后與MRF結合構造了MWGΓ-MRF模型。然而以上這些方法,均為基于全局思想的分類算法,在對像素或超像素進行分類時,需要將圖像中的全部地物類型進行對比。對于基于統計分布模型的ML分類器,分類器的效果僅依賴于統計模型的準確性,這種基于全局的分類思想容易出現誤分類的情況,尤其是在地物類別區域不連續、區域形狀不規則的情況下。而將MRF與統計模型相結合,可以有效地利用圖像的空間信息,提高了分類效果,但算法依然是基于全局的思想。該文中,我們提出一種新的基于局部競爭策略的MAP分類器,該算法的主要思想是,在對像素進行分類時,僅對比該像素附近的地物類別。該算法不僅減少了像素點需要對比的類別數目,同時也利用了圖像的空間信息以及偽先驗概率信息,通過局部迭代的方法提高分類的準確率。
本文中,我們主要研究基于復Wishart分布的分類模型在復雜地形區域中的分類性能,包括經典的復Wishart模型、混合復Wishart模型、基于MRF的混合復Wishart模型和基于局部競爭策略的MAP分類器。首先,分析了混合Wishart模型的優越性,然后用上述4種模型對兩幅在不同時間獲取的同一地區的極化SAR圖像進行分類,并對比分析這4種方法對多時相極化SAR圖像的分類效果。同時,我們也比較了SVM分類器的結果。文章安排如下:第2部分介紹統計模型、MRF模型和本文提出的方法;第3部分展示實驗結果并進行分析;第4部分對全文進行總結。
(1)
式中,L表示視數,矢量us表示第s個單視數據樣本,(·)H表示復共軛轉置。
建立統計分布模型一直是極化SAR圖像處理領域的研究熱點,許多學者都提出了相關的統計模型。對于多視極化SAR圖像,極化協方差矩陣C={C1C2…CN}服從復Wishart分布,
(2)
式中,協方差矩陣Σ=E[uuH],tr(·)代表矩陣的跡,L代表視數,q代表通道數,K(·)為尺度函數。1994年,Lee等人[5]提出了基于復Wishart分布的極大似然分類器。假設圖像共包含M類像素,用Σm表示類ωm的類中心,則式(2)可重寫為p(Ci|ωm),通過最大化p(Ci|ωm)p(ωm)可推導出n視極化SAR數據分類的距離度量方法,
d(Ci,ωm)=nln|Σm|+
(3)
式中,P(ωm)表示類ωm的先驗概率。在各類先驗概率都未知的情況下,可以假設P(ωm)相同,此時的距離度量與n無關,于是可以將式(3)簡化為
(4)
將式(4)定義為Wishart距離度量,基于該距離度量的分類器稱為復Wishart分類器,算法步驟如下:
1) 根據訓練集,計算數據的類中心Σ={Σ1Σ2…ΣM},其中M表示類別數;
2) 對于圖像中的每個像素Zi,若它的協方差矩陣Ci滿足d(Ci,Σm) 基于復Wishart的ML分類器是極化SAR圖像分類的里程碑,但該方法的分類準確率完全依賴于對每種地物類型進行適當的統計建模,而沒有利用圖像的空間信息。基于復Wishart分布的局部MAP競爭(Local Competitive Wishart, LCW)算法利用一種簡單的思想,基于初始復Wishart分類器的分類結果,在局部窗口中利用局部競爭的方式對分類結果進行迭代[20]。圖1展示了該算法的核心思想,假設圖像中共包含9種地物類型,在對像素i進行分類時,以圖1(b)的形式對像素取一個局部窗口,首先對該窗口內部地物類別類中心進行更新,需要對比的數據類別從9個減少為4個,并且由于局部局限性,像素i必定會被分到ω1、ω2、ω5和ω6中的一個類別中,而不會被分為其他類別;當更新完局部類中心并得到窗口中每類地物的局部偽先驗概率后,對i進行分類。因此可以把LCW算法看作是局部窗口內的Wishart-MAP分類器。LCW算法中使用的MAP分類器是在式(3)的基礎上,將式中的先驗概率P(ωm)替換為偽先驗概率。由于我們無法得到地物的真值,因此只能使用偽先驗概率。在LCW算法中,偽先驗概率P(ωm)指的是在上一次迭代結果中該像素窗口內ωm類地物所占的像素個數比例。LCW算法的流程如圖2所示,具體細節如下: 1) 獲取每一類訓練集X={x1x2…xM},xi表示第i類樣本點的集合。計算初始類中心Σ={Σ1Σ2…ΣM},M表示圖像中像素種類的個數。 2) 利用Wishart分類器對圖像進行初始分類。 3) 以分類后圖像中每個像素Zi為中心取w×w大小的窗口。 4) 利用窗口中的數據更新局部類中心Σl={Σ1Σ2…ΣR},R≤M,R表示窗口中像素種類的個數。 5) 計算窗口內ωr類地物的偽先驗概率,利用式(3)對中心像素Zi重新分類,若滿足d(Ci,Σr) 6) 得到分類圖像返回第3)步。迭代直到收斂,輸出最終分類結果。 (a) 圖像示意圖 (b) 局部競爭算法示意圖 圖1 局部競爭思想 圖2 LCW算法流程圖 混合模型通過充分考慮區域的不均勻性來保持空間相關性,從而更好地描述極化SAR圖像中的非均勻區域。對于Wishart混合模型,目前,主要有兩種混合策略:一種是使用Wishart混合模型對整個圖像進行建模(Mixture Wishart for a Whole Image, MWW)[14],另一種則是使用Wishart混合模型對圖像中的一類數據進行建模(Mixture Wishart for a Class, MWC)[21]。根據文獻[22] 可知,MWC模型對于極化SAR圖像地物分類的準確率更高,因此本文主要討論MWC模型。本小節首先介紹了MWC模型,然后將該模型與MRF結合,構造基于MRF的混合Wishart分類模型。 1.3.1MWC混合模型 根據文獻[21] 可知,MWC模型假設每個地物類型的數據都由多個Wishart分布來擬合。假設圖像共包含M種地物類型,每一種類型的數據由K個Wishart分布混合建模,每一個Wishart分布的中心協方差矩陣由Σk,k=1,2,…,K表示,每一個Wishart分布的權重為πk,并且權重取值滿足 (5) 則對于ωm類數據,Wishart混合模型的概率密度函數如下式所示: (6) 1.3.2MRF模型 假設圖像由二維網格S={sxy,1≤x≤m,1≤y≤n}表示,則定義在S上面的隨機場X如果滿足以下兩個條件,則X是一個馬爾科夫隨機場, (7) 式中,Si表示圖像中除去像素i之外的所有像素,ηi表示像素i的鄰域。 根據Hammersley-Clifford定理[23]可知,MRF的聯合概率與Gibbs分布等價, (8) U(xi)=-β∑j∈ηiδ(xi-xj) (9) 式中,β>0是空間平滑參數,本文中取經驗值1.4[17,24]。 設Y={yi,i∈S}為待觀測圖像,X={xi,i∈S}為Y的類別標簽。根據貝葉斯準則,類別標簽xi的后驗概率為 (10) P(yi)的取值與xi無關,因此,在先驗概率與似然概率均已知的情況下,xi的取值可通過最大化后驗概率來確定: (11) 式中:p(yi|xi)為待觀測數據的后驗概率,可以根據MWC模型計算得到;P(xi)為先驗概率,根據MRF模型計算得到。將式(4)與式(9)相結合,能夠得到基于MRF的Wishart混合模型,下文中簡稱為MWC-MRF模型,該模型如下所示: (12) 為了驗證混合Wishart模型的有效性,我們分別用經典Wishart模型和MWC模型來擬合真實的極化SAR數據。該實驗使用的數據為Radarsat-2衛星獲取的美國舊金山港灣C波段全極化數據,入射角度為28.02°~ 29.82°。該圖像獲取于2008年4月9日,圖像大小為1 453×1 387。該數據經過多視處理,并用7×7窗口的Lee濾波進行降噪,圖中有明顯的海洋、森林、城市3類主要區域。圖3展示了該地區的Pauli分解偽彩色圖像,圖像中框出的部分為實驗所選擇的區域。由圖像可以看出,實驗所選擇的城市和森林地區均為不均勻區域。 圖3 舊金山地區Pauli分解偽彩色圖像 多視極化SAR圖像數據的一般形式為3×3的極化協方差矩陣,可以看作一個9維隨機向量,圖4給出了對角線元素的擬合結果,分別對應HH、HV和VV三個極化通道的強度。圖4中每一行對應一種地物類型,每一列對應一個極化通道。 由圖4展示的數據擬合結果可以看出,相比于Wishart模型,混合Wishart模型更加貼合數據的真實分布。尤其對于城市區域,通過圖4 (g) ~ (i)可以看出,Wishart模型對城市區域的建模效果并不理想,真實數據分布(藍色圓圈)與Wishart模型(紅線)的分布有較大的差異。對于海洋和森林區域,兩種模型對于數據的擬合程度相差不大,但是混合Wishart模型對于真實數據的貼合程度更高。因此可以得出結論,與Wishart模型相比,混合Wishart模型能夠更加準確地對均勻和不均勻的區域進行建模,誤差較小。 圖4 舊金山數據擬合結果 農田分類一直是極化SAR圖像的重要應用之一。在本實驗中,我們將對比復Wishart分類器、LCW分類器、MWC模型與MWC-MRF模型在真實極化SAR圖像上的分類效果。同時,SVM分類器也是農田分類中經常使用的一種分類器[25],我們也將展示SVM的分類結果。實驗所用的數據是由Radarsat-2衛星獲取的位于德國Bamling 地區的農田圖像,為了驗證上述算法在多時相圖像分類中的分類結果穩定性,我們分別采用2014年5月28日和2014年8月18日兩幅此處的圖像。在分類實驗中,我們截取了920×500大小的子區域作為實驗數據,該區域主要包含大麥、玉米、土豆、甜菜、小麥5種地物類型。圖5給出了該區域的兩時相Pauli分解偽彩色圖和對應的地面真值圖,兩幅圖像在實驗前均用7×7窗口的Lee濾波進行了處理。在實驗中,我們隨機選取該區域的每類地物13%的像素為訓練集。 圖5 德國Bamling農田數據 2.2.1LCW參數估計 在LCW算法中,窗口大小w的取值十分重要。根據該算法的核心思想以及本實驗所采用的德國農田數據(圖5)可知,農田塊的形狀不規則而且區域較小,w值取太大會導致窗口內包含較多的地物類別,無法體現出局部競爭策略的優勢。如果w取值太小,則窗口中的像素數量太少,無法計算出準確的局部類中心,會導致建模不準確,影響分類的準確性。 因此,為了使LWC算法的分類效果達到最優,我們研究了w的不同取值對分類效果的影響。實驗中,我們設置迭代收斂條件為本次分類結果未變化的像素個數/總像素個數>99.5%,w的取值范圍設為5~21,分別用不同w取值的LWC算法對2014年5月28日所獲取的農田圖像進行分類,w取值的變化對分類準確率的影響如圖6所示,迭代次數或窗口大小為0表示使用復Wishart分類器得到的初始分類結果。從圖6(b)可以看出,LCW算法的分類效果對w的取值十分敏感,剛開始分類準確率隨著w取值的增大而提升,當w取值超過17時,分類準確率開始下降,局部競爭的策略開始失去優勢。根據圖6的實驗結果,在后續實驗中,我們將w的值設為17。 (a) 使用不同大小窗口的算法迭代次數與分類精度的折線圖 (b) 窗口大小對分類準確率的影響圖6 參數w取值與分類精度的關系 2.2.2 結果分析 圖7 Wishart-ML方法2幅時相德國農田分類結果 圖8 MWC-ML方法2幅時相德國農田分類結果 本小節主要分析各個算法對多時相數據的分類性能,圖7~圖11展示了5種分類算法的分類結果。從圖7和表1可以看出,經典的復Wishart分類器得到的分類結果并不理想,兩幅分類圖像中的噪點較多,且分類準確率較低。同時,該方法對多時相數據的分類效果波動較大,總體的分類準確率波動于74.51%至61.98%之間,出現約13%的起伏。尤其是對于玉米和土豆這兩類地物出現了大量錯分,準確率分別從60.43%和56.95%降低到52.79%和48.72%。由此可見,Wishart模型雖然具有較低的計算復雜度,但是并不能準確地對該農田數據進行建模。由圖8可以看出,與經典的復Wishart分類器相比,混合Wishart模型的分類效果較好,對兩幅圖像的分類準確率均有了提升,由此可以證明MWC模型比Wishart模型對數據的擬合更好,這與第2.1節中的分析結果一致。然而,雖然分類效果有所提升,但MWC模型的總體分類準確率依然不高, 說明混合模型也無法解決復雜區域精細分類問題。 MWC-MRF模型是對MWC模型的優化,利用了MRF去獲取像素的空間信息,從而降低噪聲對分類的影響。從圖8和圖9可以看出,與MWC相比,MWC-MRF模型的分類結果噪點較少,區域完整性更高,分類準確率和Kappa系數也更高。LCW算法同樣利用了圖像的空間信息,根據圖10和表1的數據可以看出,LCW算法的整體分類準確率和Kappa系數值明顯高于另外三種模型,但是在8月18日的分類結果里有三種地物的分類準確率低于MWC-MRF,原因是在使用Wishart分類器對8月18日數據進行初始分類后,有幾類地物的分類準確率很低,在LCW算法進行局部競爭時,由于初始分類效果較差導致窗口內的正確分類地物相對較少,使得局部競爭難以得到正確的結果。由此可見,LCW算法的分類準確率很大程度上取決于初始分類結果,初始分類結果差的情況下,無法通過LCW獲得較好的結果。但相對而言,LCW分類圖像中的噪點較少,區域完整性也較好。從實驗結果可以看出,4種模型對同一區域的分類效果均會受到時間的影響,8月份獲取的農田圖像分類準確率明顯低于5月份獲取的圖像。LCW算法雖然也受到了影響,分類準確率下降約13%,但是整體的分類準確率在幾個模型里還是最高的。 圖9 MWC-MRF方法2幅時相德國農田分類結果 圖10 LCW方法2幅時相德國農田分類結果 為了更好地評估本文所提出方法的分類性能,我們還使用目前分類效果較好的SVM分類器對德國農田的極化SAR圖像進行分類,如圖11所示。觀察SVM分類器的分類結果與表1中的數據,并且與LCW算法的分類結果進行對比,可以發現LCW算法的分類性能有較大的優勢。對多時相數據的分類結果,圖10比圖11的平均分類精度有10%左右的提升,這說明LCW分類器在對極化SAR圖像分類時,能夠有效利用上下文信息,是一種具有高魯棒性的分類算法。 圖11 SVM方法2幅時相德國農田分類結果 表1 農田分類結果對比 續表 另外,從表1可以發現每個分類器對8月18日的數據分類效果都不太好。因為在德國,夏大麥和冬大麥的收割季節都在7—8月;該地區的小麥的收割期也在7—8月,土豆和玉米在6—8月份已發育成型,不再生長。因此這些地物的散射類型和強度都較為相似,容易被誤分類,造成了8月18日各類地物的分類正確率較低。 對于極化SAR圖像區域形狀不規則、區域較小、分布不均勻等帶來的分類困難,以及多時相圖像分類結果有時差異較大等問題,本文提出了一種基于復Wishart分布的MAP算法,該算法基于Wishart分類器的分類結果,在每個像素的局部窗口內使用MAP分類器,并進行多次迭代,直到結果收斂。實驗對比研究了4種基于Wishart分布的極化SAR圖像分類算法,包括復Wishart分類器、混合Wishart分類器,基于MRF的混合Wishart分類器和本文提出的局部競爭Wishart算法,并將混合Wishart模型與經典Wishart模型進行了對比。同時,為了證明所提出方法的魯棒性,也將SVM分類器的結果進行了對比。 實驗結果表明,LCW算法的分類效果優于其他算法,分類準確率和Kappa系數值遠高于其他算法。此外,通過對真實數據的擬合結果和分類結果進行分析,我們可以得出結論,與Wishart模型相比,混合Wishart模型能夠更加準確地對均勻和不均勻的區域進行建模,其分類的準確率也更高。而將MRF與混合Wishart模型相結合,有效地利用了圖像的空間信息,能夠進一步提升分類效果,但對于地形復雜的區域,優化的效果依然有限。本文所提出的LCW算法利用了空間上下文信息,得到的整體分類結果優于MWC-MRF模型;同時該算法采用的復Wishart分布模型較為簡單,與MWC-MRF模型相比時間成本更低。因此,本文所提出的LCW分類器是一種高效、穩定的分類算法,在復雜場景下能夠取得較為良好的效果。但該算法也有一些明顯的缺點,一是需要效果較好的初始分類結果作為基礎,由5月28日的實驗結果可以看出,當初始分類結果較好時,使用LCW能夠對分類準確率有進一步的提升,而由于局部競爭自身所具有局限性,在一些初始分類效果較差的區域,局部窗口內被誤分類的像素點較多,影響了窗口內地物的偽先驗概率,會導致窗口中心像素難以被正確分類,同時該中心像素的分類結果也會影響周圍其他待分類像素的分類情況。從8月18日數據的大麥、玉米和甜菜的分類準確率就不如MWC-MRF的結果也可以看出,初始分類較差的情況下,LCW的分類準確率并不能提升太多。因此,可以針對局部競爭策略進行改進,例如將Wishart距離度量與其他距離度量相結合,提高局部競爭的分類準確率。 此外,通過觀察可以發現實驗結果中的土豆和甜菜兩類地物的分類邊界效果不好,原因是這兩類地物計算得到的類中心數據的數值較為相似,因此在分類時容易造成誤分類。因此可知LCW對特征相似地物的區域邊界的保持效果并不好,這一點仍需在后續研究中改進,例如可以使用特征增強等方法,以得到更為準確的分類結果。 致謝感謝德國宇航中心(German Aerospace Center,DLR)提供多時相RADARSAT-2 德國Bamling 地區數據以及地面真值。1.2 基于局部競爭策略的MAP分類器



1.3 基于馬爾科夫隨機場(MRF)的混合Wishart分類算法







2 實驗結果與分析
2.1 模型驗證


2.2 分類結果與分析











3 結束語