張臘梅 張思雨 董洪偉 朱 廈
①(哈爾濱工業大學電子與信息工程學院 哈爾濱 150001)
②(北京市遙感信息研究所 北京 100192)
合成孔徑雷達是非常成熟的一種主動模式微波遙感技術,不依賴于太陽光源,不受云、霧、雨、雪等自然氣候影響,具備全天候、全天時的對地觀測能力。極化SAR通過發射兩個相互正交的電磁波,結合電磁波的極化信息以及合成孔徑雷達(Synthetic Aperture Radar, SAR)的優良特性從而更加有效地對地面進行觀測,在地物與土地利用[1]、海洋表面遙感、綠色植物覆蓋[2]等方面發揮了重要作用。圖像分類一直是極化SAR圖像解譯中的重要部分。對于極化SAR圖像而言,限制分類精度的主要因素在于噪聲。盡管對極化SAR圖像的濾波方法有很多[3,4],但都無法完全去除噪聲的影響,并且在進行極化SAR圖像監督分類時,訓練樣本的標定范圍隨機性很強,存在重采樣問題。
隨著機器學習的發展,大量半監督[5]、無監督[6-8]和全監督[9-11]的分類方法被應用于極化SAR圖像分類。相比全監督的方法,無監督的圖像分類方法省略了人為標注的過程,但由于其分類精度無法令人滿意,因此應用水平較低。目前基于深度表示學習的方法展現了更好的數據擬合能力[12],但訓練神經網絡所需的海量監督信息是極化SAR圖像分類任務中所不具備的。在大量機器學習經典算法中,支持向量機[13]方法因其在小樣本情況下表現出很好的學習能力和泛化能力,在極化SAR圖像分類中的應用最為廣泛[14,15]。但是,原始的C-SVM(Support Vector Machine)通過求解兩類之間的最大間隔來確定分類超平面,其分類效果很容易受到噪聲和樣本采樣區域的影響[16],因此魯棒SVM一直以來被廣泛的研究[17,18],但多數研究是以大幅提高算法復雜度為代價得到的魯棒算法[19,20]。Huang等人[21]提出的基于Pinball損失函數支持向量機Pinball loss Support Vector Machine (Pin-SVM),通過求解最大分位數距離,在較小的復雜度下提高分類器的穩定性和魯棒性。
本文從契合實際應用環境的角度,提出一種基于Pin-SVM的極化SAR圖像分類方法。算法利用融合后的極化SAR圖像的散射和紋理特征,使用網格搜索與交叉驗證結合的方式[22]尋找最優超參數組合,求解最大分位數距離以確定SVM的分類超平面,以較低的算法復雜度實現對特征噪聲和重采樣具有較好魯棒性的極化SAR圖像分類。

Huang等人[21]根據分位數距離求解分類間隔,基于Pinball損失函數使分位數距離最大化。Pinball損失函數通過對正確分類的樣本附加一定的懲罰以提高對特征噪聲及重采樣的不敏感性,Pinball損失函數的表達式為

將式(2)帶入到式(1)中可得Pin-SVM的基本形式






從而可以得到Pin-SVM的另一種表達形式


根據這3個被標記的集合,可以將式(7)轉化為


圖1 0-1損失、Hinge損失與Pinball損失的對比Fig. 1 The form of 0-1 loss, Hinge loss and Pinball loss

圖2 不同超參數取值下Pin-SVM分類示意圖Fig. 2 Schematic diagram of Pin-SVM classification with different hyperparameter
通過對極化SAR圖像的極化特性與紋理特性進行分析,本文利用極化協方差矩陣多成分目標分解[24],H-A-分解[25]以及灰度共生矩陣[26]方法分別提取常用的12種極化特征和紋理特征,并構成極化SAR圖像分類的原始特征集

在對特征向量進行訓練之前,首先需要對特征向量中的每一種特征進行加權優化處理,以提高多種特征融合表達的效果。然而,如果采用人工分配的方法進行加權,工作量很大,而且很難保證分類結果的可信度,因此,本文采用歸一化巴氏距離對特征向量進行加權處理。巴氏距離[27]描述的是某一特征對兩類地物的可區分度,如果巴氏距離較大,則該特征可以很好的區分這兩類地物,如果巴氏距離較小,則這兩類地物在該特征中很難區分。巴氏距離的表達式為


非參數模型的建模機理導致了超參數對支持向量機的泛化能力有很大影響。本文采用的核函數方法為高斯核函數,主要考慮對線性不可分的樣本集合引入的誤差懲罰參數、高斯核參數和影響分位數距離的變量對分類器的影響。
使用網格搜索法與交叉驗證法結合的方式進行超參數選擇。首先利用網格搜索法確定各參數的選擇范圍:誤差懲罰參數有種選擇,高斯核參數有種選擇,參數有種選擇,將3種參數交叉組合可以得到種組合方式。然后利用交叉驗證法將全部訓練樣本分成10份,每次將訓練樣本集合中的1份樣本作為訓練集,其余9份樣本作為測試集,重復10次上述過程,并根據平均分類精度的大小來選擇最優的超參數組合。
本文提出的分類算法的流程圖如圖3所示,算法具體的操作步驟如下:
步驟1 使用精致LEE濾波[28]對原始極化SAR數據進行相干斑過濾;
步驟2 將極化SAR圖像的典型地物進行人工標注,并在每一類地物中隨機抽取一部分樣本構成訓練集和測試集;
步驟3 通過極化目標分解和灰度共生矩陣提取極化SAR圖像的極化特征和紋理特征,構成目標的原始特征向量;
步驟4 根據每一種特征的歸一化巴氏距離,對原始特征向量進行加權處理得到融合后的特征向量;

圖3 基于Pin-SVM的極化SAR圖像分類流程Fig. 3 Flowchart of PolSAR classification based on Pin-SVM
步驟5 在訓練集上采用網格搜索與十折交叉驗證結合的方法,在指定的參數范圍內搜索Pin-SVM的最優超參數組合,訓練得到Pin-SVM;
步驟6 利用最終得到的Pin-SVM,在測試集上得到算法的分類精度,并對極化SAR圖像進行全圖分類。
實驗采用的數據是EMISAR在Foulum地區獲取的L波段全極化協方差矩陣數據,該圖像的大小為1100×750,空間分辨率為2 m×2 m,其光學圖與Pauli分解的偽彩色RGB合成圖分別如圖4(a)和圖4(b)所示,該地區主要包括建筑物、森林、裸地以及豌豆、馬鈴薯、油菜、小麥等很多不同種類的農作物。通過大致比對光學圖,把整幅圖像劃分為5類:建筑物、森林、裸地、細徑作物和闊葉作物,選取的地物類別分布如圖4(c)所示。
實驗中從每類地物選取1200個像素進行人工標注,并從中隨機取出100個樣本作為訓練集,其余樣本作為測試集。本文選取高斯核函數,采用網格搜索與十折交叉驗證法選擇最優的參數組合C,和,最后根據“一對一”多分類策略對EMISAR數據進行全圖分類,Pin-SVM分類結果如圖5(a)所示。可以看出,Pin-SVM對EMISAR圖像的分類效果較好,左側和右上角的森林區域用黃色很好地標注出來,右上角和右下角的“楓葉形”和“馬蹄形”建筑區域的輪廓較為清晰,裸地也表現出清晰的紋理。兩種農作物之間有少數像素誤分,但整體上能夠與森林和建筑物清晰劃分。可以從兩個角度分析,從極化特征的角度,因為森林和建筑物區域散射隨機性較強,散射機理較為復雜,極化散射熵值較高,各向異性度值較小,而兩種農作物散射機理較為單一,極化散射熵值較小,各向異性度值較高;從紋理特征的角度,農作物區域地形較為均勻,表現為粗紋理,而森林和建筑物區域地形復雜,表現為細紋理,因此兩種作物區域的能量ENY和反差距IDM更大,熵ENT、對比度CON、和平均SAV更小。
為了驗證本文方法的有效性,采用C-SVM分類器、監督Wishart分類器、最小二乘支持向量機(Least Square SVM, LSSVM)以及基于Hinge損失的極限學習機(OPTimization based Extreme Learning Machine, OPTELM)實驗作為對比模型,對實驗數據進行了分類實驗,分類結果分別如圖5(b)-圖5(e)所示。通過圖5(a)-圖5(e)對比,可以看出基于Pin-SVM和C-SVM分類器的分類結果圖中各地物的紋理比較清晰,但是C-SVM分類結果中包含較多雜點,Pin-SVM的分類結果中雜點較少,特別是在森林區域,C-SVM會將很多森林區域的樣本判定為建筑物,而Pin-SVM對建筑物與森林的分類結果更好。監督Wishart分類器僅僅采用極化相干矩陣進行分類,沒有結合紋理特征和H,A,因此出現將不同地物之間的邊界以及森林區域有很多誤分為建筑物的現象。LSSVM分類器也同樣出現雜點較多的問題,OPTELM分類器對各地物的劃分效果都不太理想,尤其是建筑物與森林、細徑作物與闊葉作物出現誤分現象較為明顯。

圖4 Foulum地區EMISAR實驗數據Fig. 4 EMISAR experimental datas of Foulum test site
表1為不同分類器對各地物測試樣本的分類精度對比,分類精度=(分類算法正確分類的樣本點個數)/(測試樣本像素點個數),其中Pin-SVM,C-SVM,監督Wishart, LSSVM和OPTELM的整體分類精度分別為91.3%, 86.7%, 84.0%, 84.5%和84.0%。

圖5 EMISAR圖像分類結果對比Fig. 5 Classification results comparison of EMISAR image

表1 不同分類器對測試樣本的分類精度(%)Tab. 1 Classification accuracy comparison of different classifiers
圖6展示了各地物分類精度的對比圖,從圖中可以看出Pin-SVM對各種類型地物的分類精度均高于C-SVM。綜合全圖分類實驗的結果可知:相比于傳統的C-SVM分類方法,基于Pin-SVM的分類算法對極化SAR圖像中各類地物均具有更好的性能,整體分類精度也更高。由于二者使用完全一致的特征輸入,而此特征數據中必然存在一定程度的噪聲,較高的分類精度也能夠側面印證提出的算法具有一定的噪聲魯棒性。



圖6 不同分類器對各地物分類精度的對比圖Fig. 6 The comparison of the classification accuracy of different terrains

圖7 分類器預測的概率密度函數對比Fig. 7 Comparison of probability density functions for the prediction of classifiers

表2 重采樣實驗結果Tab. 2 Experimental results of the resampling
圖8給出了法向量w和偏置b穩定性的對比,從中可以看出,重采樣后C-SVM的法向量w和偏置b的標準差都大于Pin-SVM,相比C-SVM, Pin-SVM對于重采樣具有更好的魯棒性。

圖8 重采樣的魯棒性評估Fig. 8 Robustness evaluation of resampling

圖9 Pin-SVM的參數對分類精度的影響Fig. 9 The effect hyperparameters of Pin-SVM on classification accuracy
支持向量機在小樣本情況下表現出了良好的學習能力和泛化能力,在極化SAR圖像分類中應用廣泛。但是極化SAR圖像中的噪聲會傳遞至圖像特征以影響C-SVM的分類精度,同時標定樣本的隨機性會影響C-SVM的分類決策面的穩定性,這兩點均不利于實際應用。本文基于Pin-SVM提出一種極化SAR圖像地物分類的新方法,以提高對特征噪聲和重采樣的魯棒性。通過Foulum地區EMISAR數據對提出算法的分類精度、重采樣穩定性、噪聲不敏感性和類內離散程度等方面進行實驗分析,結果表明本文算法相對于傳統方法具有更好的地物分類效果,對噪聲和重采樣有更強的魯棒性。