李 平,徐 新,董 浩,鄧 旭
(武漢大學 電子信息學院,武漢 430072)(*通信作者電子郵箱xinxu@whu.edu.cn)
合成孔徑雷達(Synthetic Aperture Radar, SAR)是一種主動式高分辨率微波遙感器,并且具備全天候晝夜對地成像的能力[1]。極化信息提取能最大限度地將不同地物的散射特征以量的形式表現出來,揭示地物的散射差別,進而實現目標的分類與識別。目前,地物覆蓋類型和土地利用分類已經成為極化SAR最重要的應用之一[2]。
極化SAR可以通過極化分解得到大量的極化分解特征,然而,特征數量的增加并不能導致相應的分類精度提高,相反,有時可能會降低分類精度,同時增加計算時間和復雜度。目前,常用的方法有以支持向量個數作為評估準則,并輔助常用的搜尋策略進行特征尋優[3-7],但這種方法需要遍歷所有特征,在面對特征維數較多的情況下,該方法明顯比較繁瑣。文獻[8]通過特征線性判別分析(Linear Discriminant Analysis, LDA)來優選特征,提出一種面向對象的極化SAR分類方法;文獻[9]分析了極化特征對不同地物類型的刻畫能力,選擇適合每類地物類型的特征,提出一種多層分類的方法;文獻[10-14]利用可分性指數來選擇特征,但其所用的特征維數都較少,并基本上是極化SAR中的紋理特征和相關的指數特征,缺少對極化SAR目標分解特征的分析與描述,并且該方法中構建的發展決策樹算法,通過閾值分析來進行分類對于大樣本數據分類具有一定的局限性。支持向量機(Support Vector Machine, SVM)在非線性分類、樣本數目有限和高維模式識別中具有諸多的優勢[15],并且適用于小樣本情況,具有良好的泛化性。
有鑒于此,本文提出一種新的基于可分性指數和順序后退法(Sequential Backward Selection, SBS)[16]選擇特征并利用多層SVM進行分類的方法。該方法包括3步:
第1步 以可分性指數(Separability Index, SI)[10]確定各類地物的分類順序,初步篩選敏感特征;
第2步 將SI所選出的敏感特征采用順序后退法搜索特征子集,得到結果特征集;
第3步 利用SI確定的分類順序和SBS確定的敏感特征,利用多層SVM進行分類。
第一景數據為舊金山San Francisco地區L波段的RadarSat- 2星載全極化SAR數據,數據大小為1 600像素×1 200像素,分辨率為10 m。主要地物類型為水域、建筑和林地。如圖1所示。
第二景數據為荷蘭Flevoland地區C波段RadarSat- 2星載全極化SAR圖像。分辨率為8 m×12 m,圖像大小為1 400像素×1 200像素。主要地物類型為水域、耕地、建筑和林地。如圖2所示。兩景數據中白色區域為未定義類別,不參與分類評估。

圖1 San Francisco實驗數據

圖2 Flevoland 實驗數據
特征提取對極化SAR的分類十分重要。目標分解方法作為極化SAR數據特征提取的主要方法,它利用地物目標的不同散射機制,提取不同散射信息對地物目標進行分類。常用的極化目標分解特征如表1所示。
對于多個極化特征,如何選擇最優特征是比較關鍵的工作。在選擇特征時,其中最主要的原則就是該特征具有區分不同類別的能力。由此引入了特征可分性,當考慮兩類或更多類時,如果在該特征下的均值的距離大于該特征下標準差的距離,就認為該特征具有較好可分性[10]。可分性指數(SI)被定義為:
SIab=|μa-μb|/(Sa+Sb)
(1)
其中:μ和S分別表示a類和b類在某一特征下的均值和標準差。SIab值越大表明a類和b類之間的可分性越好,SIab的值在0.8和1.5之間說明該特征為有用特征,其值超過2表明該特征幾乎完全實現類類可分。

表1 極化分解特征
Flevoland數據地物類型較為豐富,故選擇該景數據進行實驗分析。特征分析實驗中每類地物選擇8 000個樣本點。首先,將SI指標應用于4類地物組成的對:1)水域和其他(林地、耕地和建筑);2)耕地和其他(水域、林地和建筑);3)林地和其他(水域、耕地和建筑);4)建筑和其他(水域、林地和耕地)。4類地物組成的四對類類地物在所有特征下的可分性指數如圖3所示。
在特征為香農熵時,水域的可分性指數SI>2。與其他類相比水域的可分性指數較大,因此選擇水域作為第一個分類目標,其可分性特征為H、α、Ks、Kd、CSE、l3、CHmA、CmHA、YPs。其可分性指數結果如圖3(a)。在選擇水域作為第一個分類目標后,其余三類地物作為待分類目標(耕地、林地和建筑),并需要將這三類地物組成對并求其可分性指數。剩余三類地物之間的分類過程按照以下方式完成:
1)耕地的可分性特征為FPs、α、Ks、Kd、CLUE、CPA、C1mH1mA、YPs、P1、P2,其可分性指數均在0.8 2)林地和建筑的可分性特征為FPv、A、CPH、CPF、CRVI、C1mHA、CHA、CH1mA、YPv、P3,其可分性指數也均在0.8 由于利用可分性指數在選擇具有可分性的特征時,沒有考慮特征之間存在冗余性。為進一步去掉特征之間的冗余,利用SVM的分類精度作為特征評估準則,采用順序后退法(SBS)作為搜索策略進行特征選擇。 圖3 各類地物在不同特征下的可分性指數 SBS作為常用的次優搜索算法,能極大減少計算量,并保證結果特征集具有較好的分類性能[16]。其具體步驟為: 1)輸入由可分性指數初步得到的特征集F={fi,i=1,2,…,k}。 2)計算各個特征fi(i=1,2,…,k)的分類精度Acc。 3)按照Acc的降冪對F中所有特征排序,得到排序特征集F′={fi′,i=1,2,…,k}其中Acc(fi′)>Acc(fj′)(i 4)按照Acc的降冪逐個選擇特征集F′中的特征fi′,將其作為待剔除特征。 5)對于第n個待剔除特征fn′,若Acc(F′fn′)>Acc(F′),則從F′中剔除fn′;否則保留。 6)令n=n+1,若n≤k,返回步驟4);否則,特征選擇結束,得到新的特征集F″。 表2給出了利用可分性指數進行初步特征選擇后,再輔助以順序后退法所選的特征。 表2 基于可分性指數和順序后退法所選特征 統計區域合并(Statistical Region Merging, SRM)算法在處理噪聲干擾具有高效的性能,并且它不依賴于數據分布,而這些優點使SRM適合于具有斑點噪聲的合成孔徑雷達圖像的分割。文獻[17]對其改進提出了廣義SRM算法,即GSRM(Generalized Statistical Region Merging)算法,使其可以適用于乘性噪聲,并能更好地應用于極化SAR數據的抗噪處理。其中,調節分割尺度的參數需要根據不同的應用需求來設置。本實驗中,數據1和數據2的尺度調節參數均為16。 在分類之前,采用GSRM分割對極化SAR圖像進行預處理,可以確定最小同質區域,方便后續的特征提取與分類,同時對噪聲具有一定的抑制作用。本文方法的流程如圖4所示。 圖4 多層SVM分類方法流程 在利用可分性指數和順序后退算法確定了各類地物的分類順序和可分性特征后,利用多層SVM對4類地物進行分類。該方法中SVM分類器的核函數為徑向基函數(Radial Basis Function, RBF)。RBF核函數在處理線性不可分的分類問題有較大優勢,其SVM核參數為默認參數,具體實現的步驟如圖5所示。 圖5 多層SVM分類方法的具體步驟 本文通過分析兩景實驗數據中的各類地物的分類精度和總體的分類精度來評價本文算法及對比算法。實驗硬件平臺為PC配置為i7處理器/16 GB內存,64位操作系統,軟件平臺為Matlab 2014a。對比實驗1為經典的Wishart監督分類;對比實驗2為多維特征+SVM;對比實驗3為利用可分性指數選擇特征和確定分類順序后直接進行分類;對比實驗4為在利用可分性指數和順序后退法選擇特征后,選擇隨機森林(Random forest)作為分類器,在后續描述中均用RT表示隨機森林算法。隨機森林算法實質是一個包含多個決策樹的分類器,這些決策樹的形成采用了隨機的方法,因此也叫作隨機決策樹,隨機森林中的樹之間是沒有關聯的。當測試數據進入隨機森林時,其實就是讓每一棵決策樹進行分類,最后取所有決策樹中分類結果最多的那類為最終結果。本實驗中,隨機森林中決策樹的個數ntree為10,迭代次數為200;對比實驗5為在利用可分性指數和順序后退法選擇特征后,將BP_AdaBoost作為分類器進行分類,在后續描述中均用Ada表示BP_AdaBoost方法。AdaBoost算法的分類的思想是合并多個弱分類器的輸出以產生有效分類。BP_AdaBoost模型即把BP神經網絡作為弱分類器,反復訓練BP神經網絡預測樣本輸出,通過AdaBoost算法得到多個BP神經網絡弱分類器組成的強分類器。該實驗中,構建的BP網絡數為6,最大訓練次數epochs為4,訓練要求精準度為0.000 04。訓練樣本為全數據的8%。San Francisco數據分類順序為先將水域從三類地物中分開,其所用特征為H、CSE、CmHA、ρHH-VV,再將建筑和林地分開,其所用特征為Kd、P3、CPH、ρRR-LL、A。其分類后的總體精度和分類結果如表3和圖6所示。表4中時間為各類算法的運行時間,單位為秒(s),本文將該運行時間作為運算復雜度的判斷指標。 表3 舊金山地區各類地物分類精度和總體分類精度 % 表4各種算法在舊金山地區的運行時間s Tab. 4 Running time of different algorithms for San Francisco data s 從整體結果分析:1)對比實驗1是經典的Wishart監督分類,實驗結果表明其對水域的分類效果比較理想,且其運行時間最短,復雜度較低,但其總體分類的準確率比其余5種算法差。2)對比實驗2為多維特征進行分類,其對林地的分類精度只有83.54%。3)對比實驗3為利用可分性指數初步進行特征選擇后直接進行多層SVM分類,相較于多維特征下SVM分類方法,林地的分類精度提高了7%,并且整體分類精度也有所提高。4)對比實驗4和對比實驗5為在利用可分性指數和順序后退法選擇特征后,分別利用隨機森林和AdaBoost分類器進行分類,從實驗結果可以看出,在這兩種分類器條件下,總的分類精度相近,但它們對林地的分類效果稍差,林地的分類精度分別為89.78%和89.89%。5)利用本文方法總體分類精度為95.81%,每類地物的精確度均高于90%。 由于San Francisco地區的地物較少,且地物之間的可分性也比較好,各種方法的總體分類精度相差約為1%,故選擇從運行時間,即各個算法的復雜度來分析。對比實驗3即SVM+SI的運行時間約為53 min,約為實驗4、5和6運行時間的3倍。San Francisco數據由可分性指數得到水域的可分特征數共有17個,為所用特征數目的1/2;林地和建筑由可分性指數得到的特征數共有13個。從實驗結果也可以看出,多維的特征并沒有取得理想中較高的分類準確率,并帶來了運行時間加長的厄運。在利用順序后退法對特征再次進行選擇后,實驗4、實驗5的運行時間分別為18 min和20 min,實驗6的運行時間約為15 min,復雜度降低。在SVM+SI+SBS算法下,時間相對最短,故而認為該算法的復雜度相對較小。 圖6 San Francisco數據分類結果 San Francisco數據只有水域、建筑和林地這三類地物,地物類別較少,為充分說明可分性指數在多層分類方法中的適用性,選擇具有水域、林地、耕地和建筑四類地物的Flevoland地區作驗證實驗。Flevoland數據分類后各地物的分類精度和分類結果分別如表5和圖7所示。表6為各種算法在Flevoland數據中的運行時間對比。 表5 Flevoland數據分類精度對比 % 從整體結果分析:1)對比實驗1對水域的分類效果依然比較理想,且運行時間最短。2)對比實驗2對建筑的分類結果較差,分類精度只有76.70%,但相比實驗1其總體分類精度有所提高。其運行時間為該幾種算法中最長的,約為1.68 h。3)對比實驗3和4的分類精度相接近,其中SVM+SI算法下,耕地的分類精度只有84.55%,而RT+SI+SBS算法下,建筑的分類精度只有82.51%。SVM+SI算法時間約為RT+SI+SBS的兩倍。4)在利用可分性指數和順序后退法選擇特征后,BP_AdaBoost和SVM兩種分類器下,總體分類精度相接近,但BP_AdaBoost算法的情況下,建筑的分類精度只有84.63%。同時,本文發現,在SVM作分類器進行分類時,每類地物的分類精度均在86%以上,且運行時間也比較短。 表6各種算法在Flevoland數據中的運行時間s Tab. 6 Running time of different algorithms for Flevoland data s 綜上,對于各類地物之間的可分性較好的極化SAR數據,僅由可分性指數選出的特征進行多層分類,沒有提高分類的準確率,且帶來了運算量大幅增加。在利用可分性指數和順序后退法選擇特征后進行多層分類,在SVM分類器的情況下,運行時間大幅度減少,且分類精度提高2%;在不同分類器的情況下,SVM分類器的分類效果相對較好,這也說明了支持向量機適用于小樣本情況,具有良好的泛化性。 圖7 Flevoland數據分類結果 本文提出一種基于可分性指數的多層SVM的極化SAR特征分析與分類方法,該方法解決了在面對高維特征情況下利用可分性指數初步篩選特征時特征之間依然會出現冗余的問題。可分性指數先將高維特征作第一步篩選,剔除了一部分特征,降低了特征的維數;然后利用順序后退選擇算法進行第二次特征選擇,進一步去除特征之間的冗余性。通過實驗證明了該方法的可行性和有效性。 下一步的研究方向主要是面向更豐富的地物目標類型,提出更多的可利用的特征,研究出各類地物的通用的敏感特征,用于極化SAR圖像的分類,以期在減災、土地利用等重要領域發揮積極作用。 References) [1] 李仲森.極化雷達成像基礎與應用[M].北京:電子工業出版社,2013:2.(LI Z S. Polarization Radar Imaging Foundation and Application [M]. Beijing: Publishing House of Electronics Industry, 2013: 2.) [2] 王超,張紅,陳曦.全極化合成孔徑雷達圖像處理[M].北京:科學出版社,2008:107.(WANG C, ZHANG H, CHEN X. Full Polarimetric Synthetic Aperture Radar Image Processing [M]. Beijing: Science Press, 2008: 107.) [3] 吳永輝,計科峰,郁文賢.SVM全極化SAR圖像分類中的特征選擇[J].信號處理,2007,23(6):877-881.(WU Y H, JI K F, YU W X. Feature selection in SVM full polarimetric SAR image classification [J]. Signal Processing, 2007, 23(6): 877-881.) [4] 吳永輝,計科峰,李禹,等.利用SVM的極化SAR圖像特征選擇與分類[J].電子與信息學報,2008,30(10):2347-2351.(WU Y H, JI K F, LI Y, et al. Characteristic selection and classification of polarimetric SAR images using SVM [J]. Journal of Electronics & Information Technology, 2008, 30(10): 2347-2351.) [5] 巫兆聰,歐陽群東,李芳芳.顧及特征優化的全極化SAR圖像SVM分類[J].測繪科學,2013,38(3):115-117.(WU Z C, OUYANG Q D, LI F F. SVM classification of fully polarimetric SAR images with feature optimization [J]. Surveying Science, 2013, 38(3): 115-117.) [6] 代琨,于宏毅,馬學剛,等.基于支持向量機的特征選擇算法綜述[J].信息工程大學學報,2014,15(1):85-91.(DAI K, YU H Y, MA X G, et al. Research on feature selection algorithm based on support vector machine [J]. Journal of Information Engineering University, 2014, 15(1): 85-91.) [7] 袁春琦,徐佳,程圓娥,等.顧及分類器參數的全極化SAR圖像特征選擇與分類[J].測繪科學技術學報,2016,33(5):507-512.(YU C Q, XU J, CHENG Y E, et al. Design and classification of full polarized SAR image based on classifier parameters [J]. Journal of Surveying and Mapping Science and Technology, 2016, 33(5): 507-512.) [8] 李雪薇,郭藝友,方濤.基于對象的合成孔徑雷達影像極化分解方法[J].計算機應用,2014,34(5):1473-1476.(LI X W, GUO Y Y, FANG T. Based on the object-based synthetic aperture radar image polarization decomposition method [J]. Journal of Computer Applications, 2014, 34(5): 1473-1476.) [9] 宋超,徐新,桂容,等.基于多層支持向量機的極化合成孔徑雷達特征分析與分類[J].計算機應用,2017,37(1):244-250.(SONG C, XU X, GUI R, et al. Analysis and classification of polarized synthetic aperture radar based on multi-layer support vector machine [J]. Journal of Computer Applications, 2017, 37(1): 244-250.) [10] CUMNLING I G, ZYL J J V. Feature utility in polarimetric radar image classification [C]// IGARSS’89: Proceedings of the 1989 International Canadian Symposium on Remote Sensing. Piscataway, NJ: IEEE, 2002: 1841-1846. [11] MISHRA P, SINGH D. A statistical-measure-based adaptive land cover classification algorithm by efficient utilization of polarimetric SAR observables [J]. IEEE Transactions on Geoscience & Remote Sensing, 2014, 52(5): 2889-2900. [12] WU F, WANG C, ZHANG H, et al. Rice crop monitoring in south China with RADARSAT- 2 quad-polarization SAR data [J]. IEEE Geoscience & Remote Sensing Letters, 2011, 8(2): 196-200. [13] GUPTA S, SINGH D, KUMAR S. An approach based on texture measures to classify the fully polarimetric SAR image [C]// Proceedings of the 2015 International Conference on Industrial and Information Systems. Piscataway, NJ: IEEE, 2015: 1-6. [14] JAIN A, SINGH D. Decision tree approach to classify the fully polarimetric RADARSAT- 2 data [C]// Proceedings of 2015 National Conference on Recent Advances in Electronics & Computer Engineering (RAECE). Piscataway, NJ: IEEE, 2015: 318-323. [15] VAPNIK V N. An overview of statistical learning theory [J]. IEEE Transactions on Neural Networks, 1999, 10(5): 988-99. [16] PUDIL P, NOVOVICOVJ, KITTLER J. Floating search methods in feature selection [J]. Pattern Recognition Letters, 1994, 15(11): 1119-1125. [17] LANG F, YANG J, LI D, et al. Polarimetric SAR image segmentation using statistical region merging [J]. IEEE Geoscience & Remote Sensing Letters, 2014, 11(2): 509-513. This work is partially supported by the Technology Research and Development Major Project of High-Resolution Earth Observation System (03-Y20A10- 9001- 15/16), the Comprehensive Disaster Demonstration Project of Spatial Information Services. LIPing, born in 1992, M. S. candidate. Her research interests include synthetic aperture radar image interpretation. XUXin, born in 1967, Ph. D., professor. His research interests include signal and information processing. DONGHao, born in 1990, Ph. D. candidate. His research interests include synthetic aperture radar image interpretation. DENGXu, born in 1993, M. S. candidate. Her research interests include synthetic aperture radar image interpretation.

2.3 多層SVM分類方法


3 實驗分析






4 結語