田 淞, 宋建社, 張雄美, 任偉龍
(1. 第二炮兵工程大學七系, 陜西 西安 710025;
2. 重慶通信學院二系, 重慶 400035)
?
KM-SVM法的SAR圖像無監督變化檢測
田淞1,2, 宋建社1, 張雄美1, 任偉龍1
(1. 第二炮兵工程大學七系, 陜西 西安 710025;
2. 重慶通信學院二系, 重慶 400035)
摘要:針對合成孔徑雷達(synthetic aperture radar, SAR)圖像變化檢測獲得有標記樣本的數量十分有限且困難,傳統方法檢測率低等問題,提出了一種基于原始特征空間的K均值和支持向量機(K-means and support vector machine, KM-SVM)法SAR圖像無監督變化檢測。首先,不需要任何先驗信息的條件下,利用K-means聚類方法獲取差異圖像的分類閾值;其次,利用閾值,引入偏移量,自動選取偽訓練集和無標簽集,并用偽訓練集定義SVM的初始決策超平面;最后,用基于統計特征的半監督學習算法和支持向量機相結合對圖像進行變化類與非變化類的分類。實驗結果表明:該算法優于基于混合高斯分布模型的KI法和基于廣義高斯分布模型的KI法,能保持較好的分類、泛化能力和較穩定的檢測精度。這些結果表明了文中方法的有效性。
關鍵詞:合成孔徑雷達圖像; 變化檢測; 半監督學習; K-均值聚類; 支持向量機
0引言
變化檢測是指給定同一地區或同一目標在不同時間獲得的配準后的遙感圖像,采用圖像處理的方法檢測出該地區(或目標)地物的變化情況,通過對不同時相遙感圖像的綜合分析獲取變化信息,是實現遙感監測的重要手段。合成孔徑雷達(synthetic aperture radar,SAR)因具有全天候、全天時、寬幅成像、多極化、可變觀測角、穿透能力強和高分辨率等特點,SAR圖像變化檢測已成為當前遙感監測的前沿技術之一。目前,SAR圖像變化檢測技術已廣泛應用于自然災害監測、植被和森林變化、地面目標監視[1-7]等領域。
SAR圖像變化檢測的典型方法有:比較后分類,分類后比較和聯合分類,其中比較后分類方法具有簡單、直觀、易于理解等優點被廣泛關注,如基于混合高斯分布模型的EM法[8]、基于混合高斯分布模型的KI法(KI threshold selection criterion based on Gaussian model, GM-KI)、基于廣義高斯分布模型的EM法[9]、基于廣義高斯分布模型的KI法(KI threshold selection criterion based on general Gaussian model, GGM-KI)[10]、基于廣義Gamma模型的KI法[11],還有采用瑞利-高斯模型[12]、非高斯分布模型[13]方法等。這些方法通常需要假定差異圖像上變化類與無變化類灰度值的統計分布模型,統計分布不同,選取的閾值也就不同。當假設的統計分布模型能恰當的反映SAR圖像不同類別分布時,這些方法就能有效提取出變化信息;當圖像不同類別差異較小或圖像受噪聲影響嚴重,使這些先驗信息不恰當時,這些方法通常難以獲得滿意的效果,特別是當變化類和無變化類的灰度值分布是相互交疊時,基本不能實現變化信息的有效獲取。
基于上述分析,提出了K均值和支持向量機(K-mean and support vector machine, KM-SVM)法的SAR圖像無監督變化檢測方法。該方法利用K-means聚類算法獲取差異圖像在原始特征空間上的偽訓練集和無標簽集;在此基礎上,利用偽訓練集和無標簽集數據信息共同訓練SVM[14-15]后,用SVM完成變化檢測,無需任何先驗信息實現最優變化檢測的目的。
1基于KM-SVM的SAR圖像變化檢測方法
設I1和I2分別為t1,t2時刻,同一區域,經配準后的SAR圖像,大小均為P×Q。分別對圖像I1和I2進行預處理,預處理包括對SAR圖像的輻射、幾何定標等處理。ωu,ωc分別為圖像像素無變化類和變化類集合,即Ω={ωu,ωc}。算法分為3步:①對數比值差異圖構造;②K-means聚類算法獲取偽訓練集和無標簽集;③使用混合樣本訓練SVM,利用無標簽集樣本信息,得到一個泛化性能更好的分類器。
1.1對數比值差異圖構造
差異圖構造應使Ω中的2類差異增強,便于檢測分類。SAR圖像中存在相干斑噪(specklenoise,SN),它是由SAR的工作機制造成的,為了減低其對后續處理的影響。本文采用對數比值算子構造差異圖像XDI,即
(1)
采用對數比值算子構造差異圖有3個主要優點:一是比值差異圖像的分布僅與圖像I1和I2強度的相對變化有關,與像素強度的大小無關。無論區域內像素的強度強或弱,變化檢測的尺度是相同的;二是比值算子具有更強的魯棒性。因為SAR成像過程中產生的乘性輻射誤差,能夠在重復軌道成像中精確重現,比值算子可以消去這種誤差。三是對比值算子取對數,可以減小比值差異圖像的波動范圍,便于變化檢測處理。
1.2偽訓練集和無標簽集的生成
在SAR圖像變化檢測過程中,先驗信息的獲取是困難的;另外由于相干斑噪的影響,獲得的先驗信息存在較大誤差,而聚類分析是一種無監督方法,不需要任何先驗信息。K-means是一種簡單、常用的聚類方法。首先選擇2個樣本作為初始聚類中心,按照聚類域中所有樣本到聚類中心的距離平方和最小的原則,使其他樣本向各個中心聚集,然后判斷分類是否合理,不合理則繼續迭代,直到聚類中心不再發生改變為止。得到2個聚類中心值{k1,k2},從而獲得閾值T(即T=[max{k1,k2}+min{k1,k2}]/2)。T是無變化類ωu和變化類ωc的粗分類閾值,靠近閾值T附近的像素處在2種類別的臨界狀態,受到誤差影響,一般分類精度較低,直接分類效果較差。但閾值T是正確定義偽訓練集Xp的一個參考點,如圖1所示,首先把不確定其標簽的區域定義為無標簽集Xu,有
(2)
同時,具有高概率屬于ωu和ωc的樣本定義為偽訓練集Xp,有
(3)
式中,ε是用于確定偽訓練集和無標簽集的邊界調整系數。ε值越大,Xp中樣本數量越少,可靠性越高;反之,則Xp中樣本數量越多,可靠性越低。ε的設置應保證Xp中樣本獲得正確標簽的概率較高。偽訓練集中無變化類和變化類標簽分配如下:
(4)
一般情況下,ε的取值根據差異圖像的灰度值范圍確定。也可以定義更為復雜的ε取值方法,但考慮到計算復雜度和對最終變化檢測結果影響,根據經驗一般取ε=0.5。

圖1 偽訓練集和無標簽集生成示意圖
1.3SVM的半監督學習分類檢測
這一部分的主要思想是在多時相SAR圖像的原始特征空間中定義決策函數,把無變化類和變化類樣本精確分類。偽訓練集樣本的選取是基于平衡折中方法,不能完整表述無變化類和變化類的統計特征,因此利用無標簽樣本信息可以進一步提高SVM的分類和泛化能力[16]。
核函數選擇——在支持向量機中核函數起著非常重要的作用,它能夠解決非線性問題和維數災難問題。核函數的作用是代替高維特征空間中的內積運算,從而避免復雜的高維運算。統計學習理論指出,只要對稱函數K(x,y)滿足Mercer條件就能作為核函數[17]。當缺乏先驗信息或先驗信息不可靠時,最好的方法是選用球面核[18],即高斯徑向基函數核:

初始化—利用標準SVM作為代價函數和偽訓練集Xp(包含偽變化類數據和偽無變化類數據)獲得初始分類超平面。
(5)
式中,C1是正則化參數;φ(·)是非線性映射函數;n表示偽訓練樣本數量;為處理不可分樣本,引入偽訓練樣本的松弛變量ξp;根據標準SVM的符號要求,ωu和ωc的類標簽分別用“-1”和“+1”表示,即yp∈{ωu,ωc}≡{-1,+1}。
半監督學習—無標簽集樣本通過半監督學習后,SVM使用偽訓練集和無標簽集組成的混合樣本進行訓練,得到一個分類和泛化性能更好的分類器。文中采用的半監督學習SVM是利用無標簽樣本的均值特征,替代估計每一個無標簽樣本標簽,得到最優分類超平面。
半監督SVM的優化問題[19]為
(6)
式中,ξp和ξu為偽訓練樣本和無標簽樣本的松弛變量,以及相應的懲罰系數C1和C2;n表示偽訓練樣本數量;m表示參與訓練的無標簽樣本數量。為了構造無標簽集Xu中的2類樣本均值統計特征,則
(7)

(8)
即
(9)
因此,式(7)和式(6)是等價的。由于
(10)
得
(11)

(12)

(13)
式中,α=[α1,…,αN,αN+1,αN+2]T為Lagrange乘子,y=[y1,…,yN,1,-1]T為類標簽集,Kij=(φi)T(φj)為核函數,其中非線性映射函數為
使用交替優化算法求解式(13),得到最終分類超平面。
2實驗結果及分析
為了驗證上述算法的有效性,進行了相關實驗,這里給出2組實驗,驗證本文算法的有效性。
2.1數據描述
實驗1的SAR圖像如圖2所示。變化檢測原始圖像分別為1997年5月和8月加拿大渥太華地區的Radarsat-1SAR影像,如圖2(a)和2(b)所示。圖像尺寸均為350×290,灰度級為256,配準誤差為1.5個像素左右。前后兩時相的變化信息主要是因為5月雨季來臨,洪水淹沒了部分陸地所致。圖2(c)為變化檢測參考圖,圖中的白色像素表示兩時相間發生變化的區域,像素個數為16 049。

圖2 渥太華地區水災SAR圖像
實驗2的SAR 圖像如圖3所示。變化檢測原始圖像是分別在1999年4月和5月瑞士Bern城市ERS-2的SAR圖像。前一時相的SAR圖像是在水災發生前獲取的,如圖3(a)所示;后一時相的SAR圖像是在水災發生后獲得的,圖像中陰暗部分為洪水淹沒區域,如圖3(b)所示。圖像大小均為 301×301像素,灰度級為256。圖3(c)為變化檢測參考圖,圖中白色像素表示兩時相間發生變化區域,像素個數為1 155。
其中支持向量機優化后的參數選擇為C1=100,C2=0.1,高斯核寬度2σ2∈(0.1,1)。

圖3 Bern城市水災SAR圖像
2.2實驗結果
實驗 1對數比算子生成的差異圖XDI,max(XDI)為4.060 4,min(XDI)為0。根據K-means聚類得到的閾值T=1.104 7,取ε為0.5,按照規則偽訓練集Xp中xp≤0.552 35屬于無變化類ωu共71 457個樣本,xp≥1.657 05屬于變化類ωc共8 784個樣本,無標簽集Xu樣本為21 259個。SVM是小樣本情況下的機器學習,其分類超平面僅與支持向量有關,因此對偽訓練集和無標簽集重采樣,測試KM-SVM方法的分類和泛化能力,以及利用無標簽樣本的開放式半監督學習能力。在學習過程中充分利用樣本均值統計特征,提高學習效率;并與GM-KI和GGM-KI法的檢測結果進行比較,如表1和圖4所示。

表1 渥太華地區水災圖像變化檢測結果分析

圖4 渥太華地區變化檢測結果
實驗 2對數比算子生成的差異圖XDI,max(XDI)為5.347 1,min(XDI)為0。根據K-means聚類得到的閾值T=1.649 1,取ε為0.5,按照規則偽訓練集Xp中xp≤0.824 55屬于無變化類ωu共87 239個樣本,xp≥2.473 65屬于變化類ωc共624個樣本,無標簽集Xu樣本為2 738個。實驗結果如表2和圖5所示。

表2 Bern城市水災圖像變化檢測結果分析

圖5 Bern城市變化檢測結果
2.3實驗分析
利用典型變化檢測算法,包括GGM-KI算法和GM-KI算法,與KM-SVM算法相比較,表1和表2分別給出檢測結果。從表中數據可以得出以下幾點結論。
(1) GGM-KI算法要優于GM-KI算法,這是因為廣義高斯統計分布模型的適用范圍更廣。
(2) 對于GGM-KI算法和GM-KI算法,表1和圖4顯示的變化檢測結果較好,而表2和圖5的結果相對較差,是因為GGM和GM模型與渥太華數據集數據模型更匹配。充分說明基于統計分布模型的檢測算法結果受統計分布模型選擇的影響較大。
(3) KM-SVM算法得到更優的結果,并且檢測結果相對穩定,這是因為KM-SVM算法不需要模型選擇,并且SVM支持非線性分類,對于不同類別相互交疊的情況,也有較好的分類能力。
(4) 在2組實驗中,KM-SVM算法的檢測精度分別提高了8%和13%,是因為利用了無標簽集的數據信息,能夠進一步優化分類決策超平面。
(5) 在運算時間上,KM-SVM算法明顯比GGM-KI算法和GM-KI算法要長,主要是半監督學習過程運算量較大,時間耗費較多。
3結論
本文提出的KM-SVM法的SAR圖像變化檢測,通過半監督學習,提取無標簽數據信息,可以獲得較穩定、較好的變化檢測結果,不會隨著SAR圖像數據源的變化而出現較大波動。該方法是一種無監督的方法,首先用K-means算法對對數比值差異圖進行聚類,得到粗分類的閾值,對該閾值加上松弛量將像素點分成有標簽的偽訓練樣本和無標簽樣本;然后,聯合利用偽訓練樣本和無標簽樣本訓練SVM,此時,是用無標簽樣本均值特征來修正由偽訓練樣本訓練得到的初始分類面,得到更優的分類超平面,以提升檢測效果。實驗結果證明,該方法可行、有效。下一步工作是利用圖像空間上下文信息進一步提高變化檢測精度。
參考文獻:
[1] Bouaraba A, Younsi A, Belhadj A A, et al. Robust techniques for coherent change detection using cosmo-skymed SAR images[J].ProgressinElectromagneticsResearchM, 2012, 22:219-232.
[2] Lincy P, Dr Ramamoorthy P. Synthetic aperture radar image change detection using fuzzy C-means clustering algorithm[J].InternationalJournalofAdvancedResearchinComputerandCommunicationEngineering, 2013, 2(3):1374-1379.
[3] Meghana P M K, Ravikumar A V. Robust technique for change detection in multitemporal synthetic aperture radar images[J].InternationalJournalofScientific&EngineeringResearch, 2013, 4(7):2228-2235.
[4] Radke R J, Andra S, Al-Kofahi O, et al. image change detection algorithms:a systematic survey[J].IEEETrans.onImageProcessing, 2005, 14(3):294-307.
[5] Fransson J E S, Walter F, Blennow K, et al. Detection of storm-damaged forested areas using airborne CARABAS-II VHF SAR image data[J].IEEETrans.onGeoscienceandRemoteSensing, 2002, 40(10):2170-2175.
[6] Bovolo F, Marin C, Bruzzone L. A hierarchical approach to change detection in very high resolution SAR images for surveillance applications[J].IEEETrans.onGeoscienceandRemoteSensing,2013,51(4):2042-2054.
[7] Huang S Q, Liu D Z, Hu M X, et al. Multi-temporal SAR image change detection technique based on wavelet transform[J].ActaGeodaeticaetCartographicaSinica, 2010, 39(2):180-186.(黃世奇, 劉代志, 胡明星,等. 基于小波變換的多時相SAR圖像變化檢測技術[J].測繪學報, 2010, 39(2):180-186.)
[8] Bruzzone L, Fernandez P D. Automatic analysis of the difference image for unsupervised change detection[J].IEEETrans.onGeoscienceandRemoteSensing, 2000, 38(3):1171-1182.
[9] Bazi Y, Bruzzone L, Melgani F. Image thresholding based on the EM algorithm and the generalized distribution[J].PatternRecognition, 2007, 40(2):619-634.
[10] Hu Z L. An unsupervised change detection approach based on KI dual thresholds under the generalized Gauss model assumption in SAR images[J].ActaGeodaeticaetCartographicaSinica, 2013, 42(1):116-122.(胡召玲.廣義高斯模型及KI雙閾值法的SAR圖像非監督變化檢測[J].測繪學報,2013,42(1):116-122.)
[11] Gao C S, Zhang H, Wang C, et al. SAR change detection based on generalized Gamma distribution divergence and auto-threshold segmentation[J].JournalofRemoteSensing, 2010, 14(4):718-724.(高叢珊, 張紅, 王超,等.廣義Gamma模型及自適應KI閾值分割的SAR圖像變化檢測[J]., 遙感學報, 2010, 14(4):718-724.)
[12] Wang G T, Wang Y L, Jiao L C. Adaptive spatial neighborhood analysis and rayleigh-Gaussian distribution fitting for change detection in multi-temporal remote sensing images[J].JournalofRemoteSensing, 2009, 13(4):639-646.
[13] Moser G, Serpico S B. Generalized minimum-error thresholding for unsupervised change detection from SAR amplitude imagery[J].IEEETrans.onGeoscienceandRemoteSensing, 2006, 44(10):2972-2983.
[14] Zhang Y Y, Liu M H, Han T. Elevator-waiting people counting system based on mean shift segmentation and SVM classification[J].OpticsandPrecisionEngineering, 2013, 21(4):1079-1085.(張宇洋,劉滿華,韓韜. 基于Mean Shift圖像分割和支持向量機判決的候梯人數視覺檢測系統[J].光學精密工程, 2013, 21(4):1079-1085.)
[15] Zhou Z H . Disagreement-based semi-supervised learning[J].ActaAutomaticaSinica, 2013, 39(11):1871-1878.(周志華. 基于分歧的半監督學習[J].自動化學報,2013,39(11):1871-1878.)
[16] Bruzzone L, Chi M, Marconcini M. A novel transductive SVM for semisupervised classification of remote-sensing images[J].IEEETrans.onGeoscienceandRemoteSensing, 2006, 44(11):3363-3373.
[17] Burges C J. A tutorial on support vector machines for pattern recognition[J].KnowledgeDiscoveryandDataMining, 1998, 2(2):121-167.
[18] Chapelle O, Vapnik V, Bousquet O, et al. Choosing multiple parameters for support vector machines[J].MachineLearning, 2002, 46(1):131-159.
[19] Bovolo F, Bruzzone L, Marconcini M. A novel approach to unsupervised change detection based on a semisupervised SVM and a similarity measure[J].IEEETrans.onGeoscienceandRemoteSensing, 2008, 46(7):2070-2082.
[20] Li Y F, Tsang I W, Kwok J T, et al. Tighter and convex maximum margin clustering[C]∥Proc.ofthe12thInternationalConferenceonArtificialIntelligenceandStatistics, 2009:344-351.
田淞(1975-),男,講師,博士研究生,主要研究方向為遙感圖像處理、模式識別。
E-mail:cqtianyi423@sina.com
宋建社(1954-),男,教授,博士研究生導師,主要研究方向為合成孔徑雷達信號處理、圖像處理、信息建模和系統工程。
E-mail:songjshe@126.com
張雄美(1983-),女,講師,博士,主要研究方向為遙感圖像處理。
E-mail:zxw.ok@163.com
任偉龍(1988-),男,博士研究生,主要研究方向為合成孔徑雷達圖像處理。
E-mail:renweilong350@163.com

網絡優先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20141121.0934.007.html
KM-SVM approach to unsupervised change detection in SAR images
TIAN Song1,2, SONG Jian-she1, ZHANG Xiong-mei1, REN Wei-long1
(1. 7thDepartment,SecondArtilleryEngineeringUniversity,Xi’an710025,China;
2. 2ndDepartment,ChongqingCommunicationInstitute,Chongqing400035,China)
Abstract:It is difficult to obtain training data in practical synthetic aperture radar (SAR)image change detection tasks, and the detection rates of classical methods are low. A K-means and support vector machine (KM-SVM) approach, which aims at extracting the change information in the original feature space without any training data, is proposed. First, the threshold of difference images is selected by the K-means clustering method. Second, an offset should be obtained for deriving an unlabeled set and a pseudo-training set that is necessary for initializing a binary support vector machine (SVM) classifier. Finally, according to a semi-supervised learning algorithm based on statistical characteristics, the SVM performs change detection by considering unlabeled data in definition of the decision boundary between unchanged and changed pixels. Experiment results show that, the proposed approach achieves better performance, higher generalization ability and more stable change detection precision, than the classical GM-KI, GGM-KI methods. These results prove the efficiency of the proposed approach.
Keywords:synthetic aperture radar (SAR)images; change detection; semi-supervised learning; K-means; support vector machine (SVM)
作者簡介:
中圖分類號:TP 751
文獻標志碼:ADOI:10.3969/j.issn.1001-506X.2015.05.10
基金項目:國家自然科學基金(61072141,61132008)資助課題
收稿日期:2014-05-04;修回日期:2014-10-23;網絡優先出版日期:2014-11-21。