施云飛 宋 千 金 添 周智敏
(國防科學(xué)技術(shù)大學(xué)電子科學(xué)與工程學(xué)院 長沙 410073)
超寬帶地表穿透雷達(dá)(Ground Penetrating Radar, GPR)通過發(fā)射低頻超寬帶信號獲取良好的土壤和植被穿透能力,廣泛應(yīng)用于地雷探測。特別是車載前視地表穿透雷達(dá)(Forward-Looking Ground Penetrating Radar, FLGPR)能夠快速、準(zhǔn)確地對單個地雷探測及雷場定位,具有安全距離長、探測面積大、探測速度快等優(yōu)點(diǎn),是一種安全可靠的探雷技術(shù)[1]。FLGPR作為前視成像雷達(dá)[2]的一種,能夠?qū)走_(dá)前方較大范圍的區(qū)域成2維圖像。其方位上為陣列天線,采用單元順序工作實(shí)現(xiàn)分時的合成孔徑工作方式。借用虛擬孔徑技術(shù)[3],F(xiàn)LGPR通過較少的接收天線和較小的實(shí)孔徑可以等效獲得更大的接收孔徑,因此又將此雷達(dá)稱為前視地表穿透虛擬孔徑雷達(dá)(Forward-Looking GroundPenetrating Virtual Aperture Radar, FLGPVAR)。代表系統(tǒng)有美國斯坦福研究所(SRI)[4]和美國規(guī)劃系統(tǒng)有限公司(PSI)[5]的車載 FLGPR。國內(nèi)研究剛剛起步,國防科大超寬帶實(shí)驗(yàn)室對車載FLGPVAR做了詳細(xì)和深入的研究,并取得較好成果[6]。
超寬帶虛擬孔徑體制具有很高的距離和方位向分辨率,目標(biāo)在2維雷達(dá)圖像中細(xì)節(jié)信息豐富,因此完全可以在圖像域?qū)崿F(xiàn)地雷與雜波的分類,所以FLGPVAR檢測地雷本質(zhì)上是一個基于圖像的目標(biāo)分類問題[7,8]。分類器對非訓(xùn)練樣本(也稱為測試樣本)的分類性能稱為泛化能力,是衡量分類器性能的重要指標(biāo)。AdaBoost是一種組合多個弱分類器的算法,通過選擇訓(xùn)練誤差最小的弱分類器,有效提高最終強(qiáng)分類器的泛化性能,被認(rèn)為是性能最好的分類方法之一[9]。但傳統(tǒng)的AdaBoost算法的特征篩選和分類器訓(xùn)練過程是分離的,其迭代過程中不包括特征選擇,其固定不變的特征集無法降低弱分類器的訓(xùn)練誤差,使得分類器性能不能用以指導(dǎo)特征選擇,同時特征選擇依據(jù)原則也缺乏針對性,也就無法有效改善分類器的泛化性能。文獻(xiàn)[10]提出的AdaBoost算法在迭代過程中加入特征選擇,但是特征選擇的代價函數(shù)與分類器性能無直接關(guān)系,是一種過濾式特征選擇算法[11]。文獻(xiàn)[12]提出基于Wrapper的嵌入式特征選擇算法,通過分類器訓(xùn)練誤差衡量特征集的優(yōu)劣,但每次只選擇一個而不是多個特征組成的特征集,依然無法將訓(xùn)練誤差降到最低。
本文在前兩種算法基礎(chǔ)上,提出在AdaBoost算法的迭代過程中,選擇能使弱分類器訓(xùn)練誤差最小的特征集,同時為降低地雷探測中的漏警率,以給定探測率時的虛警率作為訓(xùn)練誤差。通過這種方式得到的強(qiáng)分類器在保證探測率的同時有效降低了虛警率,還具有良好的泛化性能。本文結(jié)構(gòu)如下:第2節(jié)是弱分類器的設(shè)計(jì),第3節(jié)分析AdaBoost迭代過程中,如何選擇弱分類器才能提高強(qiáng)分類器的泛化性能,第4節(jié)研究AdaBoost迭代過程中特征選擇的代價函數(shù),第5節(jié)是比較不同分類算法在實(shí)測數(shù)據(jù)中的應(yīng)用;第6節(jié)是文章總結(jié)。
AdaBoost通過若干弱分類器的組合得到一個強(qiáng)分類器,弱分類器的性能影響AdaBoost的迭代次數(shù)及分類性能。地雷分類需要區(qū)分目標(biāo)和雜波,其中雜波是除地雷之外的一切物體。當(dāng)探測環(huán)境發(fā)生變化時,地雷特征變化不大,而雜波可能完全不同。但是實(shí)際中不可能獲得所有環(huán)境中典型的雜波樣本,這使得地雷分類更接近一類分類(one-class classification)問題[13]。因此使用超球面支持向量機(jī)(HS-SVM)為弱分類器,最終的強(qiáng)分類器由若干HS-SVM加權(quán)得到。



AdaBoost算法有非常小的泛化錯誤率,其具體流程略。在求解權(quán)重的過程中,以逐步遞增的方式增加基函數(shù),不調(diào)整已添加的基函數(shù)中的參數(shù)及其權(quán)重。如果第T?1步的分類器為

其中ht(x)為基函數(shù),βt為對應(yīng)基函數(shù)的權(quán)重,x為特征向量。定義代價函數(shù)為

文獻(xiàn)[14]指出,每次迭代過程中使代價函數(shù)P最小,能最大化分類邊界(margin),從而保證最終的強(qiáng)分類器有很好的泛化性能。所以第T步新增加的基函數(shù)hT及其權(quán)重βT要使代價函數(shù)最小,即




令式(9)兩邊等于零,得到

所以每次迭代過程中引入能使 (1/)P=N最小的弱分類器,并且該弱分類器的權(quán)值為就能得到泛化性能很好的強(qiáng)分類器。
傳統(tǒng)上,特征選擇研究如何從眾多特征中找到那些對分類識別最有效的特征,從而實(shí)現(xiàn)特征空間維數(shù)的壓縮。分類器研究對給定的訓(xùn)練數(shù)據(jù),尋找最優(yōu)的分類界面使訓(xùn)練誤差最小,并且分類器的泛化性能良好。特征選擇一般依據(jù)某種準(zhǔn)則函數(shù),對原始特征進(jìn)行變換降維。這些準(zhǔn)則包括類別可分性判據(jù)、Fisher準(zhǔn)則函數(shù)、判決邊界等。文獻(xiàn)[12]指出,以特征內(nèi)部相互關(guān)系為準(zhǔn)則得到的特征集,適合某些分類器但未必適合所有分類器。在分類器確定以后,特征選擇以降低分類器訓(xùn)練誤差為目的,將分類器訓(xùn)練誤差作為準(zhǔn)則函數(shù),這種結(jié)合特征選擇與分類器訓(xùn)練的模塊如圖1所示。

圖1 特征選擇與分類器訓(xùn)練模塊
由此在AdaBoost分類器的基礎(chǔ)上,將特征選擇與分類器訓(xùn)練模塊加入其迭代過程中,得到新的AdaBoost分類器結(jié)構(gòu),如圖2所示。其中di,i=1,… ,N表示樣本權(quán)值,wi,i=1,… ,N表示弱分類器權(quán)值。每次迭代過程中,遍歷所有特征組合,對不同的特征集和訓(xùn)練樣本,調(diào)整式(1)中弱分類器的參數(shù)C,得到不同特征集所對應(yīng)的訓(xùn)練誤差,選出能夠使訓(xùn)練誤差最小的特征集。對于錯分的樣本,增加其權(quán)值,重新選擇特征集及弱分類器。重復(fù)上述過程,直到滿足最大迭代次數(shù),最終訓(xùn)練得到一個強(qiáng)分類器。

圖2 結(jié)合自動特征篩選的AdaBoost分類器
考慮到所有特征的組合可能太多,這里引入順序前進(jìn)浮動選擇(Sequential Floating Forward Selection, SFFS)算法[10],以降低計(jì)算量。特征選擇過程中,如果將代價函數(shù)定義為 AdaBoost的代價函數(shù)其實(shí)考慮的是所有類別的分類誤差,忽略了不同類別分類錯誤所造成的不同代價。事實(shí)上,地雷探測中漏警后果遠(yuǎn)比虛警嚴(yán)重,應(yīng)分別設(shè)置漏警和虛警的權(quán)值。但手工設(shè)置權(quán)值比較武斷,因此考慮在保證探測率Pd不低于設(shè)計(jì)指標(biāo)的前提下,將虛警率Pf降至最低。AdaBoost的代價函數(shù)P分解如下:

其中N1和N2分別表示目標(biāo)和雜波的個數(shù)。由式(11)發(fā)現(xiàn)探測率Pd不變時,Pf最小等價于P最小。所以在 AdaBoost迭代過程中,最佳特征集ts=,其中T表示原始特征集,表示一恒定探測率。對于不同的特征集,調(diào)節(jié)式(1)中的C,通過訓(xùn)練數(shù)據(jù)擬合可以分別得到Pd和Pf隨C的變化函數(shù)Γ(C)和Λ(C),給定Pd后,得到閾值相應(yīng)的。定義特征選擇的代價函數(shù)J(·)為

通過 SFFS選擇特征集的過程中,選擇能使式(12)最小的特征集,以及該特征集所對應(yīng)的弱分類器。這樣得到的特征集和弱分類器在保證探測率的同時兼具良好的泛化性能。
將本文的 AdaBoost算法記為 AFS-AdaBoost(Adaptive Feature Selection AdaBoost),對FLGPVAR的實(shí)測數(shù)據(jù)分別使用傳統(tǒng)AdaBoost和AFS-AdaBoost這兩種算法分類,兩種算法的弱分類器都是HS-SVM。其中地雷的感興趣區(qū)域(Region Of Interest, ROI)的切片通過人工方式提取得到,總數(shù)為300個;雜波通過基于能量的檢測器[15]自動提取,總數(shù)為4000個。地雷和雜波的ROI如圖3所示。

圖3 地雷和雜波的ROI圖像
基于ROI的原始特征包括13個局部統(tǒng)計(jì)特征和9個圖像幾何特征[8],從這22個原始特征中挑出對分類器而言最有效的特征集。為驗(yàn)證分類算法的泛化性能,將數(shù)據(jù)分成10批,每批包括30個地雷和400個雜波。其中9批用于訓(xùn)練,剩下的用于測試,從而得到10次交叉驗(yàn)證的結(jié)果。
圖4是訓(xùn)練數(shù)據(jù)的探測率為0.97時,兩種分類算法的虛警率隨迭代次數(shù)的變化關(guān)系。從圖4可以看出,AdaBoost的虛警率在迭代次數(shù)達(dá)到50時基本不變,AFS-AdaBoost的虛警率在迭代次數(shù)達(dá)到20時基本不變。這表明AFS-AdaBoost的收斂速度快于AdaBoost。

圖4 兩種算法收斂速度比較
圖5是使用AFS-AdaBoost算法分類的結(jié)果,圖5(a)是訓(xùn)練數(shù)據(jù)的接收機(jī)工作特性(Receiver Operating Characteristics, ROC)曲線,表明隨著迭代次數(shù)的增加,訓(xùn)練誤差接近于零。從圖5(b)是測試數(shù)據(jù)的 ROC曲線,可以看出,隨著迭代次數(shù)不斷增加,分類器檢測性能持續(xù)改善,表明新的分類器在有效提取樣本分類信息的同時,具有控制過擬合的作用。

圖5 AFS-AdaBoost分類結(jié)果
圖6是兩種算法迭代次數(shù)都達(dá)到150時的檢測性能比較??梢钥闯?,AFS-AdaBoost具有更好的檢測性能。

圖6 兩種算法檢測性能比較
本文提出一種用于FLGPVAR地雷檢測的分類算法。這種算法在傳統(tǒng)AdaBoost分類器的基礎(chǔ)上,將特征選擇加入弱分類器的迭代過程中,并將恒探測率下的虛警率作為特征選擇的代價函數(shù),在保證探測率的同時有效降低弱分類器訓(xùn)練誤差,最終改善強(qiáng)分類器的泛化能力。實(shí)測數(shù)據(jù)結(jié)果表明,本文提出的分類算法其探測率是可控的,并且泛化能力較傳統(tǒng) AdaBoost算法有所提高,滿足地雷探測的要求。
[1] Liu Guo-qing, Wang Yan-wei, Li Jian, andet al.. SAR imaging for a forward-looking GPR system[C]. Proceedings of SPIE, 2003, Vol.5089: 322-333.
[2] 陳琦, 楊汝良. 機(jī)載前視合成孔徑雷達(dá) Chirp Scaling成像算法研究 [J]. 電子與信息學(xué)報, 2008, 30(1): 228-232.Chen Qi and Yang Ru-liang. Research of chirp scaling imaging algorithm for air-borne forward-looking SAR [J].Journal of Electronics&Information Technology, 2008, 30(1):228-232.
[3] Jin Tian and Zhou Zhi-min. Imaging model of forwardlooking ground penetrating radar with split-aperture transmitting configuration[C]. 2nd Asian and Pacific Conference on Synthetic Aperture Radar, Xi’an, China, 2009:21-24.
[4] Kositsky J, Cosgrove R, Amazeen C,et al.. Results from a forward-looking GPR mine detection system [C]. Proceedings of SPIE, 2002, Vol.4742: 205-217.
[5] Bradley M, Witten T, Duncan M,et al.. Mine detection with a forward-looking ground-penetrating synthetic aperture radar [C]. Proceedings of SPIE, 2003, Vol.5089: 334-347.
[6] 陸必應(yīng). 步進(jìn)頻率連續(xù)波探地雷達(dá)數(shù)字信號處理機(jī) [J]. 雷達(dá)科學(xué)與技術(shù), 2010, 8(3): 229-232.Lu Bi-ying. Digital signal processor of a SFCW ground penetrating radar [J].Radar Science and Technology, 2010,8(3): 229-232.
[7] 朱孝開. 基于核方法的圖像目標(biāo)識別技術(shù)研究[D]. [博士論文],國防科學(xué)技術(shù)大學(xué), 2009.Zhu Xiao-kai. Kernel methods for image object recognition[D]. [Ph.D. dissertation], National University of Defense Technology, 2009.
[8] 郭雷. 寬帶雷達(dá)目標(biāo)極化特征提取與核方法識別研究[D]. [博士論文], 國防科學(xué)技術(shù)大學(xué), 2009.Guo Lei. Wideband radar target polarimetric feature extraction and recognition method based on kernel method[D]. [Ph. D. dissertation], National University of Defense Technology, 2009.
[9] Freund Y and Schapire R E. A decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences, 1997,55(1): 119-139.
[10] Sun Yi-jun and Li Jian. Adaptive learning approach to landmine detection [J].IEEE Transactions on Aerospace and Electronic Systems, 2005, 41(3): 973-985.
[11] Guyon I and Elisseeff A. An introduction to variable and feature selection [J].Journal of Machine Learning Research,2003, 21(3): 1157-1182.
[12] Viola P and Jones M. Rapid object detection using a boosted cascade of simple features[C]. Proc. CVPR 2001, Hawaii,USA, 2001, 1: 511-518.
[13] Tax D. One-class classification: concept-learning in the absence of counter-examples [D]. [Ph.D. dissertation], Deflt University of Technology, 2001.
[14] Schapire R E, Freund Y, Bartlett P,et al.. Boosting the margin: a new explanation for the effectiveness of voting methods [J].The Annals of Statistics, 1998, 26(5): 1651-1686.
[15] Shi Yun-fei, Jin Tian, Song Qian,et al.. A segmentationbased CFAR algorithm for subsurface targets detection in FLGPVAR[C]. 20102nd International Conference on Signal Processing Systems, Dalian, China, July 5-7, 2010, 2:293-298.