劉 振,姜 暉,徐海峰
(解放軍電子工程學院,合肥 230037)
Fisher線性鑒別分析(Fisher Linear Discriminant Analysis,FLDA)[1]通過最大化投影空間中樣本的類間散度與類內散度之比來求取最優的投影方向,是一種有效的特征提取方法。但是,FLDA在用于圖像的特征提取時有如下幾點不足:一是FLDA只是對高斯分布最優的,即FLDA是以所有類別的樣本數據服從協方差相同、均值不同的高斯分布為前提的;二是在計算散度矩陣時只考慮了類中心,不能有效地提取類的邊界信息,而邊界信息往往同樣具有重要的鑒別信息[2];三是因為類間散度矩陣的秩最大只能為C-1(C代表總的類別個數),FLDA提取的特征個數最多只有C-1,而在高維數據及多類目標的識別任務中C-1個特征往往是不夠的;四是一般圖像轉換成圖像矢量之后的維數往往會很高,遠遠大于樣本的個數,即會出現小樣本問題。針對上述問題,文獻[3-8]對FLDA進行了一定的改進。文獻[3]將主成分分析(Principle Component Analysis,PCA)與FLDA相結合,緩解了FLDA的小樣本問題,但使用PCA降維會丟失有用的鑒別信息。文獻[4]直接在二維圖像矩陣上進行FLDA的特征提取,大大降低了散度矩陣維數,緩解了小樣本問題,提取的特征也不受 C-1的制約。文獻[5]提出最大散度差(MaximumScatter Difference,MSD)判決分析,通過最大化投影后樣本的類間與類內散度矩陣之差來求解投影方向,避免了對類內散度矩陣求逆,不會出現FLDA的小樣本問題,并且大大加快了特征抽取的速度。文獻[6-7]提出子類判決分析(Subclass Discriminant Analysis,SDA),先對每類目標進行子類劃分,然后基于這些子類使用FLDA準則求取投影方向,SDA假設每類目標服從多模分布,可在一定程度上緩解FLDA的線性和奇異性問題,且得到的特征維數為子類總數減1(大于C-1)。文獻[8]通過構造非參數形式的散度矩陣,使用非參數特征分析(Nonparametric Feature Analysis,NFA)求取投影方向,NFA能夠捕捉到類的邊界結構信息,并且不要求數據服從高斯分布,提取的特征也可以大于C-1。
本文在借鑒非參數特征分析(Nonparametric Feature Analysis,NFA)[8]的基礎上,提出二維非參數特征分析方法(Two Dimensional Nonparametric Feature Analysis,2DNFA),大大降低了散度矩陣的維數,并根據圖像矩陣的行信息和列信息的壓縮方向,給出了兩種形式的2DNFA。二維非參數特征分析不僅克服了FLDA只對數據高斯分布最優的缺陷,有效地提取了類的邊界信息,而且降低了散度矩陣的維數,有效緩解了鑒別分析的“小樣本”問題,所提取的特征個數也不再受到C-1的制約。將該方法用于對SAR圖像目標的識別:在SAR圖像矩陣上直接計算非參數形式的散度矩陣,進行非參數特征分析獲取特征矩陣,最后基于最近鄰分類器對待識別目標進行分類識別。利用美國運動和靜止目標獲取與識別(Moving and Stationary Target Acquisition and Recognition,MSTAR)計劃錄取的切片SAR數據庫進行了仿真實驗,結果表明兩種形式的2DNFA能夠以較低的特征維數獲得高達98%以上的識別率,驗證了本文方法有效可行。


分析式(1)~(3)以及參照圖1可以看出:FLDA的參數化散度矩陣的構造僅僅依靠類中心(如圖1虛線箭頭所示),而NFA打破了FLDA的固有限制,散度矩陣不再僅僅依賴類中心,而是由樣本的近鄰樣本來計算,當近鄰數為1時,NFA的類間散度即如圖1實線箭頭所示,如此構造散度矩陣更能體現數據的結構特征,提取的特征數也不再受到C-1的制約;從權值系數 ω(i,j,p,l)的式(3)定義可以看出,當樣本在類邊界上時ω(i,j,p,l)的值可達到或接近0.5,隨著樣本遠離邊界ω(i,j,p,l)趨向于0,權值系數 ω(i,j,p,l)使NFA更加注重對邊界信息的提取[9-10]。

圖1 NFA非參數類間散度與FLDA參數類間散度Fig.1Nonparametric between-class scatter of NFA and parametric between-class scatter of FLDA
利用式(1)和式(2)計算散度矩陣之后,最優投影方向 Wopt=[w1,w2,…,wd]∈R(m×n)×d(d (m×n))可以通過對進行特征值分解來求得,的前d個最大特征值對應的特征向量即構成Wopt。對于任意樣本數據 x ∈R(m×n)×1,它在投影空間中的特征 f∈Rd×1為


權值系數為 ω(i,j,p,l)定義如下:


在式(6)~(9)中,A(i,j)代表矩陣A第i行j列的元素,kb、kw和α定義與第二節相同。類似于一維情況,最優投影方向 Wopt∈Rn×r(r n),即由的前r個最大特征值對應的特征向量構成。有時會出現不可逆的現象,需要對進行非奇異化處理,可使用正則化方法[11]:,μ則取為的最大特征值,In×n是n×n的單位矩陣。對于任意樣本數據 A∈Rm×n,它在投影空間中的特征 F2DNFA∈Rm×r為

從式(5)、(6)和(9)可以看出,2DNFA方法是建立在圖像矩陣行的基礎上,即對行信息進行鑒別,同樣,也可以從圖像的列方向上進行鑒別分析。下面給出2DNFA的另一種形式——基于圖像列方向的2DNFA(Alternative 2DNFA,A2DNFA)。


實驗數據采用美國MSTAR計劃錄取的數據,選擇 17°俯仰角 下的 BMP2-sn9563、BTR70-snc21、T72-sn132共698個樣本作為訓練樣本集;選擇俯仰角為 15°下的 BMP2-sn9563、BMP2-sn9566、BMP2-snc21、BTR70-snc71、T72-sn132、T72-sn812、T72-sns7共1 365個樣本作為測試樣本集,原始數據中每幅SAR圖像的大小為128×128。圖2給出了基于2DNFA的SAR圖像目標識別主要步驟的流程圖。

圖2 基于2DNFA的SAR圖像目標識別流程圖Fig.2 Flow chart of SAR image target recognition based on 2DNFA
為了更好地提高識別性能,需要對圖像切片進行一定的預處理[12]:通過對數變換來減小目標圖像的動態范圍并抑制乘性噪聲,恒虛警閾值分割和形態學濾波可以進一步減小噪聲的影響,基于冪變換的圖像增強可以突出圖像的某些信息,歸一化處理消除了目標相對于SAR的距離不同造成的回波強度差異,最后對圖像進行二維傅里葉變換,以保證目標的平移不變性。因傅里葉變換幅頻特性具有對稱性,為了壓縮樣本維數減小運算量,取幅頻信息的一半作為特征提取的輸入,這樣預處理后數據的大小為128×64。
參照3.1節和3.2節對預處理后的訓練樣本進行2DNFA和A2DNFA方法的特征提取,求出2DNFA的投影矩陣 Wopt∈Rn×r(r n),和A2DNFA的投影矩陣 Vopt∈Rm×l(l m)。根據式(9)和式(12)即可求出任意訓練樣本 Ai∈Rm×n和測試樣本 T∈Rm×n在兩種投影空間中的特征矩陣。
為了體現本文方法提取特征的有效性,使用最簡單的最近鄰分類器對測試目標進行識別:先計算測試樣本與每個訓練樣本在特征空間的距離,與測試樣本距離最小的訓練樣本的類別即為該測試樣本的類別。分別對2DNFA和A2DNFA的投影空間中的距離做如下定義。
(1)基于2DNFA特征的距離定義

(2)基于A2DNFA特征的距離定義

使用前文介紹的訓練樣本和測試樣本進行本文方法的仿真驗證,測試樣本方位角信息未知,識別率取所有測試樣本的平均識別率。為了簡化參數的選取,預先假設計算類間散度矩陣的近鄰數kb與類內散度矩陣時的近鄰數kw相等,同取為k。特征維數l和r 分別取 38、34、30、26、22、18、14、10、6、2。
圖3(a)和(b)顯示了2DNFA和A2DNFA在特征維數不同取值下參數 α對識別率的影響,其中散度矩陣近鄰個數 k=116。從圖中可以看出,在r=2時,2DNFA識別率仍可以達到95%以上,A2DNFA的識別率也可以達到92%,兩者在一定維數下識別率均可以達到98%以上,說明本文方法提取的特征信息具有良好的可鑒別性。從兩幅圖中還可以看出α對識別率的影響不是很大,所以為了降低算法的運算量,可以取 α=1。

圖3 2DNFA和A2DNFA在α取不同值下的識別率Fig.3 Recognition rate of 2DNFA and A2DNFA against α
圖4(a)和(b)顯示了2DNFA和A2DNFA在特征維數不同取值時,α=1,散度矩陣近鄰個數 k對識別率的影響。從圖中可以看出,本文方法對參數k也具有一定的魯棒性,不同k值的識別率在一定特征維數下均可以達到98%以上。2DNFA在不同k值下識別率都在 95%以上;只有A2DNFA在 k=230、特征維數l=2時識別率不到85%。可見k取值并不是越大越好,一般取每類訓練樣本個數的一半即可[8]。

圖4 2DNFA和A2DNFA在參數k不同值下的識別率Fig.4 Recognition rate of 2DNFA and A2DNFA against k
綜合圖3、圖4可知,2DNFA和A2DNFA在較低的特征維數下即可達到識別率的峰值,因此特征維數一般選擇在6~14即可。還可以看出,隨著維數的進一步增大,2DNFA識別率反而出現下降的趨勢,A2DNFA則在一定達到維數后識別率趨于穩定。
為了進一步驗證本文方法的有效性,表1給出了本文識別結果與文獻[13-15]識別結果的比較。可以看出兩種形式的2DNFA獲得的識別率均可高于其他方法的最優識別率,并且所需特征矩陣的維數也較小,更加驗證了本文方法的有效性。

表1 不同方法的識別率比較Table 1 Comparison of recognition rate using different methods
本文提出了兩種形式的二維非參數特征分析的特征提取方法。該算法直接在圖像矩陣上提取特征,不僅能夠大大地降低樣本維數、減小運算復雜度,而且非參數形式的散度矩陣計算克服了傳統鑒別分析的缺陷,有效利用了類的邊界信息,即使在方位角未知的情況下仍然可以獲得較高的識別率。通過與其他方法比較可以看出,本文方法能夠以較低的特征維數達到提高識別率的目的,表明本文方法可行有效。本文僅僅是對參數α和k進行了人為的設定,如何在保證識別率的同時自適應地選擇最小k值來降低訓練時間是下一步需要研究的問題。
[1] Swets D L,Weng J.Using discriminant eigenfeatures for image retrieval[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(8):831-836.
[2] Fukunaga K.Statistical Pattern Recognition[M].Salt Lake City:Academic Press,1990.
[3] Swets D L,Weng J.Usingdiscriminant eigenfeatures for imageretrieval[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(8):831-836.
[4] Zheng W S,Lai J H,Li S Z.1D-LDA vs 2DLDA:when is vector based linear discriminant analysis better than matrix based[J].Pattern Recognition,2008,41(7):2156-2172.
[5] 劉永俊,陳才扣.最大散度差鑒別分析及人臉識別[J].計算機工程與應用,2006,42(34):208-210.LIU Yong-jun,CHEN Cai-kou.Maximum scatter difference discriminant analysis andface recognition[J].Computer Engineering and Applications,2006,42(34):208-210.(in Chinese)
[6] Zhu M,Martinez A M.Subclass discriminant analysis[J].IEEE Transactions on Pattern Analysis and Machine Intelli-gence,2006,28(8):1274-1286.
[7] 張靜,王國宏,楊智勇,等.基于二維子分類鑒別分析的SAR圖像識別方法研究[J].電子學報,2010,38(4):797-803.ZHANG Jing,WANG Guo-hong,YANG Zhi-yong,et al.An Efficient Two-DimensionalSubclassDiscriminantAnalysisApproach for SAR Image Recognition[J].Chinese Journal of Electronics,2010,38(4):797-803.(in Chinese)
[8] Li Zhifeng,Lin Dahua,Tang Xiaoou,et al.Nonparametric Discriminant Analysis for Face Recognition[J].Pattern AnalysisMachine Intelligence,2009,31(4):755-761.
[9] Li Zhifeng,Liu Wei,YANG Zhi-yong,et al.Nonparametric Subspace Analysis for Face Recognition[C]//Proceedings of 2005 IEEE Conference on Computer Vision and Pattern Recognition.San Diego,CA,USA:IEEE,2005:961-966.
[10] Zhan Xueliang,Ma Bo.Kernel Nonparametric Discriminant Analysis[C]//Proceedings of 2011 International Conference on Electrical and ControlEngineering.Yichang:IEEE,2011:4544-4547.
[11] 胡利平.合成孔徑雷達圖像目標識別技術研究[D].西安:西安電子科技大學,2009.HU Li-ping.Automatic target recognition based on synthetic aperture radar images[D].Xi′an:Xidian University,2009.(in Chinese)
[12] 韓萍,吳仁彪,王兆華,等.基于KPCA準則的SAR目標特征提取與識別[J].電子與信息學報,2003,25(10):1297-1301.HAN Ping,WU Ren-biao,WANG Zhao-hua,et al.SAR Automatic Target Recognition Based on KPCA Criterion[J].Journal of Electronics and Information Technology,2003,25(10):1297-1301.(in Chinese)
[13] Hu Liping,LiuHongwei,YinKuiying,et al.Two-dimensional clustering-based discriminant analysis for synthetic aperture radar automatic target recognition[C]//Proceedings of the 8th International Symposium on Antenna,Propagation,and EM Theory.Kunming:IEEE,2008:509-513.
[14] Hu L P,Liu H W,Yin K Y,et al.Diagonal Clustering-Based Discriminant Analysis for Synthetic Aperture Radar Automatic Target Recognition[C]//Proceedings of 2009IET International Radar Conference.Guilin:IEEE,2009:1-4.
[15] Hu Liping,Liu Hongwei,Wu Shunjun.Two-Dimensional Maximum Clustering-Based Scatter Difference Discriminant Analysis for Synthetic Aperture Radar Automatic Target Recognition[C]Proceedings of the 6th International Symposium on Neural Networks.Wuhan:IEEE,2009:655-663.