陳春林,張 禮,劉學軍
(南京航空航天大學 計算機科學與技術學院,江蘇 南京 211106)
針對SAR圖像的樹形稀疏表示結構識別算法研究
陳春林,張 禮,劉學軍
(南京航空航天大學 計算機科學與技術學院,江蘇 南京 211106)
為了提高SAR圖像的目標識別能力,在一般稀疏表示方法的基礎上,提出了一種基于樹形稀疏表示結構識別算法—稀疏表示樹,以提高目標型號的識別準確率。稀疏表示樹是由多個節點組成的樹形分類器,在每個節點上設計針對該節點設計的稀疏表示字典和分類器。在單個節點上利用稀疏表示算法求解未知樣本的特征向量,并按照重構誤差最小原則實現目標型號識別。稀疏表示樹方法根據父節點識別結果,將稀疏表示結果相似的樣本型號作為子集傳遞到子節點,并設計新的字典和分類器進行識別。在MSTAR SAR圖像數據集上的實測結果表明,所構建的稀疏表示樹與數據集數據分布情況一致,并且將目標型號識別率提高至84%,與傳統的稀疏表示分類器方法相比,在不增加太多時間開銷的條件下可有效提高目標型號的識別準確率。
SAR目標識別;型號識別;樹形信息字典;稀疏表示;字典學習
自動目標識別(Automatic Target Recognition,ATR)在社會安全、環境監測、國土防御等軍用和民用領域扮演著重要角色。合成孔徑雷達(Synthetic Aperture Radar,SAR)因其能突破光照、天氣、時間限制,獲得高分辨率的目標圖像等優勢,成為現代目標感知探測的重要手段,也是可靠的目標識別數據來源[1-2]。在實際應用中,SAR圖像對目標與雷達視角的方位關系非常敏感,同一目標在不同視角下會有很大差異,傳統方法在目標識別性能方面仍然不夠理想。如何利用SAR圖像鑒別目標仍然是當前研究的熱點和難點。
目前的雷達目標識別方法主要依照兩種思路:基于模版的方法[3]和基于模型的方法[4]。基于模版的方法需要收集目標在各個不同視角下的圖像樣本,構成目標圖像模版庫,直接計算待識別樣本和模版庫中樣本的相關性來識別目標。這種思路由于樣本收集困難和比對過程計算開銷太大,難以適應現代目標識別需求。而基于模型的方法通過實現有效特征提取,減少了樣本收集對識別的影響。提取特征的方法包括主成分分量分析(Principal Component Analysis,PCA)[5]、線性判別分析(Linear Discriminant Analysis,LDA)[6]、高斯過程隱變量模型[7](Gaussian Process Latent Variable Model,GPLVM)等。這些方法能夠克服目標圖像背景變化、相干噪聲的問題,獲得較好的特征表示結果。
稀疏表示作為一種有效的信號表示方法,在多個領域得到應用,如目標跟蹤[8]、人臉識別[9]、表情識別[10]等圖像識別領域,以及信號去噪、圖像重建、雷達成像[11]、雷達目標識別等信號處理領域。在雷達目標識別應用中,稀疏表示方法相比于其他特征提取方法,可以擺脫識別過程中對目標姿態估計的需要,避免目標姿態對特征表示的影響。最簡單的方法是直接使用訓練集中樣本歸一化后構成信息字典,根據最小重建誤差原則構造分類器,進行目標識別[12]。在該方法的基礎上,有學者提出先對SAR圖像進行2DPCA降維,解決稀疏表示識別算法存在的高維問題[13],提高識別精度。除了直接使用訓練樣本構成稀疏表示字典,還有學者提出通過字典學習的方法,從訓練集中學習出稀疏表示字典。這種方法同時降低了字典的冗余性和稀疏表示求解的運算量,達到了更好的識別效果。
傳統的SAR目標識別算法主要研究目標類型的識別,將同一種類型不同型號的目標識別為同一類型的目標。由于同類目標在配置結構有一定差異,比如同種坦克是否加裝有機關槍、是否展開天線,同種步戰車是否加裝炮筒等,即同種目標存在多個變體,這使得目標識別更加困難。如何處理存在型號變體導致的識別誤差一直是研究的重點。型號變體的存在帶來兩種問題,一是變體目標的類型識別,二是變體型號的識別。戰場環境下,變體型號的識別能夠提供更多的戰場感知信息,對戰事預判有重要的意義,因此獲得了越來越多的關注。
為了應對變體型號識別困難的問題,提出了樹形結構的稀疏表示分類器—稀疏表示樹(Tree-structure sparse coding classifier)。根據根節點識別結果將樣本映射到不同的子節點,每個子節點上的字典和分類器是針對該節點樣本設計的,用來對根節點上具有相似結構的同種類型不同型號的樣本重新分類。MSTAR數據集上的驗證結果表明,稀疏表示樹結構與樣本分布情況一致,并獲得了比一般稀疏表示方法更高的型號識別準確率。
2.1 稀疏表示相關背景
稀疏表示是使用一組基上很少的元素線性組合,求得樣本的近似表示。通過計算一個樣本的稀疏表示向量,對輸入數據進行編碼,能夠獲得比統計模型對噪聲和缺失數據更加魯棒的特征表示向量[13]。對單個信號xRp,給定字典DεRp×k,稀疏表示向量αεRk,當滿足如下條件:
(1)
或者
(2)
其中,‖α‖0表示l0范數,計算α中非零元素的個數;ε表示重構允許誤差上限;T表示稀疏系數。
式(1)或式(2)表示尋找字典D中的最小原子集近似線性表示原信號x。由于求解方程(1)或(2)中需要計算非零元素個數,這是一個NP-hard問題,可以通過將l0范數軟化成l1范數,然后使用松弛算法(如基追蹤)或者貪婪算法(如匹配追蹤、正交匹配追蹤)求解[14]。
稀疏表示的關鍵問題是字典基構造,用于稀疏表示的基叫做字典,既可以是基于分析的固定的字典,如常用的傅里葉基、小波基,也可以是源于數據的構造字典,比如直接由樣本組成的字典,或者通過對樣本集進行訓練獲得的更加具有針對性的字典[15]。通過KSVD[16-17]算法求解如下方程獲得從樣本中學習的字典:
(3)
其中,D表示需要學習的字典;α表示樣本X的稀疏表示矩陣。
KSVD是由K-means擴展而來的基于聚類思想的字典學習方法,通過迭代方法逐步更新字典中每個原子,在嚴格的稀疏度約束條件下獲得源數據最佳稀疏表示。每次迭代中首先假設字典D固定,使用MP、OMP方法尋找X在D上的稀疏表示矩陣α,然后根據α通過SVD分解找到更好的字典D。每次迭代在不超過T個原子線性組合的條件下降低‖X-Dα‖的誤差,直到最終收斂。
文獻[12]指出,利用稀疏表示進行目標識別的原理是,同樣一個目標的SAR圖像取決于雷達和目標之間的角度和方位,因而同類別目標的SAR圖像分布在一個維度遠低于圖像維度的流形結構中,未知樣本可以用與其來自同一個流形結構的局部樣本線性表示。因此未知標號的測試樣本在由同類樣本重構時獲得最優表示。尋找未知樣本在不同標號樣本構成的字典上重構誤差最小的標號,作為目標識別結果。給定稀疏表示字典集合:
D=[D1,D2,…,Dn]=[d1,1,d1,2,…,dn,K]
其中,Di表示第i個類型樣本學習出的字典;di,k表示第i個類型中的第k個原子。
求解最小重構誤差完成測試樣本的類別判斷:

(4)
其中,δc(α)=[0,…,0,αi,1,αi,2,…,αi,k,0,…,0]表示,除了字典原子對應類標號為i的原子系數不為零,其他系數為零。
2.2 稀疏表示樹
在一般稀疏表示方法中,未知樣本經過稀疏編碼獲得稀疏表示,作為特征向量輸入分類器,得到分類結果。在稀疏表示過程中,相似類別的樣本往往會有相同或相似的稀疏表示向量,比如同種類型的目標由于其結構相似,會有相似的稀疏表示結果。稀疏表示樹在每個節點上建立稀疏表示字典和分類器,根據分類結果對發生混淆的目標建立新的節點繼續分類,以及輸出不發生混淆的目標識別結果。
稀疏表示樹是從上而下建立的,每個節點的建立分為三個過程:學習稀疏字典;設計分類器;根據分類器輸出結果派生子節點,確定子節點分類目標。詳細過程如下:
(1)字典學習:根據該節點的分類目標,從訓練集中選取對應的樣本學習稀疏表示字典。比如根節點對所有型號進行識別,因此選取訓練集中所有樣本作為字典學習輸入數據;子節點識別某幾種具體型號,選擇訓練集中這部分型號樣本作為訓練數據,學習相應稀疏表示字典。字典學習可通過求解式(3)獲得稀疏表示字典。
(2)分類器設計:利用步驟(1)中學習的字典求解樣本稀疏表示向量,輸入分類器識別。分類方法選用稀疏表示分類器、SVM等常用分類器。
(3)傳遞規則判斷:分析分類器識別結果,將分類結果中混淆在一起的類別作為新的分類要求,派生到子節點,對不發生混淆的類別直接輸出分類結果。
如圖1 所示,左側為根節點識別6×6混淆矩陣示意圖,灰色陰影的深淺程度表示樣本數目多少。圖中上面兩種,中間三種出現兩個明顯的陰隱塊區域,表示這兩個區域的樣本發生混淆,右下角只有一個色塊,表示不與其他類別發生混淆。判斷傳遞規則的時候,分成三個組別,如右側從上到下三個子混淆矩陣,右側上面兩個組由多個型號組成,分別派生子節點,子節點使用這些型號樣本設計新的稀疏字典和稀疏表示分類器。右下角代表的組由于只有一種類別,因此直接輸出識別結果。

圖1 稀疏表示樹傳遞規則展示
稀疏表示樹建立過程如算法1所示。
算法1:稀疏表示樹建立算法:
輸入:SAR目標圖像X
根節點字典學習:

s.t. ?i,‖αi‖0 根節點分類器: G←Cij: Cij為根節點分類結果混淆矩陣 G←{g1,g2…},gi表示屬于該分組的樣本標號集合 子節點字典學習: s.t. ?i,‖αi‖ 輸出:Droot,Dg,G 使用稀疏表示樹進行目標識別時,給定一個測試樣本,首先計算該未知樣本在根節點的稀疏表示字典上的稀疏表示向量,然后經過根節點的分類器識別出該樣本所屬的目標型號。如果識別結果顯示該目標型號所在組中只有一個型號,則直接輸出識別結果,否則將該樣本派生到對應的識別節點上,重新用此節點上稀疏表示字典計算稀疏表示向量,并使用該節點上分類器識別型號并輸出結果。 3.1 MSTAR數據集 現有的SAR目標識別文獻,多使用MSTAR[18]數據集對其方法進行驗證。為了方便與現有方法進行比較,也使用該數據集驗證稀疏表示樹的識別結果。MSTAR數據集是美國國防部高級研究計劃署和空軍研究室提供的移動和靜止目標獲取與識別計劃(Moving and Stationary Target Acquisition and Recognition,MSTAR)錄取的地面軍事車輛聚束式SAR圖像數據集。MSTAR數據集中提供了三種類型的車輛:BMP2步兵戰車,BTR70、T72兩種主戰坦克。其中BMP2步兵戰車下有SN9663、SN966、SNC21三種型號;T72主戰坦克下有SN132、SN812、SNS7三種型號。每個型號都提供17°和15°兩種視角下的0°~360°方位角下若干圖像樣本。每個樣本的像素分辨率為128×128像素,尺寸分辨率為0.3×0.3 m。 數據庫信息統計見表1。 表1 實驗數據集信息匯總 對數據集進行截取預處理,用來減少目標區域周圍的背景雜波以及后續處理的運算量。通過截取,保留所需要識別的整個目標,將原始128×128圖像縮小成64×64的小幅圖像,得到最終識別使用的圖像。 3.2 建立稀疏表示樹 統計稀疏表示樹建立過程中的根節點識別結果,做出的混淆矩陣如圖2所示,其中每一行表示測試集中一個型號的全部樣本識別結果。 圖2 根節點識別結果 從圖中看出,SN9563、SN9566、SNC21三種型號彼此發生混淆,比如SN9563的所有測試樣本有98.5%被識別成這三種型號,只有1.5%的樣本被識別成這三種之外的型號。因此建立傳遞規則時,將SN9563、SN9566、SNC21這三種型號的樣本派生到新建立的子節點,由子節點繼續識別具體型號。同樣對彼此發生混淆的SN132、SN812、S7三種型號目標建立子節點識別,而SNC71直接輸出識別結果。 對比稀疏表示樹結構與數據集,可以發現SN9563、SN9566、C21這三種型號同屬BMP2步兵戰車類型,SN132、SN812、S7同屬T72坦克類型,而SNC71屬于BTR70坦克類型。因為相似的外形和結構,同類目標具有很強的相似性,如果只利用根節點稀疏表示字典,會得出相似的稀疏表示,不能提供更多的型號分類信息,因而需要建立子節點,提供更加特異的稀疏表示字典進行進一步識別。 3.3 稀疏編碼樹驗證 圖3中展示了構造的稀疏表示樹結構,該稀疏表示樹中擁有三個節點,其中一個根節點,兩個子節點。根節點的輸入為全部型號測試樣本,根據根節點識別結果的不同派生到不同的子節點,或者直接輸出識別結果,子節點1作為SN132、SN812、S7三種型號識別節點,子節點2作為SN9563、SN9566、SNC21三種型號識別節點。 圖3 稀疏表示樹 以一個SN9563型號的樣本識別過程為例,說明稀疏表示樹的識別原理。未知樣本在根節點分類結果顯示,由第一個或第三個型號字典分別重建。而比較這兩個重建結果,由第三類別重建的誤差最小,重建結果優于第一個型號字典單獨重建結果,因此輸出類標號為C21,屬于SN9563、SN9566、C21構成的組合,因此派生到子節點2上繼續識別。而在使用子節點2上的稀疏字典計算稀疏表示向量并計算重建誤差輸出型號識別結果。子節點上重建結果顯示,使用子節點中第一種型號樣本訓練字典進行重建的誤差最小,輸出最終類標號SN9563。 圖4是稀疏編碼樹識別結果,對比圖4和圖2的SN812樣本的識別結果。 圖4 子節點識別結果統計 圖4中,樣本識別準確率為74.5%,另外共有24.1%的樣本被錯分成T72其他型號。通過派生子節點繼續識別型號,將準確率提高到87.7%,而錯分到T72其他型號的樣本降低到11.4%。統計其他型號的識別準確率,對比根節點均有不同幅度提高。 為比較不同方法識別目標型號的能力,選取SRC、KSVD-SRC以及TREE-KSVD-SRC,統計識別結果如表2所示。其中,SRC方法設置使用訓練集中所有樣本構成字典,以及每種型號選取與其他方法字典原子相同個數的樣本構成稀疏表示字典。結果顯示,全部樣本構成稀疏字典的識別方法結果最好,但是識別全部測試樣本所需的時間是其他幾種方法的六倍以上,不能滿足實際使用中在對雷達目標識別的時效性要求,因而實際使用價值不大。 表2 目標識別不同方法對比 對比使用部分訓練集構成字典的SRC方法與KSVD-SRC方法,使用經過學習的字典比直接使用樣本構成字典,稀疏表示效果更有效。結合使用全部訓練樣本構成字典的SRC方法,當數據樣本足夠多時,直接使用訓練樣本構成的稀疏表示字典和使用字典學習方法學習的字典,兩種方法稀疏表示性能差別不大;而當樣本數量不足時,學習得到的字典能夠比直接構成的字典提供更多的分類信息,這驗證了字典學習的有效性。對比稀疏表示樹方法與其他方法可以發現,經過子節點校正后,所有型號識別準確率比KSVD-SRC方法和部分樣本構成稀疏字典的SRC方法高,接近使用全部樣本的SRC方法的準確率,識別全部樣本所需時間比SRC、KSVD-SRC方法花費時間多一半,但遠低于使用全部樣本的SRC方法消耗時間。因此稀疏表示樹在增加部分時間開銷的情況下,有效提高了型號識別準確率。 為了改進目標型號識別算法,在稀疏表示的基礎上提出一種基于樹形稀疏表示結構的SAR目標識別算法。通過構造多個分類節點,組成樹形結構分類器,利用子節點對父節點上由于稀疏表示結果相似造成的型號識別錯誤校正,提高型號識別準確率。在每個節點上,利用字典學習方法學習稀疏表示字典,稀疏表示分類器作為目標型號識別分類器,進行目標識別。實驗結果表明,所建立的稀疏表示樹與實驗所用數據集數據分布相吻合,將同種目標類型不同型號的樣本派生到子節點繼續識別,在增加部分識別時間的代價下,有效提高了目標型號識別準確率。 在該方法中,稀疏表示樹的構造依賴先驗信息,需要先確定分類的組別個數;而且稀疏表示樹有兩層,只包含一層子節點結構,對于子節點上具有相似稀疏表示結果的相似樣本未做處理,限制了稀疏表示樹的識別準確率。下一步將會探索利用分類結果學習派生規則,構造更加復雜的樹形結構,提高識別準確率。相比于簡單的稀疏表示方法,該方法需要對相似樣本重新計算稀疏表示向量,識別時間是其1.5倍,還需要探索如何縮短識別時間,提高目標識別時效性。另外,該方法對目標型號的識別準確率為84%,還達不到完全準確識別目標型號的目的,后續工作還需對稀疏表示和字典學習方法進行深入研究,并改進稀疏表示字典和分類器學習方法,提高目標識別效率。 [1] Bhanu B,Dudgeon D E,Zelnio E G,et al.Guest editorial introduction to the special issue on automatic target detection and recognition[J].IEEE Transactions on Image Processing,1997,11(1):1-6. [2] Zhao Q,Principe J C.Support vector machines for SAR automatic target recognition[J].IEEE Transactions on Aerospace Electronic Systems,2001,37(2):643-654. [3] Novak L M,Owirka G J,Brower W S.Performance of 10-and 20-target MSE classifiers[J].IEEE Transactions on Aerospace & Electronic Systems,2000,36(4):1279-1289. [4] Huang Y,Peia J,Yanga J,et al.Neighborhood geometric center scaling embedding for SAR ATR[J].IEEE Transactions on Aerospace & Electronic Systems,2014,50(1):180-192. [5] Mishra A K,Mulgrew B.Radar signal classification using PCA-based features[C]//IEEE international conference on acoustics,speech and signal processing.[s.l.]:IEEE,2006. [6] Huan R,Liang R,Pan Y.SAR target recognition with the fusion of LDA and ICA[C]//International conference on information engineering and computer science.[s.l.]:[s.n.],2009:1-5. [7] Zhang X R,Gou L M,Li Yangyang,et al.Gaussian process latent variable model based on immune clonal selection for SAR target feature extraction and recognition[J].Journal of Infrared & Millimeter Waves,2013,32(3):484-493. [8] 賁 敏,鄧 萍,王保云.基于l1/2正則化的稀疏表示目標跟蹤算法的研究[J].計算機技術與發展,2015,25(1):82-86. [9] 謝文浩,翟素蘭.基于加權稀疏近鄰表示的人臉識別[J].計算機技術與發展,2016,26(2):22-25. [10] Chen K,Comiter M,Kung H,et al.Sparse coding trees with application to emotion classification[C]//Proceedings of the IEEE conference on computer vision and pattern recognition workshops.[s.l.]:IEEE,2015:77-86. [11] Wu Q,Zhang Y D,Ahmad F,et al.Compressive-sensing-based high-resolution Polari metric through-the-wall radar imaging exploiting target characteristics[J].IEEE Antennas & Wireless Propagation Letters,2014,14:1043-1047. [12] Thiagarajan J J,Ramamurthy K N,Knee P,et al.Sparse representations for automatic target classification in SAR images[C]//4th international symposium on communications,control and signal processing.[s.l.]:IEEE,2010:1-4. [13] 王燕霞,張 弓.基于特征參數稀疏表示的SAR圖像目標識別[J].重慶郵電大學學報:自然科學版,2012,24(3):308-313. [14] Mairal J,Bach F,Ponce J,et al.Online dictionary learning for sparse coding[C]//International conference on machine learning.[s.l.]:ACM,2009:689-696. [15] Tosic I,Frossard P.Dictionary learning[J].IEEE Signal Processing Magazine,2011,28(2):27-38. [16] Aharon M,Elad M,Bruckstein A.K-SVD:an algorithm for designing overcomplete dictionaries for sparse representation[J].IEEE Transactions on Signal Processing,2006,54(11):4311-4322. [17] 周飛飛,李 雷.廣義貝葉斯字典學習K-SVD稀疏表示算法[J].計算機技術與發展,2016,26(5):71-75. [18] Yang Y,Qiu Y,Lu C.Automatic target classification-experiments on the MSTAR SAR images[C]//International conference on software engineering,artificial intelligence,networking and parallel/distributed computing.[s.l.]:[s.n.],2005:2-7. Investigation on Identification Algorithm of Tree-structure Sparse Representation for SAR Target CHEN Chun-lin,ZHANG Li,LIU Xue-jun (College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 211106,China) In order to improve the ability of identifying SAR target series with sparse representation,a tree-structure sparse coding recognition algorithm is proposed,which is employed to lift the recognition accuracy of target models.The sparse representation tree is a tree-like classifier composed of multiple nodes,each of which has a sparse representation dictionary and a classifier for the node.The sparse representation algorithm is used to solve the eigenvector of unknown sample on a single node,realizing the target type identification according to the minimum principle of reconstruction error.The root node is employed to direct input SAR images with similar sparse results to children nodes,which have more specialized dictionaries and classifiers to identify these target series.Experiments on MSTAR target dataset show that it is suitable for the sample distribution and has improved target recognition rate up to 84%,and that compared with the traditional sparse coding method,it has got effective improvement on the target series recognition accuracy without more time expenditure. SAR automatic target recognition;series recognition;tree-structure information dictionary;sparse representation;dictionary learning 2016-09-10 2016-12-13 網絡出版時間:2017-07-05 中國航空科學基金(20151452021,20152752033) 陳春林(1992-),男,碩士研究生,研究方向為機器學習、雷達目標識別;張 禮,博士,講師,研究方向為機器學習、模式識別;劉學軍,教授,通訊作者,研究方向為機器學習。 http://kns.cnki.net/kcms/detail/61.1450.TP.20170705.1651.060.html TP391 A 1673-629X(2017)08-0020-05 10.3969/j.issn.1673-629X.2017.08.005

3 實 驗





4 結束語