, ,
(1.江西理工大學信息工程學院,江西贛州 341000;2.贛南師范大學物理與電子信息學院,江西贛州 341000)
合成孔徑雷達(Synthetic Aperture Radar,SAR)具有全天時、全天候工作能力,在軍事和民用領域具有非常重要的意義。SAR自動目標識別(Automatic Target Recognition, ATR)[1]技術一直是SAR領域的研究熱點。早期的SAR-ATR主要有3類方法:模板匹配法[2]、基于模型的方法[3]和機器學習方法。模板匹配法通過將提取的目標特征與樣本庫進行匹配以識別目標,識別方法簡單,但需要采集大量的實測樣本,難以實現。基于模型的方法無須采集大量的實測樣本,但需要建立目標的三維模型和電磁散射模型,并根據模型參數對目標進行預測,該方法計算量大,難以滿足實時性要求。機器學習方法需先獲取目標的特征[4-5],后用分類器對特征進行分類,常用的分類方法有SVM[6],AdaBoost[7]等。該類方法比前兩類方法效果好,但對不同的目標需設計不同的特征提取方法。
近年來,卷積神經網絡(Convolutional Neural Network,CNN)在SAR-ATR方面取得了較大的進展。Morgan等率先將CNN應用于SAR-ATR中,并用MSTAR數據驗證了該方法的性能。Michael等針對CNN的訓練方法進行了研究,實驗表明較好的初始值和修正的隨機梯度下降法有助于獲得更高的識別率。Housseini等提出了一種結合CNN和卷積自編碼的識別方法,該方法能夠在保持CNN原有識別率的情況下,有效減少運算時間[8]。Wagner利用CNN提取數據特征,然后將這些特征送入SVM分類器中進行分類[9]。Zhao等受遞歸神經網絡的啟發,提出了Highway Unit Network,在沒有數據人工擴充的情況下對CNN進行訓練[10]。Chen等用卷積層替換CNN中的全連接層,降低了過擬合風險[11]。
CNN的應用發展又反過來進一步推動其結構的發展。一個標準的CNN結構中,前面若干層由交替的卷積層、池化層堆疊而成,后面若干層為全連接層。CNN的結構在計算機視覺領域得到改進,Springenberg等將CNN結構中的池化層和全連接層都用卷積層代替,提出了全卷積神經網絡(All Convolutional Neural Network, A-CNN),并分析了池化層可用卷積層代替的原因,實驗結果驗證了A-CNN的可行性[12]。文獻[11]已證明CNN結構中,卷積層取代全連接層能夠獲得比原CNN更好的分類效果。本文將A-CNN應用到SAR-ATR中,針對公布的MSTAR數據集,提出了基于A-CNN的SAR圖像目標分類方法,并與基于CNN的SAR圖像分類方法進行對比。
一個標準的CNN結構如圖1所示,前面若干層由交替的卷積層、池化層堆疊而成,后面若干層為全連接層。將輸入層經過堆疊的卷積層和池化層后,能獲取目標的特征,再將這些特征通過全連接層映射到類別空間,則可實現目標的識別和分類。
1) 卷積層

(1)

2) 池化層
考慮第l層卷積層之后的池化層,池化尺寸為G×G,步長為s,則池化輸出后的特征圖的每個像素單元為
(2)
式中,p表示p范數。特別地,當p→∞時,則式(2)為常用的最大池化。
3) 全連接層

(3)
式中,f(·)表示激活函數。
A-CNN結構,即是在CNN結構基礎上,用卷積層取代池化層和全連接層。
1) 卷積層取代池化層
文獻[13]考慮了卷積層取代池化層的兩種方案,本文考慮其中的一種,即用與池化層具有相同尺寸、步長的卷積層取代它。在第1.1節中,式(1)卷積運算主要是乘法和加法運算,式(2)主要是加法運算。對比式(1)和式(2)可知,式(2)可由式(1)變換得到。
進一步地,分別考慮卷積和池化運算前后數據尺寸的變化。對卷積運算而言,假定輸入到卷積層的數據尺寸為W×H×I,其中,W為數據的寬,H為數據的高,I為特征圖的通道數。卷積核大小為k×k,卷積步長為S,卷積核的數量為I,卷積過程中補0的數量為P。經過卷積后,其輸出數據尺寸為W′×H′×I′,則
W′=(W-k+2P)/S+1
(4)
H′=(H-k+2P)/S+1
(5)
I′=I
(6)
對池化運算而言,若輸入到卷積層的數據尺寸也為W×H×I,其中,W為數據的寬,H為數據的高,I為特征圖的通道數。池化尺寸為k×k,池化步長為S,池化過程中補0的數量為P。經過池化后,其輸出數據尺寸的計算公式和式(4)~式(6)相同。
2) 卷積層取代全連接層
由式(1)和式(3)可知,卷積層和全連接層都是主要完成乘加運算。即使兩者輸入和輸出的數據維度不相同,它們之間也可以相互轉化。文獻[14]已證明了卷積層替換全連接層,不僅減少了參數運算量,而且降低了過擬合的風險。
本文針對公布的MSTAR數據集,提出了基于A-CNN的SAR圖像目標分類方法,其處理流程如圖2(b)所示。為了便于比較A-CNN和CNN的性能,給出相應的基于CNN的SAR圖像目標分類方法處理流程如圖2(a)所示。
在圖2(a)中,共有4個卷積層和最大池化層、3個全連接層。其中,在4個卷積層中,前兩個是補0卷積,以使得卷積后輸出特征圖的大小與輸入相同;后兩個是不補0的有效卷積,其輸出特征圖的空間大小與卷積核大小有關。卷積前、后數據尺寸的關系如式(4)和式(5)。首先,輸入大小為87×87的SAR圖像。第一次經過大小為3×3的補0卷積后,得到16個大小為87×87的特征圖,再經過大小為3×3、步長為2的池化層后,得到16個大小為43×43的特征圖。第二次經過大小為3×3的補0卷積后,得到32個大小為43×43的特征圖,再經過大小為3×3、步長為2的池化層后,得到32個大小為21×21的特征圖。第三次經過大小為3×3的不補0卷積核后,得到64個大小為19×19的特征圖,再經過大小為3×3、步長為2的池化層后,得到64個大小為9×9的特征圖。第四次經過大小為3×3的不補0卷積核后,得到128個大小為7×7的特征圖,再經過大小為3×3、步長為2的池化層后,得到128個大小為3×3的特征圖。最后,將這些特征圖進行展開后,輸入到全連接層。經過第一個全連接層得到1×1×512的張量,經過第二個全連接層仍得到1×1×512的張量,再經過第三個全連接層得到1×1×10的張量,張量中每一個元素分別代表該圖像所屬類別的概率。
與圖2(a)相比,一方面,圖2(b)中用卷積層取代了圖2(a)中所有的池化層。卷積核的大小為3×3、步長為2。顯然,卷積層每次取代池化層后,輸出特征圖的大小、輸出特征圖的通道數都和取代前池化層的輸出保持一致。另一方面,圖2(b)中用卷積層取代了圖2(a)中的3個全連接層。卷積核的大小為3×3、步長為1。經計算,該卷積層輸出仍為1×1×10的張量,張量中每一個元素分別代表該圖像所屬類別的概率。
本文采用美國空軍實驗室公布的MSTAR數據集進行實驗。該數據集由10類地面車輛的SAR圖像組成,如裝甲車、坦克、火箭發射車等。有關10類車輛的型號、類型、圖像數量及采集參數等如表1所示。

表1 MSTAR數據集
由于A-CNN訓練過程中,需要大量有標簽數據來調節擬合網絡參數,而MSTAR數據集有限,因此,本文采用人工方法來擴充數據集。
首先,為了盡可能使得擴展后的數據集包含目標的主要信息,將大小為128×128的原始SAR圖像隨機采樣[11,14]成大小為87×87大小的切片,以保證每個切片包含目標的完整信息。經過隨機采樣成切片后,每類目標的訓練樣本數量擴充為原來的(128-87+1)×(128-87+1)=1 764倍。
然后,對每類目標選擇3 200幅大小為87×87的樣本圖像,其中2 700幅用于訓練,500幅用于驗證。為了使所選的圖像包含每個方位角的信息,對每幅SAR圖像,在其擴充后的1 764幅圖像中隨機選取floor(3 200/n)+1幅作為該圖像的擴充數據,其中n為該類數據集原有圖像數量。以裝甲車BMP-2為例,原有圖像共233幅,經數據擴充后,每幅圖像可擴充為1 764幅,從這1 764幅中隨機選擇floor(3 200/233)+1幅作為該圖像的擴充數據。
此外,在A-CNN訓練時,為了使網絡能夠快速收斂,對SAR圖像數據作了減均值預處理。
在對數據集進行擴充和預處理后,采用圖2中基于A-CNN和基于CNN的SAR圖像目標分類方法分別進行處理。實驗中,使用俯仰角為17°的數據集作為訓練集,俯仰角為15°的數據集作為測試集,如表1所示。訓練過程中,采用隨機梯度下降算法優化最小損失函數,動量設為0.95,權重衰減系數為0.005,初始學習速率為0.001。當驗證集的精度和損失不再發生變化時,將學習速率降為初始速率的1/10[13]。依照此規則,直到學習速率降為10-7時停止訓練?;贏-CNN的分類方法得到的混淆矩陣如表2所示,基于A-CNN和CNN的分類方法實驗結果對比如表3所示。

表2 基于A-CNN的分類方法得到的混淆矩陣

表3 基于CNN和A-CNN的分類方法實驗結果對比
表2結果表明,基于A-CNN的分類方法使得每類目標被正確分類的概率都較高,分類的平均正確率達到99.41%。表3結果表明,對于各種型號的目標,基于A-CNN的分類正確率比基于CNN的更高;基于A-CNN的平均分類正確率比基于CNN的高出4.82%。實驗結果驗證了卷積層取代池化層和全連接層的優勢。
為了更好地解釋其中使用卷積層替換池化層的優勢,對A-CNN的前4個卷積核權重和卷積后特征圖進行了可視化分析,結果分別如圖3(a)和圖3(b)所示。由于空間有限,圖3(a)給出了部分的卷積核權重可視化結果。圖3(b)中前2個卷積后特征圖的可視化結果放大后分別如圖4(a)和圖4(c)所示。若將A-CNN第1個卷積層獲取的特征圖進行池化處理,其可視化結果如圖4(b)所示。
圖4(a)中,可以發現2個特征圖為無用特征(紅色方框內)。由于圖4(b)是圖4(a)降采樣得到的結果,因此,與圖4(a)相對應的2個特征圖仍為無用特征(紅色方框內)。而圖4(c)是用卷積取代池化的結果,與圖4(a)相對應的2個特征圖變為有用特征(紅色方框內)。因此,用卷積層取代池化層,不僅能實現池化層的降維,而且能激活前一個卷積層獲取的無用特征(紅色方框內)。此外,由于卷積層后使用了ReLU激活函數,因此,它比使用池化層具有更強的非線性能力。
進一步地,將基于CNN和A-CNN分類方法得到的前四層特征圖進行可視化,結果分別如圖5(a)和圖5(b)所示。圖5(a)中第1層卷積獲取的3個無用特征圖(紅色方框內),經過第2層池化后仍為無用特征圖。而圖5(b)中第1層卷積獲取的2個無用特征圖(紅色方框內),經過第2層卷積層后變為有用特征(紅色方框內)。類似地,圖5(a)中第3層卷積獲取的2個無用特征圖(紅色方框內),經過第4層池化后仍為無用特征圖。而圖5(b)中第3層卷積獲取的5個無用特征圖(紅色方框內),經過第4層卷積層后變為有用特征(紅色方框內)。
本文分別介紹了CNN結構中卷積層、池化層、全鏈接層的輸出和輸入之間的關系,并分析了A-CNN結構中用卷積層取代CNN結構中池化層和全連接層的可行性。針對MSTAR數據集,提出了基于A-CNN的SAR圖像目標分類方法。實驗結果表明,基于A-CNN的分類方法比基于CNN的方法能獲得更高的分類正確率。此外,卷積后特征圖的可視化結果表明,卷積層取代池化層能夠將前一卷積層獲取的無用特征激活。