, , , , 健偉
(1.海軍航空大學電子信息工程系, 山東煙臺 264001;2.海軍航空大學科研部, 山東煙臺 264001)
合成孔徑雷達(SAR)最早由美國科學家Carl Wiley于1951年提出,相比于傳統光學、高光譜和紅外傳感器,具有不受天氣、光照等外界條件的限制,可以大范圍、全天候、實時對目標進行檢測,并且有一定的穿透能力[1]。隨著SAR技術的日益成熟,在民用和軍事領域都得了較為廣泛的應用,具有較高的研究價值。但是由于合成孔徑雷達類型眾多,圖像分辨率差異較大,同一區域在不同雷達中的成像效果不同,對SAR圖像目標分類的準確率產生較大的影響。
卷積神經網絡(CNN)可以有效地從大量樣本中學習到相應的特征,提取出優于人工設計的特征,并且樣本數量越大,提取的特征越有利于分類識別[2]。CNN雖然具有空間位置不變性,對于圖像中任意位置的目標都可以提取出相應的特征,但是對于輸入圖像的空間變化適應性較差,要求訓練圖像與測試圖像在空間尺度上一致,造成網絡對與訓練集尺度相似的測試數據有較高的激活值,進而導致網絡對多尺度輸入圖像的分類準確率下降[3]。
本文主要研究了分塊CNN在多尺度SAR圖像上的應用,改善了傳統CNN模型的尺度不變性,提升了多尺度SAR圖像目標分類識別的準確率。同時,為降低網絡訓練過程中對訓練樣本數量的需求,通過大量與目標域相似的源域圖像對分塊CNN進行訓練,得到較優的網絡參數;然后將網絡參數遷移到新的分類網絡結構中,用于特征的提取;最后將提取的特征用超限學習機(ELM)網絡結構進行分類,ELM的結構參數通過少量帶標簽的目標域數據訓練得到。實驗結果表明,本文方法可以有效提升網絡對多尺度SAR圖像目標的分類識別效果。
典型的卷積神經網絡由輸入層、卷積層、下采樣層(池化層)、全連接層和輸出層五部分組成,如圖1所示。
卷積層主要用于提取特征和降低噪聲。假設第l層為卷積層,則第l層第j個特征圖的計算公式如下所示:
(1)
下采樣層主要利用圖像局部之間相關性的原理,降低需要處理的數據量。將鄰域4個像素變為一個像素,常用的方法有均勻下采樣、最大下采樣和概率最大下采樣,最終產生一個大概縮小4倍的特征映射圖。
從CNN的結構可以看出,整個網絡的結構和參數只能單一設定,對于不同尺度的輸入圖像,不能有效地提取出全局和局部特征,進而限制了網絡參數對不同尺度輸入圖像特征提取的靈活性。本文對同一幅圖像構造3個不同尺寸的CNN,不同網絡采用不同的卷積核與池化大小,最終輸出維數相近的特征圖。分塊CNN的網絡結構如圖2所示。
圖2中,對每幅輸入圖像進行尺度變換,得到3種不同尺度的輸入圖像,然后分別對3種CNN進行訓練,使最終的網絡輸出維數相近。網絡中不同CNN的設計如圖3所示。
圖3中,方框下面的數字表示該層圖像的大小,箭頭上的數字分別表示卷積核和池化大小,最終將3個網絡提取出的特征圖排列成一個一維向量,用ELM網絡完成分類識別。
近年來,遷移學習(Transfer Learning)成為了卷積神經網絡的發展趨勢之一,它降低了CNN學習過程中對樣本數量的要求,解決了訓練樣本和測試樣本必須獨立同分布,以及訓練樣本數目需求過大的問題。遷移學習可以通過已有的知識來解決小樣本數據的學習問題,從而提升了卷積神經網絡在小樣本數據集上分類識別的準確率[4-5]。

對于給定的源域Ds及其對應的源任務Ts、目標域Dt及其對應的目標任務Tt,遷移學習即是通過從給定的Ds,Ts中學到相應的知識,從而得到Dt的目標預測函數f(·)。遷移學習與傳統方法的對比如圖4所示。
從圖4中可以看出,傳統學習方法對于每個不同的訓練任務需要訓練出不同的學習系統,而通過遷移學習,可以從不同的任務中學習到相應的知識,進而用于新目標任務的預測。但是,并不是所有的知識都可以用來進行遷移學習,遷移學習過程需要源和目標具有相關性。
超限學習機因其訓練參數少、訓練速度快得到了廣泛關注。相比于傳統人工神經網絡的復雜調參過程,ELM在網絡訓練過程中,隱藏層節點參數隨機確定,無需調節,僅需求解隱藏層與輸出層之間權值的最小二乘范數解。因為網絡參數的訓練過程中不需要進行迭代過程,從而大大降低了訓練過程中對樣本數量的需求并提升了網絡的訓練速度。目前超限學習機在特征學習、聚類、回歸和分類等方面得到了廣泛的應用[7-8]。ELM的結構如圖5所示。
xj表示第j個輸入樣本,n個節點表示輸入的樣本維度,隱含層的節點數為L,L越大,表達能力越強,ai表示輸入樣本與節點i的連接權值,βi表示隱藏層與輸出之間的權值連接,oj表示第j個輸入樣本的輸出。
輸出權值的最小二乘范數解β的求解過程如下:
假設樣本集的輸入為X={x1,x2,…,xn},ai表示輸入與隱藏層連接的權值,則網絡隱藏層的輸出公式為
zi=f(aixj+bi)
(2)
式中,zi表示第i個隱藏節點的輸出,xj表示第j個輸入樣本,bi表示第i個隱藏節點的偏置,f(·)表示激活函數。
網絡的最終輸出結果為
(3)
式中,oj為第j個輸入樣本的輸出結果,βi為第i個隱藏節點與輸出之間的權重,f(aixj+bi)為第i個隱藏節點的輸出。
假設輸入的樣本為(xj,tj),其中xj表示n維向量,tj表示樣本所對應的標簽。令前饋網絡輸出與標簽相等,即oj=tj,得到
(4)
Hβ=T
(5)
通過式(5)可求得β=H-1T[9]。
本文通過遷移學習的方法降低網絡結構對帶標簽樣本數量的需求,并且與ELM結合形成最終的混合分類網絡,網絡結構如圖6所示。
算法步驟如下:
1)將輸入圖像通過尺度變換為128×128,64×64,32×32三種不同尺度的圖像,并用變換后的圖像分別對3種CNN進行訓練,得到相應的網絡 參數;
2)通過遷移學習將CNN與ELM結構結合,進而得到適用于帶標簽樣本數量不足數據的分類識別,并用帶標簽訓練集樣本對ELM參數進行訓練,得到最終的混合模型分類網絡;
3)輸入測試集數據,用最終訓練好的混合分類模型網絡對測試數據進行分類識別,得出相應分類結果。
為對本文提出的方法進行驗證,數據集采用美國MSTAR數據庫與SAR艦船目標數據集進行實驗。MSTAR數據庫中圖像的分辨率為 0.3 m×0.3 m,大小為128像素×128像素,訓練樣本為17°俯視角的SAR圖像目標,共2 320幅,測試樣本為15°俯視角的SAR圖像目標,共 2 100幅。為加快網絡的訓練速度,截取圖像中心包含目標的42×42大小的圖像塊進行實驗,如圖7所示。
SAR艦船目標數據集對艦船和雜波進行了分類,一共有999幅圖片,圖片來自多幅不同分辨率的SAR圖像,經過目標檢測后獲得船只的圖像切片,通過專家解譯對所有船只進行人工標注,數據集分布如表1所示。

表1 SAR艦船數據分布
首先用T72,ZIL131,ZSU234三類目標數據集(訓練樣本870個,測試樣本810個)對分塊CNN的網絡參數進行訓練,然后通過遷移學習得到最終分類識別網絡。最后對BRDM2,BTR60,D7,2S1和T62五類目標(訓練樣本1 450個,測試樣本1 290個)對混合分類網絡進行訓練,并對測試樣本進行分類識別,結果如表2所示。

表2 五類目標的SAR圖像分類結果
將本文方法與其他方法進行對比,結果如表3所示。

表3 與其他方法效果對比
從上述結果可以看出,本文方法相比于其他方法有效地提升了目標分類識別的準確率。為驗證本文方法對小樣本數據集的有效性,將MSTAR目標訓練集每次以遞增100個樣本的方式進行測試實驗,測試樣本數量保持不變,實驗結果如圖8所示。
從實驗結果可以看出,當訓練樣本數量達到300時,測試結果就已經超過了改進卷積神經網絡,實驗證明該方法有助于提升小樣本數據的分類識別準確率。
實驗仍保持分塊CNN的網絡參數不變,用SAR艦船目標數據集對混合網絡進行訓練,并對測試集進行分類識別,得到每幅圖像是艦船的可能性,對大于等于0.5的判定為艦船,否則為非艦船目標,部分識別效果如圖9所示,最終識別結果如表4所示。

測試目標識別結果艦船雜波正確識別率/%艦船1901096.00雜波312797.69整體識別率/%96.06
將本文方法與其他方法進行對比,在訓練過程中,訓練集每次遞增100個樣本的方式進行實驗,測試樣本數量保持不變,實驗結果如圖10所示,最終對比結果如表5所示。

方法識別率/%CNN方法85.76改進CNN方法93.33本文方法96.06
從上述結果可以看出,本文方法提升了多尺度目標的分類識別準確率,為之后多尺度SAR圖像進行目標檢測識別提供了可靠保障。
針對SAR圖像分辨率差異大,多尺度SAR圖像目標的分類效果不佳的問題,提出了一種遷移學習與分塊CNN相結合的混合分類網絡,通過分塊CNN有利于提升多尺度SAR圖像的分類準確率;同時由于分塊CNN網絡參數多,對訓練樣本需求量大,采用遷移學習方法降低網絡對帶標簽訓練樣本數量的需求。實驗結果表明,兩種方法結合后對帶標簽樣本數量不足的多尺度SAR圖像的分類效果得到了很大的提升。
參考文獻:
[1] CURLANDER J C, MCDONOUGH R N. Synthetic Aperture Radar: Systems and Signal Processing[J]. New York: Wiley, 1991.
[2] 李彥冬, 郝宗波, 雷航. 卷積神經網絡研究綜述[J]. 計算機應用, 2016, 36(9):2508-2515, 2565.
[3] 連自鋒, 景曉軍, 孫松林, 等. 一種多尺度嵌套卷積神經網絡模型[J]. 北京郵電大學學報, 2016, 39(5):1-5.
[4] 莊福振, 羅平, 何清, 等. 遷移學習研究進展[J]. 軟件學報, 2015, 26(1):26-39.
[5] 許敏, 王士同, 顧鑫. TL-SVM: 一種遷移學習算法[J]. 控制與決策, 2014, 29(1):141-146.
[6] PAN S J, YANG Q. A Survey on Transfer Learning[M]. IEEE Trans on Knowledge and Data Engineering, 2010, 22 (10):1345-1359.
[7] HUANG G B, ZHU Q Y, SIEW C K. Extreme Learning Machine: A New Learning Scheme of Feedforward Neural Networks[C]// IEEE International Joint Conference on Neural Networks, Budapest, Hungary: IEEE, 2005:985-990.
[8] 王靜. 基于ICA和ELM的圖像識別算法研究[D]. 青島: 中國海洋大學, 2015.
[9] HUANG G B, ZHU Q Y, SIEW C K. Extreme Learning Machine: Theory and Applications[J]. Neurocomputing, 2006, 70(1-3):489-501.