馬 琳 潘宗序* 黃鐘泠 韓 冰 胡玉新 周 曉 雷 斌
①(中國科學院空天信息創新研究院 北京 100190)
②(中國科學院空間信息處理與應用系統技術重點實驗室 北京 100190)
③(中國科學院大學 北京 100049)
合成孔徑雷達(Synthetic Aperture Radar,SAR)是一種主動的微波傳感器,具備全天時全天候的探測能力和高分辨率成像能力,是實現海洋監測的重要手段之一,在軍事和民用領域具有重要的意義[1]。特別是星載SAR系統,同時滿足了高分辨率和寬測繪帶的需求,能夠以較長工作時間運行,在船舶識別檢測中被廣泛應用。
高分三號(GF-3)衛星是我國發射的第1顆C波段高分辨率衛星,是目前世界上成像模式最多的SAR衛星,具有12種成像模式。GF-3超精細條帶(UltraFine Strip-map,UFS)模式與常規的條帶模式不同,采用一發雙收,即在方位向上有兩個接收天線分別接收雷達回波,在該模式下的圖像中存在多通道引起的虛假目標。與傳統單通道SAR系統方位向欠采樣引起的方位模糊不同,該類虛假目標產生的原因主要有兩個方面[2—4]:(1)方位向信號的非均勻采樣。衛星姿態誤差導致各子孔徑相位中心相對位置發生變化,由此產生的多通道方位向非均勻采樣信號不加處理直接進行脈沖壓縮將會導致成對虛假目標的出現[2]。(2)通道間幅相不平衡[3,4]。在實際星載系統中,受工作環境輻射、通道間元器件性能不一致、通道開機時間存在誤差等影響,通道間存在幅相不平衡,導致虛假目標的出現。
圖1給出了GF-UFS圖像中多通道虛假目標的示意圖,如圖1所示多通道引起的虛假目標在方位向上成對出現,并沿真實目標對稱分布,且與對應真實目標相比在強度上有一定的衰減。2017年Pan等人[5]根據雷達系統參數計算真實目標與多通道虛假目標之間的相對位置[6]來去除虛假目標,但這種方法不能鑒別真實目標和其他目標附近的虛假目標位置的情況。
SAR多通道虛假目標的存在給SAR船舶檢測帶來了巨大的挑戰。這些虛假目標相對于海面的亮度很高,在海面這樣的低散射區域出現時會被誤檢,造成虛警。雖然多通道虛假目標與對應真實目標相比在亮度上存在一定的衰減,但與其他非對應的真實目標之間沒有明確的亮暗關系,因此無法根據絕對的亮度去鑒別。更為嚴峻的是,在SAR成像過程中,船舶的運動造成了多普勒參數的改變,進而造成方位向上匹配濾波的失配,因此船舶目標在SAR圖像中會產生不同程度的散焦現象[7,8]。在全孔徑圖像中很難將多通道引起的虛假目標與真實的散焦目標進行區分,這一問題目前尚未得到解決。
針對上述問題,本文提出一種基于子孔徑與全孔徑特征學習的SAR船舶目標鑒別算法,在利用深度卷積神經網絡提取全孔徑特征的同時,將復數SAR圖像進行子孔徑分解并利用棧式卷積自編碼網絡提取子孔徑特征,通過子孔徑特征所蘊含的鑒別信息實現真實目標和多通道虛假目標的區分,本文的創新點主要體現在:
(1) 通過子孔徑分解分析真實目標和多通道虛假目標在子孔徑圖像之間的差異;
(2) 提出一種利用棧式卷積自編碼網絡學習子孔徑特征的方法;
(3) 利用GF-3數據驗證所提方法在區分多通道虛假目標和真實目標,特別是散焦船舶目標上的有效性。
本文余下章節安排如下,第2節介紹相關工作;第3節詳細介紹本文提出的SAR目標鑒別方法;第4節結合GF-3超精細條帶實驗數據和部分仿真的散焦數據對本文方法的實驗結果進行分析;第5節給出結論。

圖1 GF-3 UFS圖像中的多通道虛假目標示意圖Fig.1 An example of multichannel false-target in a GF-3 UFS SAR image
深度學習方法相較于傳統方法具有自動提取特征的優勢,已有不少學者將深度神經網絡如Faster R-CNN[9],SSD[10]等應用于SAR船舶檢測和識別中[11—13],取得了很好的效果。針對訓練樣本不足的問題,文獻[14]通過改進網絡模型在小樣本條件下仍能得到良好的識別效果。然而,上述方法只考慮了目標和背景的幅度差異,SAR圖像本身是一種帶有相位信息的復數數據,它蘊含了豐富的目標電磁散射信息。文獻[15,16]通過復數SAR統計建模的方法進行SAR艦船檢測和鑒別。同時,Zhang等人[17]提出的復數卷積網絡模型、Huang等人[18]提出的Deep SAR-Net以及Tang等人[19]在改進的孿生網絡模型中都使用了復數SAR數據,都是從SAR本身的散射特性出發,深入研究學習SAR成像的物理機制。
以上方法僅考慮了全孔徑圖像中的特征,并未考慮子孔徑圖像中的特征。全孔徑SAR圖像提供了高分辨率的細節表征,但在合成孔徑過程中卻損失了目標其他有用的信息。文獻[20]表明子孔徑圖像分析方法相對于傳統技術的主要優勢在于,即使在船舶的強度與雜波水平相似的情況下仍能夠檢測到船舶。目前,利用子孔徑圖像實現SAR船舶檢測的方法主要包括子視圖相干法(Sub-Look Cross-correlation,SLC)、廣義似然比檢驗(Generalized Likelihood Ratio Test,GLRT)等[21—24],這些方法通過增強目標與雜波之間的對比度來檢測船舶,但在復雜場景下這些方法不能將多通道虛假目標與真實目標很好地進行鑒別。
因此,為了解決上述問題,本文結合深度學習方法,提出一種基于子孔徑與全孔徑特征學習的SAR船舶目標鑒別算法(Sub-and Full-aperture Feature Learning,SFFL),實現SAR船舶目標與多通道虛假目標的鑒別。
目前針對SAR船舶目標鑒別的研究大多基于全孔徑幅度圖像,并未充分利用復數SAR圖像中的信息,使得方法難以區分具有相似視覺特征的真實船舶目標和多通道虛假目標。在SAR成像過程中,目標會隨著方位角的變化在不同子孔徑圖像中呈現不同的散射特性,在子孔徑圖像中,目標特征將得到更加精細的表征?;谧涌讖綀D像的上述優勢,本文提出一種基于深度學習的子孔徑特征學習方法,用于解決SAR目標鑒別問題。方法的網絡架構如圖2所示,網絡分為子孔徑特征提取和全孔徑特征提取兩部分,通過基于棧式卷積自編碼網絡的無監督學習方法提取子孔徑特征,利用ResNet-18的預訓練模型經遷移學習后提取全孔徑特征,將子孔徑特征和全孔徑特征做歸一化后進行拼接,之后連接全連接層和softmax層,判斷輸出目標類別。

圖2 結合子孔徑與全孔徑特征學習的網絡框架Fig.2 The detailed implementations of SFFL framework
本章后續安排如下:3.1節本文通過對多通道虛假目標和真實船舶目標作子孔徑分解,分析兩類目標在子孔徑圖像中所體現出的特性;3.2節詳細闡述利用棧式卷積自編碼網絡提取子孔徑特征的方法;3.3節給出利用遷移學習提取全孔徑特征的方法;3.4節介紹特征拼接和分類方法;3.5節對所提方法進行總結。
子孔徑圖像可以通過對單視復數(Single Look Complex,SLC)SAR圖像沿著方位向做子視處理得到,也稱為子孔徑分解。一般情況下,子孔徑分解流程如圖3所示[25],首先對原始SAR圖像沿著方位向做一維的傅里葉變換轉換到距離-多普勒域,通過對距離向幅值取平均估計權重函數,計算權重函數的逆函數并歸一化得到糾正函數,將糾正函數作用于多普勒域來消除天線權重的影響,根據所需子孔徑數目再對得到的頻譜數據進行無重疊的分割,得到多個子頻譜,然后對這些子頻譜進行加窗處理,以改善相關的點目標響應。由于一個艦船目標所在范圍較小,天線權重影響可以忽略不計,本文對頻譜直接進行分割,本文所用窗函數為漢明窗(hamming window)。最后,通過傅里葉逆變換,將加窗后的子頻譜轉換回時域,從而生成所需子孔徑圖像。經過子孔徑分解獲得的子孔徑圖像,它的分辨率會隨著子孔徑數目的增加而成比例降低。
圖4比較了高分三號超精細條帶模式下真實船舶目標、純海面、多通道虛假目標切片的全孔徑和子孔徑圖像,第1列為全孔徑圖像,第2~5列為4個子孔徑圖像,圖4(a)—圖4(d)對應4個真實船舶目標切片,其中圖4(b)和圖4(c)分別對應聚焦較好的船舶目標和散焦的船舶目標切片,圖4(e)對應純海面切片,圖4(f)—圖4(h)對應3個多通道虛假目標切片。通過比較圖4中的真實和虛假目標可見在全孔徑圖像上3個真實目標與虛假目標較為接近,難以進行有效地區分。真實目標的子孔徑圖像,雖然因為子視處理分辨率降低,但在每個子孔徑圖像中均有目標。虛假目標的能量幾乎全部集中在一到兩幅子孔徑圖像中,其他幾幅子孔徑圖像中,虛假目標則呈現出和海雜波相似的特征。以上子孔徑圖像分析結果表明,真實船舶目標的子孔徑圖像具有一致性,多通道虛假目標的子孔徑圖像具有明顯的差異性,因此通過提取子孔徑圖像特征能夠實現真實船舶目標和多通道虛假目標的有效區分。

圖3 子孔徑分解流程圖Fig.3 Flowchart of sub-aperture decomposition
本文采用基于棧式卷積自編碼網絡的無監督學習方法提取子孔徑圖像特征,具體網絡結構如圖5所示,包含編碼和解碼兩部分。輸入子孔徑圖像,通過編碼部分提取嵌入特征,再經過解碼部分重建圖像,并利用輸入圖像和重建圖像的差異構建網絡的損失函數。棧式卷積自編碼網絡由一組自編碼單元堆疊而成,自編碼單元由包含卷積層的編碼器和包含反卷積層的解碼器構成,每個自編碼單元的訓練方法相同,并采用逐層訓練再堆疊的方式來訓練整個網絡。每層訓練時都是一個較淺的自編碼單元,在訓練第l個自編碼單元時,其輸入xl?1是第l ?1個自編碼單元編碼的輸出,xl?1經過包含卷積層、批歸一化層、非線性激活層、下采樣層的編碼器和包含上采樣層、反卷積層、批歸一化層、非線性激活層的解碼器,得到輸出yl?1。訓練目標是要使解碼器的輸出yl?1能夠重建xl?1,訓練中通過計算輸入圖xl?1與重建圖yl?1的均方根誤差損失,更新網絡參數,優化網絡模型。

圖4 真實船舶目標、純海面、多通道虛假目標切片的全孔徑圖像及其對應子孔徑圖像Fig.4 Examples of sublook amplitude for ships (a)—(d),sea (e),multichannel false-targets (f)—(h) and the relevant amplitude SLC images

圖5 基于子孔徑特征學習的網絡結構Fig.5 Network structure based on sub-aperture feature learning

批歸一化層:批歸一化層(Batch Normalization,BN)通過將輸出信號歸一化到相同的分布,消除訓練過程中由于權重大小導致的梯度消失和爆炸,保證網絡的穩定性,加快網絡的收斂速度,計算公式如式(2)所示

非線性激活層:通過非線性激活函數能提升模型的非線性映射表征能力,加快收斂速度,可寫成式(3)形式,其中f(·)代表非線性激活函數,本文采用ReLU非線性激活函數,計算如式(4)所示

下采樣層和上采樣層:在下采樣的過程中,不僅需要保留采樣之后的數據,還要保留采樣的位置,便于在解碼部分能夠更好地恢復圖像局部特征,下采樣和上采樣可寫成如式(5)和式(6)的形式

其中,Q和c表示反卷積層的卷積核和偏置參數,R(·)表示將卷積核Q旋轉180°。
損失函數計算:將輸入圖與重建圖的均方根誤差作為網絡的損失,因此,訓練第l個自編碼單元時所用到的損失函數如式(8)所示

各個自編碼單元的卷積層設計如表1所示,反卷積層的通道數和卷積核尺寸與卷積層一致。

表1 各個自編碼單元的卷積層設計Tab.1 Design of convolutional layers in each auto-encoder unit
由于SAR目標切片的樣本過少,直接訓練深層網絡將會導致嚴重的過擬合問題,使得網絡模型的泛化能力急劇下降,遷移學習方法可以解決小樣本問題。借助NWPU-RESISC45數據集與TerraSAR-X標注數據集[26]傳遞的遷移學習方法,大大縮小了SAR圖像與自然光學圖像的差距,并且在MSTAR分類任務上具有良好的泛化能力[27]。
因此,本文選擇采用傳遞式遷移學習方法提取全孔徑特征,遷移學習的流程如圖6所示。首先,選擇在ImageNet上預先訓練的ResNet-18作為初始預訓練模型1,然后用NWPU-RESISC45遙感數據集對卷積層進行微調,得到遙感增強模型(預訓練模型2)作為第1個遷移源;之后利用與遙感數據集有相似類別的高質量TerraSAR-X標注數據集[26]在遙感模型的基礎上進行微調,得到預訓練模型3作為本文遷移學習的將要應用的遷移源。然后,在預訓練模型3上利用少量高分三號超精細條帶模式下的影像切片對模型參數進行微調從而得到適用于SAR船舶鑒別任務的模型。
TerraSAR-X標注土地覆蓋數據集[26]由X波段TerraSAR-X衛星[28]收集獲得。該數據集選擇高分辨率聚束模式、HH極化方式的多視地面距離探測(Multilook Ground range Detected,MGD)產品,分辨率為2.9 m,入射角在20°~50°之間,包含100000多個切片,具有150個類別的層次3級標注。在本文只使用其1級標簽,包含移民區、工業設施、公共交通、農田、植被、裸露的地面、水體7類目標。
ResNet-18包含4種類型的殘差塊(ResBlock),分別重復兩次,并且分別具有64,128,256和512個輸出特征圖,共有17個卷積層和1個全連接層。殘差塊結構如圖7所示,由兩層卷積層、BN層和ReLU非線性激活層組成[29]。
雖然網絡深度越大,學習特征的能力越強,但訓練深層的網絡會導致梯度彌散/爆炸,無法收斂,即網絡層數的增加會導致更大的誤差。殘差網絡(ResNet)通過在原有卷積網絡的旁路上疊加恒等映射解決深層網絡的退化問題。
設殘差網絡的輸入為x,則輸出通過式(9)計算

其中,f(·)表示卷積操作,在ResNet-18所有卷積層后緊跟一個平均池化層,使得全孔徑特征的尺寸與子孔徑特征相同。
用C(x,y)表示輸入的復數圖像,I(x,y)表示全孔徑幅度圖像,用S(x,y)表示經過子孔徑分解獲得的子孔徑圖像。利用通過遷移學習方法訓練的網絡提取全孔徑特征,如式(12)所示


圖6 傳遞式遷移學習方法流程圖Fig.6 Flowchart of transitive transfer learning method
其中,σ2(·)和μ(·)表示求方差和均值操作。將歸一化后的全孔徑特征ψ1(x,y)與子孔徑特征ψ2(x,y)沿通道進行拼接,得到新聯合特征ψ(x,y),再將ψ(x,y)輸入到softmax層得到SAR船舶目標的鑒別結果。
基于子孔徑與全孔徑特征學習的SAR船舶目標鑒別方法算法如表2所示。

圖7 殘差塊結構圖Fig.7 The architecture of residual block (ResBlock)

表2 基于子孔徑與全孔徑特征學習的算法Tab.2 SFFL algorithm
(1) 高分三號數據。本文選取了8幅高分三號超精細條帶L1A級圖像,圖像的相關參數如表3所示,DH極化方式表示信號在水平極化下發射一次,在水平極化和垂直極化下分別接收兩次。SLC是單視復數據的簡稱,是GF-3衛星的一種產品類型。將AIS結合人工標注和確認標記的真實船舶目標和多通道虛假目標,根據標注框的位置和長寬信息裁剪復數數據,切片大小設置為128×128,每個切片包含一個樣本。將4幅圖像中的70個真實目標樣本和70個虛假目標樣本按照1:1的比例隨機劃分為訓練集和驗證集,訓練過程保證樣本數量類別均衡。測試集選擇剩余4幅圖像數據,包含72個真實目標樣本,161個多通道虛假目標樣本。

表3 GF-3超精細條帶圖像參數Tab.3 The detailed information of GF-3 UFS SAR images used in the experiment
(2) 仿真散焦數據集。由于多通道虛假目標與散焦的船舶目標在全孔徑圖像下更加相似,在視覺上更加難以區分,為了進一步驗證本文算法的有效性,本文仿真了少量的散焦圖像,具體仿真算法流程如圖8所示。在目標切片的距離-多普勒域添加二次相位誤差,二次相位誤差如式(15)

其中,a控制相位誤差曲線開口的大小,當0>a>?1.2634時,目標會發生輕微的散焦;a1.2634時,將會產生較為明顯的散焦,且散焦程度隨a的減小而加劇。
?φ<π/4,運動目標會發生輕微的散焦,對成像結果的影響可忽略不計;?φ>π/4,運動目標將會根據相位誤差的大小產生不同程度的散焦[7,8]。據此,圖9給出了5種不同程度散焦的圖像及其對應的相位誤差曲線,這里選擇c=21。本文對比與多通道虛假目標在視覺上的相似程度,仿真了12個散焦船舶目標并且全部用于測試。

圖8 散焦圖像仿真算法流程圖Fig.8 Flowchart of defocused image simulation algorithm

圖9 不同程度散焦圖像及其對應方位誤差曲線圖Fig.9 Different degrees of defocused images and their corresponding azimuth error curves
實驗硬件環境:處理器顯卡為Tesla K40,兩塊顯存,每塊12 G,終端8 G內存,3.2 GHz,英特爾i5處理器,Windows64位環境。軟件環境為Torch0.4.0,torchvisions0.1.9,tqdm4.19.1.post1,Python3.6.5,Pillow 4.2.1,tensorboardX 1.12。
棧式卷積自編碼網絡訓練使用SGD優化器來進行網絡參數迭代更新,并且訓練400個epoch,初始學習率設置為0.1,權重衰減參數為0.0005??偩W絡的訓練使用Adam優化器,初始學習率設置為0.01。使用Tensorboard監測訓練過程,梯度下降更新參數。
多通道虛假目標與真實目標的鑒別可看作一個二分類問題,混淆矩陣定義如表4。
準確率(accuracy),定義為

表5為基于子孔徑與全孔徑特征學習方法(Su-b-and Full-aperture Feature Learning,SFFL)和基于子視圖相關的方法(Sub-Look Cross-correlation Feature+Support Vector Machine,SLCF+SVM)、子孔徑特征的學習方法(Sub-aperture Feature Learning,SFL)、全孔徑特征學習方法(Full-aperture Feature Learning,FFL)的對比結果,實驗對比結果顯示,僅使用子孔徑特征比僅使用全孔徑特征可以取得更好的結果。與SFL方法和FFL方法相比,SFFL方法的運行時間略有增加,但其在多通道虛假目標鑒別任務中可以獲得最高的準確率。它們的混淆矩陣如表6所示,對于測試集的161個虛假目標,FFL方法識別出其中的126個,SFFL方法識別出156個,可見結合子孔徑特征和全孔徑特征的方法能夠更有效的識別虛假目標。FFL和SFFL方法的準確率分別為83.69%和96.57%,表明子孔徑特征的利用能顯著的提升準確率。FFL和SFFL方法在原圖中的分類結果如圖10所示,紅色圓圈代表多通道虛假目標,黃色方框代表真實目標,FFL方法將其中4個多通道虛假目標錯分為真實目標,SFFL方法中9個多通道虛假目標與4個真實目標均被正確分類。

表4 二分類問題混淆矩陣Tab.4 Confusion matrix of binary classification

表5 不同方法的鑒別性能對比Tab.5 Comparison of discrimination performance of different methods
同時,本文也利用t-SNE對兩種鑒別方法的結果進行可視化,即將兩種方法的輸出特征映射到二維平面上,圖中的紫色點和紅色點分別表示真實船舶目標和多通道虛假目標。從分類效果可視化圖11中可以看出,多數多通道虛假目標與真實的船舶目標在全孔徑特征空間混在一起無法正確區分,如圖11(a)所示,而同時利用子孔徑特征與全孔徑特征時多通道虛假目標和真實目標可以進行有效的區分,如圖11(b)所示。對于兩個多通道虛假目標,圖12比較了FFL和SFFL方法預測兩個樣本為虛假目標的置信度。由結果所知,基于子孔徑特征學習的方法預測概率均在0.9以上,遠高于FFL方法的預測結果,證明了本文方法在區分真實目標和多通道虛假目標上的有效性。由于在真實情況下,動目標在SAR成像過程中會出現一定程度的散焦,因此,本文在測試集上添加了仿真散焦船舶目標,圖13(a)展示了真實聚焦的船舶目標,在輪廓、紋理特征上非常相似的仿真的船舶目標圖13(c)和多通道虛假目標圖13(b),其中圖13(c)仿真目標是由真實聚焦的船舶目標圖13(a)按照本文所提的仿真方法獲得,仿真參數為a=—3.8,c=21。

表6 不同方法的混淆矩陣Tab.6 Confusion matrix of different methods
FFL和SFFL方法在新測試集上的準確率比較如表7所示,在加入仿真散焦數據后,FFL方法的準確率由83.69%下降到80.41%,SFFL方法的準確率由96.57%提高到96.73%,該實驗結果進一步驗證了子孔徑特征在區分多通道虛假目標上的優勢。

圖10 原圖分類結果比較Fig.10 Comparison of FFL and SFFL results in the original image

圖11 t-SNE降維特征可視化結果比較Fig.11 Comparison of FFL and SFFL visualization results using t-SNE

圖12 紋理特征與真實目標相似的多通道虛假目標切片鑒別結果詳細說明Fig.12 The elaborate explanation of the discrimination results of multichannel false-targets similar to real targets in texture

圖13 測試集仿真散焦目標示例Fig.13 An example of simulated defocus target in test set

表7 加入散焦數據結果對比(%)Tab.7 Comparison of two methods after adding defocus data (%)
本文還探究了子孔徑數目對SFFL方法的影響,圖14比較了不同子孔徑數目下SFFL方法的準確率,從圖中可以觀察到,子孔徑數目取4時方法取得了最優的準確率,當子孔徑數目大于4時,準確率會有所下降,這是由于隨著子孔徑數目的增多,子孔徑圖像的分辨率會降低,可分辨的細節特征也會相應地減少,因而當子孔徑的數目過多時,會影響方法的識別率;當子孔徑數目小于4時,方法也未達到最佳的識別性能,這是因為子孔徑數目過少,子孔徑分解得不夠精細,子孔徑圖像所能提供的額外有效信息被隱藏,可進行鑒別的差異性特征也會減少,方法的識別率無法達到最佳。由上述結果可知子孔徑數目的確定需在子孔徑分解的精細程度和子孔徑圖像的分辨率之間折中,根據實驗結果,本文將子孔徑數目設為4。

圖14 不同子孔徑數目下SFFL方法的準確率Fig.14 Overall accuracy of SFFL method with different numbers of sub-apertures
針對多通道虛假目標與真實目標在全孔徑圖像下識別難的問題,本文首先通過子孔徑分解分析了真實目標和多通道虛假目標的子孔徑圖像分別具備一致性和差異性,然后,基于上述分析結果本文提出了一種結合子孔徑和全孔徑特征學習的方法,利用棧式卷積自編碼網絡提取子孔徑特征,通過遷移學習的方法提取全孔徑特征,最后在高分三號數據上驗證了該方法的有效性,與僅用全孔徑特征相比,本文方法能更有效地區分多通道虛假目標和真實目標;加入仿真散焦數據后,與僅用全孔徑特征相比,本文方法在區分多通道虛假目標上的優勢更加明顯。