胥小我 張曉玲 張天文 邵子康 徐彥欽 曾天嬌
①(電子科技大學信息與通信工程學院 成都 611731)
②(電子科技大學航空航天學院 成都 611731)
合成孔徑雷達(Synthetic Aperture Radar,SAR)是一種主動式微波成像傳感器,在地質遙感、災害監測、應急救援、海洋監視等領域[1–4]得到了廣泛應用。SAR具有全天時、全天候工作特點,十分適用于監視氣候多變的海洋。目前,越來越多學者開始關注SAR艦船檢測,并將其應用于海洋交通監測、港口艦船調度、海洋主權維護、海上應急救援、海洋漁業管理等領域[5–8]。
近年來,深度學習在計算機視覺等領域推動著多種算法演進和各項技術革新,受此啟發,越來越多SAR智能解譯領域學者開始研究基于卷積神經網絡(Convolutional Neural Network,CNN)的SAR艦船檢測。例如,Tang等人[9]提出了一種噪聲分類器和一個目標提取器,用于在不同程度噪聲下進行艦船檢測。Zhang等人[10]提出了用于復雜場景艦船檢測的混合級聯網絡,其中結合了目標檢測和實例分割思想。He等人[11]提出了一種基于成對分支子網絡和特征增強模塊的艦船檢測網絡用于斜框SAR艦船檢測。Xu等人[12]針對實時星載SAR艦船檢測問題,建立了一種基于YOLOv5的輕量級檢測器用于實時艦船檢測。Zhang等人[13]提出了一種超輕型深度學習網絡(A Hyper-Light Deep Learning Network,HyperLi-Net),在保障檢測效率的前提下有效提升了SAR艦船檢測精度。Zhang等人[14]還建立了掩模注意交互和尺度增強網絡來同時提升SAR艦船檢測和實例分割精度。Xu等人[15]針對雙極化SAR圖像中艦船檢測問題,構建了一種分組增強融合網絡(A Group-Wise Feature Enhancement-and-Fusion Network,GWFEF-Net)用于提取雙極化SAR艦船特征。此外,Li等人[16]總結了177篇基于深度學習的SAR艦船檢測算法,并對SAR艦船檢測領域的過去、現狀和未來發展趨勢進行了分析。
上述方法大多基于錨框與真實邊框的交并比(Intersection over Union,IOU)手工閾值來將艦船錨框分配為正負樣本,然而這種經典錨框分配準則存在不合理現象。該準則忽略了錨框與真實邊框相交區域的實際內容,對于復雜場景下的靠岸艦船、并排艦船而言,一方面,被分配為正樣本的錨框包含背景噪聲、相鄰目標等干擾信息;另一方面,被分配為負樣本的錨框也包含有利于網絡分類回歸的有價值信息。然而,在SAR艦船復雜場景中,可能沒有一個錨框與真實邊框有高IOU值,經典錨框準則不會將某些有價值錨框分配為正樣本,而會將所有錨框都分配為背景負樣本。因此,經典錨框分配準則易導致正樣本多、負樣本少的不合理錨框分配現象,這將導致復雜場景下的艦船樣本學習能力低下,最終影響模型檢測性能。同時,現有研究大多只采用分類得分評估檢測框質量,忽略了利用定位信息,導致了有限的艦船定位精度。此外,現有方法大多不能有效排除靠岸金屬設施、相鄰艦船等復雜場景下的背景雜波干擾,這給進一步提高復雜場景SAR艦船檢測精度帶來了困難。
為此,本文提出了一種基于自適應錨框分配與IOU監督的復雜場景SAR艦船檢測方法A3-IOUSNet,主要創新性工作如下:
(1) 自適應錨框分配:建立高斯混合模型來自適應分配錨框,增強了復雜場景的艦船樣本學習能力。
(2) IOU監督:增加IOU預測頭來監督檢測框定位質量,使得網絡能夠精確定位復雜場景艦船目標;此外,在該IOU預測分支中引入了坐標注意力模塊,抑制了背景雜波干擾,進一步提高了艦船檢測精度。
A3-IOUS-Net網絡結構基于主流單階段檢測器(即RetinaNet[17])設計。RetinaNet兼顧檢測速度與檢測精度,因此選擇該網絡作為模型基線進行研究。
A3-IOUS-Net網絡結構如圖1所示。其網絡結構由骨干網絡、特征金字塔網絡(Feature Pyramid Network,FPN)和檢測頭組成。此外,A3-IOUS-Net核心貢獻是自適應錨框分配機制和IOU監督機制。

圖1 A3-IOUS-Net網絡結構Fig.1 Overall framework of A3-IOUS-Net
首先,A3-IOUS-Net使用骨干網絡提取艦船特征。在不失一般性情況下,選擇ResNet-50作為骨干網絡[18]。然后,使用FPN對骨干網絡提取到的特征進行空間信息增強。最后,使用FPN生成的特征進行分類、回歸及IOU預測,獲得檢測結果。特別地,A3-IOUS-Net通過自適應錨框分配機制合理分配正負樣本。此外,A3-IOUS-Net通過IOU監督機制來提高檢測框定位質量并抑制背景雜波干擾。
2.2.1 經典錨框分配
RetinaNet在光學目標檢測領域提供了先進檢測性能,但在SAR艦船檢測領域的檢測性能卻欠佳。這可能是由于其采用的經典錨框分配準則不適配于SAR艦船復雜場景。
一般地,經典錨框分配準則由預測框和真實邊框之間的IOU閾值確定樣本分配,IOU即為預測框和真實邊框的交并比,定義為
其中,BP表示預測框(即Predicted Box),BG表示真實邊框(即Ground Truth Box),則IOU表示預測框和真實邊框交集和并集的面積比值,如圖2所示。

圖2 預測框和真實邊框之間的IOU示意圖Fig.2 Schematic diagram of IOU between the predicted box and the ground truth box
具體而言,對于每個真實邊框,若存在錨框與真實邊框的IOU超過閾值,對應錨框分配為正樣本,其余錨框分配為負樣本或者忽略樣本,定義為
其中,錨框→正樣本表示錨框被分配為正樣本,忽略樣本表示錨框被分配為不參與網絡訓練的樣本,錨框→忽略樣本表示錨框被分配為忽略樣本,錨框→負樣本表示錨框被分配為負樣本。
經典錨框分配準則下SAR艦船復雜場景的錨框分布如圖3所示,其中綠色矩形代表艦船真實邊框,藍色矩形代表負樣本錨框,紅色矩形代表正樣本錨框。根據經典錨框分配準則,圖3中的艦船真實邊框只與單個錨框的IOU(即0.56)大于指定閾值(即0.50),該錨框分配為唯一正樣本。然而,真實邊框附近的另一錨框(即圖3中棕色矩形框)也包含了目標艦船的有價值區域,具有分配為正樣本的潛力,應當定義為正樣本來參與網絡訓練。因此,經典錨框使用固有的IOU閾值來分配正負樣本,這往往導致復雜場景下正樣本少、負樣本多的不合理分配,限制了復雜場景下網絡的艦船樣本學習能力。

圖3 經典錨框分配準則下SAR艦船復雜場景的錨框分布Fig.3 The detection result of complex scenes under the classical anchor box allocation criteria
綜上,在進行實際復雜場景SAR艦船檢測時,經典錨框分配準則與實際模型當前學習場景存在嚴重失衡。這將導致網絡的艦船樣本學習能力低下,最終影響模型檢測性能。
2.2.2 自適應錨框分配
為了使得錨框分配準則能夠適用于SAR艦船復雜場景,提出了一種自適應錨框分配機制,該機制能夠根據概率分布模型擬合當前學習場景下的錨框得分分布,自適應地將錨框分配為正負樣本,從而避免了IOU閾值和正樣本數量的手工設定。具體而言,該機制首先計算錨框在當前學習場景下的得分,其次利用得分進行概率分布建模,最后利用該概率分布模型來自適應分配正負樣本。
自適應錨框分配如圖4所示。其中,黃色矩形代表錨框,圓點代表基于分類分數和定位分數的錨框得分。錨框得分越高,圓點顏色越紅;錨框得分越低,圓點顏色越藍。自適應錨框分配機制首先計算錨框分數并將錨框分數建模為雙模態(一種用于正樣本,一種用于負樣本)高斯混合模型的分布樣本。然后根據分布模型指導錨框自適應分配為正負樣本,這避免了預設IOU閾值或正樣本數量。

圖4 自適應錨框分配示意圖Fig.4 Schematic diagram of adaptive anchor assignment
首先,自適應錨框分配機制定義了錨框的評分準則,該評分準則可以反映出當前場景下錨框的正負樣本分類及定位質量,其初步定義為
其中,a表示錨框,x表示輸入的SAR圖像,fh表示具有超參數h的網絡模型,g表示真實邊框,Scls表示錨框的分類得分,Sloc表示錨框的定位得分,E1表示分類得分權重,E2表示定位得分權重。不同于文獻[19],該評分準則的分類得分權重及定位得分權重由網絡自適應學習得到,有利于提升當前復雜場景下的錨框學習能力。
特別地,錨框的分類得分可以由分類檢測頭的分類得分直接得出,然而錨框的定位得分并不能由定位檢測頭直接得出,這是由于定位檢測頭的輸出是編碼后的坐標偏置量而非定位得分。考慮到預測框與真實邊框的IOU能夠體現定位質量且其取值范圍為[0,1],采用預測框與真實邊框的IOU作為定位得分,定義為
將式(3)等號兩邊取負對數:
其中,Lcls表示交叉熵損失函數,LIOU表示IOU損失函數。因此,給定一個真實邊框,自適應錨框分配機制將上述兩個損失函數的和作為錨框評分準則。
其次,該機制利用上一步驟得到的錨框得分進行概率分布建模。概率分布建模目標是根據錨框分數樣本區分正負樣本,由于目標檢測任務錨框分數樣本分布符合高斯混合分布模型[19],采用雙模態高斯混合模型(Gaussian Mixture Model,GMM)[20]來建模錨框得分分布。具體而言,采用最大似然估計來確定概率模型的分布參數。高斯混合模型定義如下:
其中,N1表示正模態高斯模型,w1表示正模態高斯模型權重,μ1表示正模態高斯模型均值,q1表示正模態高斯模型標準差;N2表示負模態高斯模型,w2表示負模態高斯模型權重,μ2表示負模態高斯模型均值,q2表示負模態高斯模型標準差,s表示錨框分數。實現過程中,給定一組錨框分數,通過使用期望最大化函數(Expectation-Maximization,EM)[21]來優化GMM的似然函數并估計出GMM的參數。
最后,自適應錨框分配機制利用概率分布模型來自適應分配正負樣本,從而避免了手工調優IOU閾值等超參數。具體而言,通過估計的GMM參數,可以確定每個錨框自適應分配為正樣本或者負樣本的概率值。如圖4左側所示,通過將正樣本分布曲線與負樣本分布曲線的交點視為分配邊界,可以將錨框分數大于該邊界的錨框分配為正樣本,將其余錨框分配為負樣本。為了便于將該機制嵌入到網絡的訓練過程中,自適應錨框分配機制具體實現如下:
其中,Ppos(a,h,g)和Pneg(a,h,g)分別代表一個錨框被判定為正樣本或者負樣本的概率,Spos(a,h,g)和Sneg(a,h,g)分別代表被分配為正樣本或者負樣本的錨框對應得分,?代表背景類。因此,在每次訓練迭代過程中,網絡會先計算Ppos和Pneg,然后再通過隨機梯度下降法(Stochastic Gradient Descent,SGD)進行梯度優化。
自適應錨框分配基本流程詳見算法1。首先,為了計算錨框分數,采用式(5)定義的錨框評分函數來獲得統一的分類和定位得分。然后,為了使用錨框分數進行概率分布建模,采用EM來估計GMM相應參數。最后,使用得到的概率分布模型指導錨框分配為正負樣本。
通過自適應錨框分配,網絡可以自適應地將錨框分配為正負樣本,這有助于增強復雜場景下SAR艦船樣本學習能力,有利于提高SAR艦船檢測性能。
以往深度學習SAR艦船檢測算法在推理階段往往只采用分類得分作為檢測框分配準則,然而這些算法檢測框的分類得分缺乏定位信息,導致復雜場景下有限的艦船定位質量。同時,復雜場景下艦船檢測常常受到靠岸金屬設施、相鄰艦船等背景雜波干擾,這給進一步提高SAR艦船檢測精度帶來了困難。此外,受到光學遙感目標檢測領域同時考慮分類分數以及位置分數的思想啟發[22],提出了一種IOU監督機制,在檢測器預測頭部增加IOU預測分支來監督網絡推理階段的非極大值抑制(Non-Maximum Suppression,NMS)后處理中的檢測框定位質量。此外,在IOU預測分支中引入了坐標注意力模塊,抑制了背景雜波干擾,從而提高最終的SAR艦船檢測性能。

算法 1 自適應錨框分配基本流程Alg.1 Basic process of adaptive anchor assignment
具體而言,IOU監督在NMS后處理中使用了IOU預測分支監督檢測框定位得分,監督了檢測框定位質量;在IOU預測分支中引入了坐標注意力模塊,抑制了背景雜波干擾。結合IOU監督的NMS后處理基本流程詳見算法2。
IOU預測分支示意圖如圖5所示。可以看出,IOU預測分支具有兩部分:坐標注意力模塊和IOU預測頭。具體而言,首先,通過坐標注意力模塊精煉輸入特征,提取更顯著的全局方位信息。然后,遍歷IOU預測頭對應特征圖每個像素點xi,j ∈RH×W×1,則可以得到每個金字塔層級上所有錨框的IOU預測輸出標量,其中xi,j表示空間坐標為(i,j)的像素點,H表示特征圖高度,W表示特征圖寬度。接下來將詳細介紹坐標注意力模塊。

圖5 IOU預測分支示意圖Fig.5 Schematic diagram of IOU prediction branch
坐標注意模塊示意圖如圖6所示,該模塊可以學習獲取方位感知的特征圖,有利于關注感興趣艦船特征,抑制背景雜波干擾。經典SE-Net通過二維全局平均池化獲得全局空間信息[23],但丟失了目標位置信息。與之不同,坐標注意力模塊應用兩個一維平均池化來解耦垂直方向和水平方向,以便保持兩個方向的位置信息。對于給定的輸入特征I=[i1,i2,...,ic]∈RH×W×C,使用H ×1池化層來編碼垂直坐標,使用1×W池化層來編碼水平坐標。以上編碼操作的具體實現如下:

算法2 結合IOU監督的NMS后處理基本流程Alg.2 Basic process of NMS combined with IOU supervision

圖6 坐標注意力模塊示意圖Fig.6 Schematic diagram of coordinate attention module
通過上述過程,生成的特征同時具有方向和位置感知,這可以促使網絡更加關注艦船目標。
在上述空間方向解耦之后,得到具有精確位置信息的方向張量X(h)∈RH×1×C和X(w)∈R1×W×C。然后通過卷積運算生成自適應坐標注意力,其定義為
其中,Conv(?)是共享的1×1卷積層,BN(?)代表批歸一化層,此外,的通道數是C/r,其中超參數r是通道壓縮比,將其設置為16。然后,將分別輸入到不同的1×1卷積層,以恢復通道原始數量,其定義為
其中,sigmoid(·)是sigmoid激活函數,Y(h)和Y(w)被視為自適應坐標注意力權重。
根據輸出Y(h)和Y(w),沿著垂直和水平方向進行注意力加權。此時,坐標注意力模塊的最終輸出Y=[y1,y2,...,yc]∈RH×W×C定義為
不同于文獻[24],這里把坐標注意力模塊集成到IOU預測分支中,如圖5所示。最終,得到細化的艦船語義特征,這有助于關注艦船邊界位置信息,有利于抑制背景雜波干擾。
特別地,為了便于將該機制嵌入到網絡的訓練過程中,該機制引入了IOU預測損失函數來監督錨框的定位質量。此時,訓練階段的損失函數為
其中,LIOUP表示真實IOU和預測IOU間的交叉熵,即IOU預測損失函數,E3表示IOU預測損失權重。
具體地,采用了GIOU Loss作為IOU預測損失函數。其定義為
其中,BP代表綠色預測框,BG代表藍色真實邊框,BS表示兩者的紅色最小矩形包圍框(即Smallest Rectangle Enclosing Box)。圖7為預測框和真實邊框之間的GIOU示意圖。考慮到IOU Loss對于兩個目標框的距離不敏感,而GIOU Loss能反映兩個非重疊目標間的距離,這有利于提高模型檢測定位性能。因此,使用GIOU Loss作為IOU預測損失函數。

圖7 預測框和真實邊框之間的GIOU示意圖Fig.7 Schematic diagram of GIOU between the predicted box and the ground truth box
此外,Focal Loss作為分類損失函數,定義為
其中,pt表示預測類別概率,at表示平衡因子,b表示調制因子。
通過IOU監督,網絡可以提升復雜場景下SAR艦船檢測框定位質量,同時抑制靠岸金屬設施、相鄰艦船等背景雜波干擾,從而進一步提高最終的SAR艦船檢測性能。
本文使用國內公開的SAR艦船檢測數據集(SAR Ship Detection Dataset,SSDD)[25]來驗證所提出網絡A3-IOUS-Net的有效性。SSDD數據集的信息概覽如表1所示。從表1中可以看出,SSDD數據集有1160張來自3個不同SAR衛星的SAR圖像,其中包含了2587艘船,即平均一張圖像中有2.23艘船。該數據集中的SAR圖像來自不同的衛星傳感器,具有不同的海況、不同的極化模式、不同的分辨率、不同的地點、復雜的場景和豐富的艦船數量和艦船尺寸等特點。因此,本文使用SSDD數據集來驗證A3-IOUS-Net的有效性。

表1 SSDD數據集信息概覽Tab.1 Information of SSDD
本文使用SGD優化器對A3-IOUS-Net進行優化,一共訓練12個epoch。網絡輸入大小設置為512像素×512像素,學習率設置為0.005,動量設置為0.9,權重衰減設置為0.0001。學習率在每個第8和第11個時期減少10倍。此外,由于GPU能力有限,訓練批次大小(Batch Size)設置為8。為了加速收斂,訓練過程加載了ResNet-50的ImageNet預訓練權重。其他未提及的超參數與RetinaNet保持一致。在網絡推理過程中,NMS的IOU閾值設置為0.60。
實驗運行在GPU型號為NVIDIA RTX3090、CPU型號為i9-9900K、內存大小為32 GB的個人計算機上。該計算機采用基于Python 3.10語言的Pytorch[26]和MMDetection[27]作為深度學習框架。此外,實驗中使用CUDA11.7調用GPU進行訓練加速。
精度(P)定義如下:
其中,TP是True Positives的縮寫,表示正確檢測的艦船樣本數量;FP是False Positives的縮寫,表示錯誤檢測的艦船樣本數量。P可以衡量模型的查準率。
召回率(R)定義如下:
其中,FN是False Negatives的縮寫,表示漏檢的艦船樣本數量。R可以衡量模型的查全率。
平均精度(AP)定義如下:
AP可以全面衡量檢測模型的查準率和查全率,反映了模型的綜合性能。因此,本文將其作為核心評價指標。此外,還使用參數量(Parameter Size,Params)來衡量模型的計算空間復雜度。
由表2可知,相比其他15種模型(其中前10種模型屬于通用目標檢測領域,后5種模型屬于SAR艦船檢測領域),A3-IOUS-Net在所有場景上取得了最高SAR艦船檢測精度,Libra R-CNN在全部場景上取得了次優SAR艦船檢測精度。A3-IOUS-Net在全部場景上的AP指數高達94.05%,與次優方法Libra R-CNN相比,AP值高出2.46%。特別地,A3-IOUS-Net在復雜靠岸場景上的精度優勢顯著,其復雜靠岸場景對應的AP值達到了82.04%,比次優方法Libra R-CNN高出8.38%,這表明了A3-IOUSNet優越的復雜場景SAR艦船目標檢測性能。特別地,Quad-FPN和GWFFE-Net均為本課題組所提出的SAR艦船目標檢測方法,其中Quad-FPN局限于網絡結構優化策略,GWFFE-Net旨在利用SAR艦船極化特征,然而上述兩種方法忽略了正負樣本分配不合理及定位質量較差的問題,導致了受限的SAR艦船檢測精度。此外,A3-IOUS-Net的復雜靠岸場景上的各項評估指標均高于其他方法,因此A3-IOUS-Net可以在復雜場景中提供更準確、更全面的艦船檢測結果,即在P,R和AP指標上的結果均最優。以上結果顯示了A3-IOUS-Net優越的復雜場景SAR艦船檢測性能。

表2 A3-IOUS-Net和其他方法性能對比Tab.2 Comparison of performance of A3-IOUS-Net and other methods
圖8展示了不同方法在不同場景(即全部場景、復雜靠岸場景和簡單離岸場景)上的精度-召回率曲線(Precision Recall Curve,PRC),圖中PRC越靠近坐標軸右上方代表檢測性能越好。如圖8所示,與其他方法相比,A3-IOUS-Net對應曲線在不同場景上始終位于最右上方。特別地,A3-IOUS-Net對應曲線在復雜靠岸場景上的精度優勢更為顯著,這直觀地揭示了A3-IOUS-Net具有最優越的復雜場景SAR艦船檢測性能。此外,A3-IOUS-Net在原始網絡上只增加了少量模型參數。

圖8 不同方法在不同場景上的精度-召回率曲線Fig.8 Precision-Recall curves of different methods in different scenes
圖9展示了在SSDD數據集上不同模型的復雜場景SAR艦船檢測定性結果對比,圖中展示了A3-IOUS-Net和次優模型Libra R-CNN的SAR艦船檢測定性對比結果。圖9中,綠色框表示真實邊框,黃色橢圓表示漏檢艦船,紅色橢圓表示虛警艦船。圖9(a)展示了復雜場景下的SAR艦船真實邊框,圖9(b)展示了Libra R-CNN在復雜場景下的SAR艦船檢測結果。圖9(c)展示了A3-IOUS-Net在復雜場景下的SAR艦船檢測結果。可以發現,A3-IOUSNet提供了更優的復雜場景SAR艦船檢測性能。例如,對比圖9(b)與圖9(c)第1行第1列圖像的艦船檢測結果,A3-IOUS-Net檢測出靠岸金屬設施干擾下的靠岸艦船,Libra R-CNN卻漏檢了該艘艦船。例如,對比圖9(b)與圖9(c)第1行第3列圖像的艦船檢測結果,A3-IOUS-Net準確無誤地檢測出3艘靠岸艦船,Libra R-CNN卻錯誤地漏檢了1艘并排靠岸艦船。以上都表明了A3-IOUS-Net具有更優越的復雜場景SAR艦船檢測性能。
3.5.1 自適應錨框分配機制消融分析
本節共開展了兩組實驗對自適應錨框分配機制進行消融分析。其中,實驗1驗證了是否使用自適應錨框分配機制對檢測精度的影響,如表3所示;實驗2驗證了使用不同的概率分布模型對檢測精度的影響,如表4所示。

表3 A3-IOUS-Net是否使用自適應錨框分配機制對精度的影響(%)Tab.3 Effect of whether A3-IOUS-Net using adaptive anchor assignment mechanism (%)

表4 自適應錨框分配機制使用不同概率分布模型對精度的影響(%)Tab.4 Effect of adaptive anchor assignment mechanism using different probability distribution models (%)
表3展示了是否使用自適應錨框分配機制對艦船檢測精度的影響。如表3所示,在加入自適應錨框分配后,由于實現了自適應地將錨框分配為正負樣本,提高了網絡中艦船樣本學習能力,模型在復雜靠岸場景上的檢測精度AP值提高了11.17%,模型在全部場景上的檢測精度AP值提高了3.33%,這充分表明了自適應錨框分配機制的有效性。在表4中展示了使用不同的概率分布模型對艦船檢測精度的影響。如表4所示,高斯混合模型能夠更好地建模SAR艦船復雜場景下的錨框得分分布,有利于網絡將錨框合理地分配為正負樣本,這與高斯混合分布模型能夠形成任意形狀密度分布的平滑近似[20]以及目標檢測任務中錨框分數樣本分布符合高斯混合分布模型[19,41]的理論一致。如圖10所示,采樣訓練階段的2013個錨框得分,將錨框分數建模為雙模態(一種用于正樣本,一種用于負樣本)高斯混合模型的分布樣本;可以發現,錨框分數樣本分布符合高斯混合分布模型,其中錨框負樣本分數符合一種均值為0.57標準差為0.16的高斯分布,錨框正樣本分數符合一種均值為0.67標準差為0.10高斯分布;然后通過將正樣本分布曲線與負樣本分布曲線的交點視為分配邊界(圖中為0.56),可以將錨框分數大于該邊界的錨框分配為正樣本,將其余錨框分配為負樣本。相較于采用次優概率分布模型,網絡在復雜靠岸場景上的檢測精度AP值提高了8.75%,網絡在全部場景上的檢測精度AP值提高了3.04%,這充分表明了高斯混合模型的有效性。此外,采用部分其他分布(如狄利克雷混合分布和T混合分布)的實驗效果較差,說明了自適應錨框機制對于概率分布模型的類型選擇比較敏感,若采用不適配的概率分布模型擬合符合高斯混合分布分數樣本,這種不合理擬合模型反而會加劇正負樣本的不合理分配,導致最終效果可能會比基于IOU閾值的錨框分配方法更差。

圖10 錨框分數樣本分布圖Fig.10 The distribution figure of anchor score samples
3.5.2 IOU監督機制消融分析
本小節共開展了3組實驗對IOU監督機制進行消融分析。其中,實驗1驗證了是否使用IOU監督機制對檢測精度的影響,如表5所示;實驗2驗證了IOU監督機制使用不同的IOU預測損失函數對檢測精度的影響,如表6所示;實驗3驗證了IOU監督機制是否使用坐標注意力模塊對檢測精度的影響,如表7所示。

表5 A3-IOUS-Net是否使用IOU監督機制對精度的影響(%)Tab.5 Effect of whether A3-IOUS-Net using IOU supervise mechanism (%)

表6 IOU監督機制使用不同IOU預測損失函數對精度的影響(%)Tab.6 Effect of IOU supervise mechanism using different IOU prediction loss functions (%)

表7 IOU監督機制是否使用坐標注意力模塊對精度的影響(%)Tab.7 Effect of whether IOU supervise mechanism using coordinate attention module (%)
如表5所示,在單獨加入IOU監督后,由于獲取了IOU預測得分,提高了檢測框定位質量,模型在復雜靠岸場景上的檢測精度AP值提高了17.38%,模型在全部場景上的檢測精度AP值共提高了6.86%,這充分表明了IOU監督機制的有效性。
如表6所示,IOU監督機制采用GIOU Loss相較于采用IOU Loss對模型具有更佳的增益效果。這是由于IOU Loss對于兩個目標框的距離不敏感,而GIOU Loss能夠反映兩個非重疊目標間的距離,所以后者有利于進一步提高模型檢測定位性能。在IOU監督機制采用GIOU Loss后,模型在復雜靠岸場景上的檢測精度AP值提高了7.54%,模型在全部場景上的檢測精度AP值共提高了2.37%,這充分表明了GIOU Loss的顯著優勢。
如表7所示,IOU監督機制采用坐標注意力模塊后,由于關注了艦船方位信息,抑制了背景雜波干擾,模型在復雜靠岸場景上的檢測精度AP值提高了5.4%,模型在全部場景上的檢測精度AP值共提高了1.31%,這充分表明了坐標注意力模塊的有效性。
為了進一步驗證A3-IOUS-Net的復雜場景SAR艦船檢測性能,使用在SSDD數據集上訓練得到的深度學習模型在高分辨率SAR艦船檢測數據集AIR-SARShip-1.0[42]上進行遷移實驗,如圖11所示。測試圖片包括近岸大場景下的多尺度艦船目標,由于海況復雜、靠岸建筑干擾等元素導致檢測場景相對復雜。圖11展示了A3-IOUS-Net遷移到大場景SAR圖像上的檢測結果。其中藍色框代表檢測目標,紅色框代表誤檢艦船目標,黃色框代表漏檢艦船目標。從圖11中可以看出,A3-IOUS-Net可以準確檢測出所有離岸艦船,可以檢測出部分靠岸艦船,但在密集河道區域仍存在一定的虛警。由此得出結論,A3-IOUS-Net具有一定的遷移能力,能夠一定程度上適應多傳感器下的復雜場景SAR艦船檢測。

圖11 大場景SAR圖像艦船檢測結果圖Fig.11 Ship detection results in large scene SAR images
針對復雜場景SAR艦船檢測任務中艦船目標錨框分配不合理和檢測網絡定位精度不理想的問題,本文提出了一種名為A3-IOUS-Net的基于自適應錨框分配與IOU監督的復雜場景SAR艦船檢測方法。首先,文中設計了自適應錨框分配機制,通過建立概率分布模型將錨框合理地分配為正負樣本,以增強網絡對于復雜場景艦船樣本的學習能力,以提升檢測精度。其次,提出了IOU監督機制,通過在預測頭部增加IOU預測分支來對檢測框的定位質量進行監督,使得網絡能夠精確地定位復雜場景艦船目標。另外,通過在該預測分支中引入坐標注意力模塊,可以抑制背景雜波干擾,從而進一步提高檢測精度。基于公開數據集SSDD開展了實驗,結果表明所提出的A3-IOUS-Net具有優越的復雜場景SAR艦船檢測性能。特別地,A3-IOUS-Net在復雜場景中SAR艦船檢測精度AP值較次優模型Libra R-CNN提高了8.38%。消融實驗也證明了A3-IOUS-Net每項改進的有效性。在未來工作中,將更加關注復雜場景下并列和靠岸的艦船目標檢測,采用更適用于長寬比大艦船的斜框檢測數據集Official SSDD[25],結合斜框檢測思想對網絡結構進行優化,進一步提高檢測模型的魯棒性和適應性。