周宇,曹榮剛,2,3*,栗蘋,3,馬嘯
(1.北京理工大學 機電學院, 北京 100081; 2.北京理工大學 唐山研究院, 河北 唐山 063611;3.北京理工大學 機電動態控制重點實驗室, 北京 100081)
無線電近炸引信通過無線電回波對目標、環境和彈目運動信息進行解算和決策,從而引爆戰斗部裝藥實現對目標的最優毀傷效果。現代戰場電子對抗要求引信具有良好的抗干擾性能,無線電近炸引信的升級迭代是其抗干擾性能不斷提升和優化的過程。在對無線電近炸引信進行抗干擾性能測試時,穩定可靠的引信炸點檢測手段能為研究引信炸點狀態提供數據支撐[1-3]。
以常用的光學檢測方式為例,引信炸點檢測任務要求檢測方法能夠區分大小不一形狀復雜且不斷變化的炸點目標,同時克服真實戰場環境下可能存在的爆炸煙霧和自然光干擾,如圖1所示。另外,由于觀察角度的原因,圖像中容易出現多炸點共存且互有重疊的情況,因此要求檢測方法具有區分多炸點重疊的能力,以減少誤檢和漏檢。

圖1 不同情況下的炸點形態
文獻[4-6]研究了基于光電探測設備的炸點探測系統與測試方法,可實現炸點圖像的高速抓取與炸點目標的識別,但是文獻中的檢測系統組成復雜、安裝與設置流程繁瑣且只能應用于標準化測試靶場。然而真實野外戰場環境復雜多變,靶場試驗得到的數據與結論無法等效適用與推廣。文獻[7]基于主分量尋蹤和主分量分析提出了一種可用于野外環境的炮彈炸點檢測方法,但該方法依賴于炸點的序列圖像,無法應用于孤立炸點圖像,且該方法中的圖像分割操作無法適用于背景復雜變化的情況或多目標復雜運動和互有交疊的情況,因此實用性有限。文獻[8]在分析炮彈炸點的雷達回波信號特性的基礎上,提出基于回波多普勒和動目標檢測技術的炸點目標識別方法,該方法適用于多目標共存的情況,受信噪比影響較小,但操作復雜、自動化程度低,且需要人工設置經驗參數,通用性不如光學檢測方法。基于上述分析,目前還沒有適用于復雜測試環境的高效高精度引信炸點檢測方法。
隨著深度學習技術的發展,基于圖像目標檢測算法的應用逐漸出現在工業界,并在一些自動化工程中顯示出強大的性能。目標檢測算法能完成對圖像中目標的識別、定位并分類的任務。相比傳統圖像處理的方法,基于深度學習的目標檢測算法自動化程度高,對于任務場景具有更強大的適應性和魯棒性,需要人工參與的先驗設定更少。現有的深度學習目標檢測算法根據處理流程可分為兩階段和單階段算法。兩階段目標檢測算法具有較高的檢測召回率,但容易忽略特征不明顯的目標造成漏檢。另外兩階段算法模型參數量大,占用資源高,運行速度慢,不適用于對檢測效率有要求的工業應用[9]。作為領域內的研究熱點,單階段檢測算法克服了運行效率的局限性,具有數倍于兩階段檢測算法的效率,但檢測精度有限,尤其是對于小尺寸目標的檢測能力不足,因此不適用于存在大視場小目標情況的野外環境炸點檢測任務。
在分析任務場景的基礎上,本文提出引信炸點的光學觀測設備設置方案,采集了野外戰場環境下的多地形多目標引信炸點圖像并結合數據增強方法制作了實驗數據集;提出一種基于改進的單階段目標檢測模型的高精度引信炸點檢測方法,該方法對檢測算法模型結構設計進行了多處改進,并優化了網絡模型的訓練策略。提出的檢測方法實現了對復雜動態環境下圖像炸點目標的自動化檢測,且識別精度優于現有典型檢測算法。
觀測設備布設方案基于“近點觀測,遠程遙控”的思想,可近距離觀測得到引信炸點細節信息。方案設定拍攝點和遙控點,其中拍攝點用于設置觀測設備及下位機遙控端;遙控點設有無線控制上位機,用于觀測設備的遠程控制。
圖2展示了任務場景與觀測設備的布設關系。載有被測引信的炮彈按預定飛行路線飛抵預定落彈區進行預定毀傷任務,中途經過一個由引信干擾機影響的干擾區域。炮彈經過該區域時引信將受到干擾信號影響造成早炸。若引信未受到干擾,則炮彈飛行至預定落彈區完成近炸或觸發作用。上述兩個區域的兩側設有高速相機來對引信狀態進行拍攝。高速相機獲取的圖像數據使用引信炸點檢測算法來進行炸點目標檢測。

圖2 觀測設備總體布設關系示意圖
經典的單階段檢測YOLO算法提出將目標的檢測框、檢測置信度和所屬類別的解作為一個數值回歸問題來求解[10-11]。其結構上一般可分為骨干網絡、頸部結構以及檢測頭。其中,骨干網絡是目標檢測網絡的核心部分,能夠提取出輸入圖像中目標的特征并將其以特征圖的形式輸出;頸部結構接收骨干網絡輸出的多個尺度的特征圖,并強化其中的特征值強度;檢測頭接收強化后特征圖并對其進行特征解碼,輸出檢測結果。以YOLOv3算法為例,它使用DarkNet53作為骨干網絡來提取圖像中的目標特征,該部件使用了殘差連接結構來避免梯度消失和梯度爆炸導致的網絡退化問題[12];其頸部結構中使用特征金字塔結構來強化不同尺度特征圖特征表征[13];檢測頭對特征圖進行解碼并調整預設錨框的大小與位置,最終得到檢測結果。
本文提出的炸點檢測算法模型在骨干網絡、頸部結構以及檢測頭等部分進行了多處改進。在改進設計中,對骨干網絡進行選型,并調整結構規模以提升性能;對頸部結構進行重新設計,提出帶通道注意力機制的多分支(Multi-Branch with Channel Attention, MBCA)模塊和密集連接跨階段局部(Dense Cross Stage Partial, DCSP)模塊;在檢測頭的改進設計中,基于無錨框和任務解耦的思想,設計了適用于多尺度特征圖的新檢測頭結構。
2.1.1 骨干網絡設計
使用ConvNeXt網絡作為目標檢測網絡的骨干網絡[14],該網絡結構如圖3所示。相比其他常見的骨干網絡ResNet或者DarkNet、ConvNeXt網絡擁有更優秀的特征提取能力。以網絡規模相近的ConvNeXt-T、ResNet50以及DarkNet53網絡為研究對象,3個網絡的參數量分別為29×106、25.5×106、40.5×106,其在ImageNet數據集上的Top-1分類準確率分別為82.9%、75.8%、78.5%。

圖3 ConvNeXt網絡結構
如圖3所示,ConvNeXt Block模塊使用了卷積核尺寸為7×7、滑動步長為1、填充為3(即k=7,s=1,p=3)的分組卷積、層歸一化、GELU激活函數等組件[15],并使用了層縮放[16]、路徑丟棄以及殘差連接[17]的技巧來增強網絡的泛化性能。
在ConvNeXt網絡中,待檢測圖像首先通過一個尺寸為4×4滑動步長為4(即k=4,s=4)的卷積層進行下采樣,然后進行層歸一化(LN)。之后數據流先后進入4個ConvNeXt Block模塊組進行圖像特征提取。其中數據流在進入后3個ConvNeXt Block模塊組之前先進行一次下采樣操作來使特征圖寬和高下降一半并增加一倍特征圖通道數。之后經過 3個 ConvNeXt Block模塊組后得到3個不同尺度的特征圖,這些特征圖將作為頸部結構的輸入。在這3個特征圖中,大尺寸的特征圖1含有較多的目標定位信息,小尺寸的特征圖3含有較多的目標語義信息,而中間的特征圖2則同時攜帶了目標語義和定位信息。為了配置高效的網絡結構,在參考 Swin Transformer的配置[18]的基礎上,設定4個ConvNeXt Block模塊組中模塊堆疊數量分別為3、3、27、3,即通過提高輸出特征圖2的ConvNeXt Block模塊組3的規模來強化其特征提取能力。
2.1.2 頸部結構改進
2.1.2.1 帶通道注意力機制的多分支模塊
Inception網絡提出了多分支結構來增加網絡寬度,并通過使用不同尺寸卷積核的方式來增強網絡對不同尺度目標的適應性[19],如圖4(a)所示。值得注意的是,不同尺寸的卷積核所對應的感受野大小是不同的,因此這些不同的卷積核對于一個目標的特征抽取特性是不同的。對于小目標,小尺寸卷積核提取的特征強度大于大尺寸卷積核提取的特征強度。因此在多分支結構進行通道拼接時,不同支路輸出的特征圖的作用權重也應該有所區別且隨檢測對象動態變化,即對于小目標而言,小尺寸卷積核支路提供的輸出應在最終輸出中占有更大比重。基于上述思想,為了在每個分支得到與檢測對象相適應的作用權重,提出了改進的帶通道注意力機制的多分支(MBCA)模塊,其結構如圖4(b)所示。

圖4 原多分支結構與帶通道注意力機制的多分支模塊
在該結構中,輸入首先通過1個1×1卷積層,減少一半的特征圖通道數,并經過層歸一化和Sigmoid 加權線性單元(Sigmoid Linear Unit, SiLU)激活函數[20],如式(1)所示:
(1)
然后特征圖將分別進入4個分支,每個分支包含主干上的1個特征抽取模塊(由卷積、層歸一化、SiLU激活函數組成,即Convolution LayerNorm SiLU模塊,簡稱CLS模塊),和1個用于計算通道注意力權重的亞分支組成。4個分支中CLS模塊的卷積層分別由1個1×1卷積核,1個3×3卷積核,1個 5×5卷積核,2個3×3卷積核組成;卷積核滑動步長均為1。在計算通道注意力權重的分支中,通道數、寬度和高度分別為C、W和H的特征圖首先經過1個1×1卷積核,然后進行通道級全局平均池化操作得到尺寸為C的通道權重,該權重與CLS模塊得到的特征圖相乘得到該分支的最終輸出。由于分支的操作不改變特征圖的尺寸,因此將4個分支得到的加權特征圖進行在通道維度上進行堆疊,最后通過一個CLS模塊實現加權特征圖的融合,并將特征圖通道數還原為MBCA模塊輸入的特征圖通道數。
2.1.2.2 密集連接跨階段局部模塊
在頸部結構中,一般使用跨階段局部(Cross Stage Partial, CSP)模塊來強化特征圖的特征表征[21]。該結構基于殘差連接結構的思想,將輸入先后通過多個串聯的殘差模塊(由1個1×1卷積核和1個3×3卷積核組成)后,與原輸入融合以得到輸出。值得注意的是,即使是在一個CSP模塊中,串聯的多個殘差模塊也擁有提取不同尺度的目標特征的能力,但這些特征并沒有被顯式地利用。借鑒密集連接結構的思想[22],提出了密集連接跨階段局部(DCSP)模塊,其與CSP模塊的對比如圖5所示。在本文中,串聯的殘差模塊個數為3。

圖5 原始跨階段局部模塊與密集連接跨階段局部模塊
如圖5(c)所示,在CSP模塊中輸入特征圖首先經過一個1×1卷積模塊,然后進入主分支和跨階段連接分支。在主分支中,特征圖先通過一個3×3卷積模塊,然后經過3個串聯的殘差模塊,最后與來自跨階段連接分支的輸出進行通道拼接并通過一個 1×1卷積模塊進行特征融合。
如圖5(d)所示,在提出的DCSP模塊中,殘差模塊之間的關系不再是單純的串聯,每一個殘差模塊能接收到它之前所有殘差模塊的輸出,且最后一個殘差模塊的輸出將會與前面的殘差模塊的輸出再次進行融合以作為主分支的輸出。在文獻[22]中,數據融合的方式為通道維度的拼接。當串聯的殘差模塊比較多的時候,殘差模塊內負責處理通道拼接后特征圖的卷積核的輸入通道數會相應增加,從而導致參數量顯著增加。因此采用對應元素加和的方式,在保證模塊提取特征能力的基礎上減少了參數量。
2.1.3 檢測頭設計
2.1.3.1 無錨框機制
YOLOv3針對骨干網絡輸出的3個尺度的特征圖預設了對應的錨框,在訓練前需要針對數據集的標注框的尺寸分布情況對預設錨框進行微調,再基于檢測頭的輸出對錨框進行偏移修正來得到最終的預測框。由于特征圖中的每一個特征點會對應多個比例的預設錨框,全局的預設錨框數量遠遠超過真實框數量,造成正負樣本不平衡的現象,從而影響檢測精度。為避免上述問題,本文采用無預設錨框機制,直接使用檢測頭回歸得到目標預測框的位置及尺寸。
2.1.3.2 解耦檢測頭
YOLOv3對目標的檢測置信度、分類以及目標預測框的位置、尺寸的微調回歸是基于同一個檢測頭實現的。本文提出使用任務解耦多檢測頭來實現上述操作,對目標分類標簽、目標檢測框的位置和尺寸、檢測置信度三類參數值的回歸分別使用獨立的卷積支路,如圖6所示。使用任務解耦多檢測頭能夠幫助減少不同參數回歸任務之間的相互干擾,從而提升檢測精度。

圖6 解耦檢測頭
在圖6中,w和h分別為特征圖的寬和高,c為數據集的目標類別數,檢測框的維度中4對應預測框的中心點的橫縱坐標和預測框的寬高,置信度表示對預測框內存在目標的確定程度。
2.1.4 檢測模型整體結構
基于上述結構改進和設計,提出的目標檢測算法模型的整體結構如圖7所示。模型的輸入圖像的尺寸為640×640×3,骨干網絡輸出的3個特征圖的尺寸分別為80×80×192、40×40×384以及20×20×768。3個特征圖經過頸部結構進行特征強化后,進入檢測頭中進行目標分類標簽和預測框的回歸。

圖7 提出的檢測算法模型的整體結構
在頸部結構中,3號深層特征圖首先進入一個CLS模塊進行特征圖跨通道特征融合并壓縮通道數為原來的一半,然后通過雙線性插值實現上采樣;經過上述調整后的3號特征圖尺寸與2號特征圖一致,因此它們可以進行通道拼接的方式合并,然后通過提出的DCSP模塊進行跨尺度特征加強融合。融合后的特征圖以同樣的方式再與來自淺層的1號特征圖進行再次特征融合。經過上述特征金字塔結構的處理,頸部結構加強了特征圖中目標的語義特征,提升了多尺度目標檢測能力。
特征金字塔輸出的3個尺度特征圖融合結果的尺寸為80×80×192,它將用于兩方面:一方面通過提出的MBCA模塊進行通道間特征差異性強化后,輸送給1號檢測頭;另一方面進入路徑聚合結構[23],首先通過層歸一化和尺寸為2×2步長為2的卷積核進行下采樣,與此前特征金字塔中2號、3號特征圖語義強化融合結果進行再次融合得到尺寸40×40×384的輸出。來自骨干網絡深層的小尺寸特征圖攜帶了較多的目標語義特征,而來自淺層的大尺寸特征圖攜帶了較多的目標位置特征,因此路徑聚合結構中的特征圖融合能夠幫助強化目標的位置特征。類似地,路徑聚合結構中的另外2個尺度的特征圖融合結果經過MBCA模塊進行通道間特征差異性強化后輸送給對應的檢測頭。
2.1.5 檢測結果后處理
后處理操作用于優化在檢測頭輸出的檢測結果中單個目標對應多個重復檢測框的情況。借鑒文獻[24]提出的加權非極大值抑制操作,提出在處理網絡輸出的多個互有重疊檢測框時,對交并比值超過預設閾值的檢測框坐標進行加權平均,實現如式(2)所示:
(2)
式中:P為當前處理的檢測框;Ti為與P重疊的其他檢測框;權重wi定義如式(3)所示:
wi=cifIoU(P,Ti)
(3)
式中:ci為P的最大分類置信度;fIoU(P,Ti)為P和Ti的交并比,即交集與并集的比值,如式(4)所示:
(4)
2.1.6 損失函數
目標檢測網絡模型的損失函數包含分類損失,置信度損失以及預測框回歸損失。
二值交叉熵(Binary Cross Entropy, BCE)函數常用于分類和置信度的損失函數,其定義如式(5)所示:
(5)
式中:xn為檢測值;yn為樣本值。
數據集中普遍存在各分類目標數量不均衡的現象。為了減少該現象對檢測精度的影響,提出使用焦點損失(Focal Loss, FL)函數替代BCE函數作為分類和置信度的損失函數[25]。焦點損失函數定義如式(6)所示:
fFL(p)=-f(α)[1-f(p)]γln [f(p)]
(6)
式中:權重因子f(α)用于平衡目標和背景數量的不平衡,當處理對象為目標時f(α)=α,當處理對象為背景時,f(α)=1-α,常數α設定為0.3;[1-f(p)]γ用于平衡難識別樣本和易識別樣本數量之間的不平衡,f(p)定義如式(7)所示:
(7)
p為網絡檢測y=1時的置信度,p∈[0, 1],y為樣本真值。
式(6)可以解決2個不平衡現象所帶來的影響,一個是目標和背景數量之間的不平衡,另一個是難識別樣本和易識別樣本數量之間的不平衡。
廣義交并比(General Intersection over Union, GIoU)函數常作為預測框回歸損失函數,其定義如式(8)所示:
(8)
式中:A和B分別為檢測框和真值框;C為二者的最小外接矩形框。
使用完全交并比(Complete Intersection over Union, CIoU)函數替代GIoU函數,相比GIoU函數,CIoU函數作出了以下改進:考慮了檢測框和真值框幾何中心之間的距離;考慮了檢測框和真值框的寬高比。CIoU函數如式(9)所示:
(9)
式中:ρ(A,B)表示檢測框A和真值框B的幾何中心之間的距離;c為二者的最小外接矩形框的對角線長度;α為平衡系數,定義如式(10)所示:
(10)
υ為比例系數,
(11)
w′和h′分別為真值框的寬和高,w和h分別為檢測框的寬和高。
設定訓練周期為200,訓練批數量為8;優化算法為Adam算法,權重衰減因子為5×10-4;初始學習率為0.001,學習率更新策略為步進衰減,衰減因子為0.1,衰減周期為20個訓練周期。
基于多次野外演訓試驗中使用觀測設備拍攝得到的引信炸點火光圖像制作了數據集,其中用于神經網絡訓練的訓練集樣本量為4 000,用于驗證神經網絡性能的測試集樣本量為1 000。數據集共有 3種目標類別,即類別1、類別2、類別3,其中類別1指1個炸點火光,類別2指相距很近互有重疊的 2個炸點火光,類別3指相距很近互有重疊的3個炸點火光。
對數據集目標的標注框的信息統計如表1所示。表1中,目標總數表示整個數據集含有的該類目標的總數,面積占比表示目標的標注框的面積與整張圖像的面積的比例,它反映了圖像中目標大小的相對尺度。從表1中可以看出,類別1的面積占比變化范圍為0.10%~11.04%,類別2的面積占比變化范圍為1.27%~6.94%,類別3的面積占比變化范圍為2.14%~10.87%,上述數據說明數據集目標尺度分布較廣,因此對檢測模型的多尺度檢測能力具有較高的要求。

表1 數據集目標標注真實框信息統計
為了增加檢測模型的泛化性能,補充數據集中目標的形態多樣性,對數據集進行了隨機數據增強。數據增強方式包括:銳化、對比度調節、模糊、添加色塊、色調變換、翻轉、重復、扭曲等,如圖8所示。隨機抽取訓練集中200個樣本,每個樣本使用多種任意疊加的數據增強方式,擴增比為1∶5,因此得到 1 000張數據增強的結果作為訓練集的補充樣本。

圖8 數據增強示意圖
目標檢測算法常用的評價指標包括準確率、召回率、平均精度、F1分數,各指標定義分別為:
1)準確率。準確率表示檢測模型輸出的所有檢測結果中正確的目標數量所占的比例,如式(12)所示:
(12)
式中:mp表示準確率;t表示檢測正確的目標數量;f表示將非目標檢測為目標的數量。
2)召回率。召回率表示檢測正確的目標數量占數據集中所有目標的比例,如式(13)所示:
(13)
式中:mr表示準確率;h表示數據集中沒有被檢測出的目標數量。
3)平均精度。神經網絡的輸出包括檢測框坐標和檢測置信度,一般通過設定置信度閾值來過濾掉置信度較低的結果。設定低置信度閾值可以保證檢測出數據集中一些特征相對不明顯的目標,但是也會導致將一些非目標誤認為目標的錯檢測情況;設定高置信度閾值可以降低錯檢測情況出現的概率,但是會出現低置信度目標的漏檢。
設置不同的置信度閾值,可以得到對應情況下的準確率和召回率。對于單個類別的目標,它的準確率-召回率(Precision-Recall, PR)曲線的積分被稱為檢測精度,如式(14)所示:

(14)
式中:SAP表示單個類別目標的檢測精度。對于一個數據集,其所有類別目標的檢測精度的平均值稱為平均精度。平均精度反映神經網絡檢測模型對于一個數據集的綜合檢測性能。
4) F1分數。F1分數綜合考慮了準確率和召回率,如式(15)所示:
(15)
為了驗證本文提出的結構改進措施對檢測網絡性能的影響,以圖7所示網絡結構為比較基準,使用相同的網絡訓練策略,進行了2組消融實驗,并使用上述指標來評價模型的性能。
第1組消融實驗用于驗證骨干網絡和檢測頭的改進設計對于檢測模型檢測性能的影響。該組實驗對比測試了基于DarkNet53骨干網絡和ConvNeXt骨干網絡下檢測模型的性能變化,以及基于耦合單檢測頭和解耦多檢測頭下檢測模型的性能變化。實驗中各檢測模型的評估結果如表2所示,各檢測模型的PR曲線圖如圖9所示。需要說明的是,為統一比較基準,表2數據是在置信度閾值為50%的條件下計算得到的,且平均精度一欄的數據是在預測框與真值框的交并比閾值為0.5的條件下計算得到的。后續實驗指標計算條件均與此保持一致。

表2 骨干網絡和檢測頭改進設計對模型性能的影響

圖9 骨干網絡和檢測頭改進設計消融實驗中檢測模型的PR曲線
分析表2數據可知:骨干網絡由DarkNet53(模型1)更換為ConvNeXt(模型3)后,平均精度由74.7%上升到79.8%,F1分數由59.8%上升到65.7%;檢測頭由單檢測頭(模型2)更換為多檢測頭(模型3)后,平均精度由76.9%上升到79.8%,F1分數由55.6%上升到65.7%。
通過比較圖9中各模型PR曲線的積分值,即PR曲線與坐標軸包圍的面積,可知模型3的PR曲線的積分比模型1或者模型2更大,所以模型3的檢測精度更高。
對表2和圖9的分析表明,在對骨干網絡和檢測頭進行改進設計后,模型的檢測精度得到了明顯的提升。采用了改進設計的模型3作為基線模型,它將作為第2組消融實驗中的比較基準。
第2組消融實驗用于驗證在頸部結構中使用改進措施對于檢測模型檢測性能的影響。實驗測試了在檢測模型的頸部結構中使用MBCA模塊和DCSP模塊對模型檢測性能帶來的影響。實驗結果如表3所示,各檢測模型的PR曲線圖如圖10所示。

表3 頸部結構改進措施對模型性能的影響

圖10 頸部結構改進措施消融實驗中檢測模型的PR曲線
在表3中,在DCSP模塊列中,√表示檢測模型的頸部結構使用提出的DCSP模塊,否則使用CSP模塊;在MBCA模塊列中,√表示檢測模型按照圖7所示在模型的頸部結構和檢測頭結構之間使用MBCA模塊,否則不使用MBCA模塊而直接相連。分析表3數據可知,在不對頸部結構使用改進措施時,本文提出的檢測模型基線模型(模型3)對目標的召回率為57.2%,遠小于使用了改進措施的模型4、模型5、模型6,其原因在于樣本圖像中常伴有煙霧和自然光干擾,并且有時出現的多炸點目標重疊等現象,導致檢測模型對炸點目標邊界難以區分、目標分類模糊等識別困難問題。在將頸部結構中CSP模塊替換為DCSP模塊,以及在檢測頭結構前添加MBCA模塊后,模型的召回率得到很好的提升,分別提升了27.8%和27.4%。就平均精度和F1分數兩個綜合指標而言,使用MBCA模塊比使用DCSP模塊對模型的綜合檢測性能的提升稍高。同時應用 2種改進后,模型的平均精度達到了92.7%,F1分數達到了87.4%。
從圖10可以看出,基線模型的PR曲線在使用頸部結構改進措施后,PR曲線與坐標軸包圍的面積有所增長,使用2項改進措施的模型6 PR曲線的面積在第2組消融實驗的4個模型中達到最大。上述分析表明,提出的2項頸部結構改進措施顯著提升了模型檢測性能。
表4展示了表3中模型3和模型6在驗證集的4個樣本上的檢測結果,樣本包含了遠距離較小目標和近距離較大目標的不同情況。由表4可以看到:在基線模型未使用改進措施時,容易出現檢測置信度較低和漏檢的現象;而在使用改進措施后,目標的檢測置信度也有了明顯的提升,并且漏檢現象得到了明顯的改善。通過對比檢測結果,本文提出的改進措施被證明是有效的。

表4 檢測模型頸部結構改進前后的檢測結果對比
圖11以熱力圖的形式展示了模型6使用的 2種頸部改進結構對骨干網絡輸出的3個不同尺度特征圖的特征強化效果,以及最終檢測結果。其中特征圖1、特征圖2、特征圖3對應圖7中所示3個不同尺度的特征圖。特征圖中紅色區域表示特征激活狀態,該區域的特征表征強度較高;藍色區域表示特征抑制狀態,該區域被認為不含關注目標所以特征表征強度較低;黃色和綠色為激活和抑制狀態之間過渡的中間狀態。

圖11 頸部改進結構對特征圖的強化效果
骨干網絡輸出的分辨率較高的特征圖1中特征激活區域分布較為零散,但反映出的目標位置信息相對準確。隨著網絡深度的加深,骨干網絡輸出的特征圖2和特征圖3逐漸將目標區域聚合并作為一個整體識別出來,即特征圖中的語義特征逐漸得到強化。骨干網絡輸出的3個特征圖中存在不同面積和強度的黃色和綠色非目標區域,它們對目標的區域和語義的判定存在干擾。在經過提出的DCSP模塊和MBCA模塊的特征強化后,3個特征圖中干擾區域均得到了有效抑制,突出了目標區域,但同時目標區域的特征強度也受到了一定程度的削弱。容易發現,特征圖3在經過MBCA模塊處理后部分目標區域的特征強度被弱化。經過MBCA模塊處理后,3個特征圖分別進入對應的檢測頭,進行多尺度綜合預測,因此特征圖3損失的目標區域特征強度將由特征圖1和特征圖2進行補償。在圖11中,可以看到最終模型準確完整地檢測出圖中所有的炸點目標。
對比實驗將本文提出的檢測模型與現有的檢測模型進行比較,其中包括更快速區域卷積神經網絡(Faster RCNN)、單階段目標檢測器(Single Shot Detector,SSD)、YOLOv3、YOLOX模型,比較均基于提出的數據集,結果如表5所示。在表5中,本文模型指表3中使用了所有改進措施的模型6。

表5 基于提出數據集的不同檢測模型性能比較
從表5數據可知:YOLOX模型的準確率最高,達到87.9%;其次是本文模型的準確率,達到87.3%,相比最低水平的Faster RCNN模型超出38%;召回率較高的是本文模型以及Faster RCNN模型,相比最低水平的YOLOv3模型分別超出47.8%和43.8%;本文提出的模型的平均精度達到最佳水平,領先第2名YOLOX模型約6%;同時,F1分數也達到最佳水平,領先第2名YOLOX模型約7.7%。
上述分析證明了本文提出的檢測模型相比其他主流檢測算法模型具有更加優秀的檢測精度,更適用于關注的任務場景。
本文在分析任務場景的基礎上,提出一種新的單階段圖像目標檢測神經網絡算法,用于野外真實戰場環境下的無線電近炸引信炸點圖像目標檢測。通過對檢測算法改進設計的原理分析,并使用野外真實戰場環境下獲取的引信炸點圖像數據集進行驗證。得出以下主要結論:
1)使用ConvNeXt網絡作為骨干網絡來提取圖像目標特征并輸出特征圖,得益于大尺寸卷積核帶來的大感受野和多種正則化技巧,模型平均精度相比使用DarkNet53作為骨干網絡提升了6.83%。
2)基于無錨框機制,使用多檢測頭結構相比單檢測頭結構,使模型平均精度提升了3.77%。
3)將帶通道注意力機制的多分支(MBCA)模塊應用在頸部結構中以實現多尺度特征圖通道間的特征差異性強化,使模型平均精度提升了13.66%。
4)將密集連接跨階段局部(DCSP)模塊應用在頸部結構中以加強其特征強化能力,使模型平均精度提升了11.03%。
5)綜合上述改進措施,最終改進模型的平均精度達到92.7%,F1分數達到87.4%,檢測性能超過其他主流檢測模型。
總之,提出的目標檢測算法能完成高精度引信炸點檢測任務,表明基于深度學習實現炸點觀測與檢測自動化應用是可行的,這對引信抗干擾性能研究與試驗優化具有一定的推進作用。