李晨瑄,胥輝旗,錢 坤,鄧博元,馮澤欽
(1.海軍航空大學, 山東 煙臺 264001; 2.中國人民解放軍91900部隊, 山東 青島 266041)
艦船目標是現代化海戰探測與偵察的重要目標。精確檢測艦船目標有利于指戰員獲取軍事情報、調整火力部署,有助于海洋權益的維護與海軍戰略的實現。基于圖像的艦船目標檢測技術依據圖像特征判定是否存在艦船,同時實現艦船定位。當前我國海域多使用自動識別系統(automatic identification system,AIS)檢測艦船,艦船航行的安全性得到提升,但AIS受氣候、海雜波等噪聲信號干擾大。高質量感光元件與圖像處理技術的飛速發展,有效促進了基于深度學習的艦船目標檢測技術的發展。
傳統的目標檢測算法特征需人為設計,傳感器成像受大氣散射、雨霧遮擋等干擾嚴重,復雜多變的背景環境對艦船目標檢測造成了巨大挑戰。將深度學習用于艦船目標檢測任務,能夠提升復雜背景下艦船檢測準確率,為實時、準確、魯棒性強的艦船目標檢測技術提供有力支撐。本文綜述了基于深度學習的艦船目標檢測研究進展,分析了當前存在的問題與可能的改進方向,并對艦船目標檢測未來發展趨勢進行展望,以期為該領域研究提供思路借鑒。
傳統方法計算簡單,但檢測特征針對特定場景設置,艦船目標檢測魯棒性不足。傳統基于灰度信息統計的檢測方法利用目標與背景的灰度差異分離目標,算法簡單易于實現,但云霧遮擋情況下算法適應性較差;基于視覺顯著性的方法借助像素對比度,凸顯圖像中顯著性區域,復雜背景下檢測效果較好,但對于密集艦船易造成大量誤檢,不適用高亮背景下的檢測任務;基于分類學習的方法提取艦船目標特征,較好適應了目標形狀、紋理等變化,檢測精度較高,但算法對特征提取要求高,運算開銷較大;基于模板匹配的檢測方法利用大量艦船樣本建立模板庫,較好提升了密集艦船目標的檢測效果,但過于依賴先驗知識,復雜背景與環境噪聲使得算法魯棒性有待提升。
算法將目標檢測框架分為兩個階段,首先生成可能包含檢測目標的一系列候選框,再基于篩選后的高質量候選框實現目標的分類與坐標調整。基于候選區域(Region of Interest,RoI)的代表性算法有R-CNN、Faster R-CNN與Mask R-CNN,算法流程如圖1所示。

圖1 基于候選框的檢測算法流程框圖Fig.1 Flow chart of detection algorithm based on RoIs
R-CNN[1]、Fast R-CNN[2]、Faster R-CNN[3]、FPN[4]、R-FCN[5]、Cascade R-CNN[6]等基于候選框的檢測算法,在RoI生成與特征提取方面的性能如表1所示。算法在COCO與VOC2007數據集上性能測試結果如表2所示。

表1 基于候選框的檢測算法性能

表2 基于候選框的檢測算法性能測試
Faster R-CNN令區域卷積神經網絡(regions with CNN features,R-CNN)與候選區域生成網絡(region proposal network,RPN)共享卷積層,降低了不同尺度錨框映射過程中的檢測誤差,改善了候選框對檢測速度的影響。卷積層共享使得深層卷積獲取到更高質量候選區,提升檢測精度。Mask R-CNN以Faster R-CNN為基礎,將檢測分支中的定位與分類分支與實例分割相結合,算法先生成區域建議框,再利用檢測分支獲得邊界框與掩膜,復雜度的提升導致訓練速度略有下降。基于候選框的艦船目標檢測算法精度較高,文獻[7]利用壓縮與激勵機制提升R-CNN檢測性能,使用編碼比例向量有效抑制子特征圖的信息冗余,提升了SAR艦船檢測性能;文獻[8]在Mask R-CNN的FPN中添加自下而上的短接結構,使用逐通道與空間注意力機制提升重要像素特征對應權重,可實現像素級別的艦船檢測與分割;針對樣本數據利用不充分的問題,文獻[9]利用生成對抗網絡進行特征變換,獲取多尺度與旋轉角的檢測圖擴充樣本,提升不同場景下艦船的檢測適應性,并結合在線難例挖掘去除正負比例限制,提升檢測精度;文獻[10]將場景分割功能引入檢測框架,使用邊緣概率加權合并方法結合檢測特征圖與非目標區域,有效排除非目標區的錯誤候選目標,較好地抑制了近岸相似物體對艦船檢測的干擾。
由于算法需處理大量候選框,框內的復雜背景信息不利于檢測準確度的提升。此外,候選框的設置易導致算法參數冗余,檢測精度較高但實時性有待提升。
基于候選框的目標檢測方法充分利用了預測框特征信息,具有較好的檢測性能,但繁重的預測框處理嚴重影響檢測速度的提升。基于回歸的檢測方法在檢測圖上等距采樣,作為錨框的中心,直接利用錨框與真實框實現目標的分類與坐標修正,精簡了預測框的處理與特征重采樣過程,檢測速度更快,但精度略有下降。其中具有代表性算法為YOLO、SSD等。YOLO將輸入圖像劃分為S×S個網格,若目標中心落入相應網格單元,該單元則負責相應目標的檢測。YOLO[11]直接利用卷積神經網絡回歸分類概率與邊界框,檢測實時性優勢凸顯,但對于小尺度目標定位精度有待提升。2018年提出的YOLOv3[12]引入了Darknet-53殘差網絡,較好緩解了深層網絡導致的梯度問題,利用Logistic改進Softmax實現了多標簽的目標檢測,提升了目標檢測精度。錨框機制與多尺度特征圖的引入,使得SSD算法對小目標的檢測性能更佳。SSD[13]對不同卷積層設置了不同數量與大小的錨框,當錨框與目標框重合率大于設定閾值時,即視為檢測正樣本。錨框機制與多尺度特征圖的引入,使得SSD算法對小目標的檢測性能更佳。基于回歸的目標檢測算法流程如圖2,算法性能如表3所示。

圖2 基于回歸的目標檢測流程框圖Fig.2 Target detection process based on regression

表3 基于回歸的檢測算法性能Table.3 Comparison of detection algorithm based on regression
針對遙感目標尺寸小、緊密排列艦船的高相似度導致檢測精度低的問題,文獻[14]將CReLU引入SSD的淺層網絡,利用FPN逐級融合深淺層特征圖,提升特征傳遞效率,有效檢測出碼頭下的密集艦船。文獻[15]選取Darknet-53作為主干網絡,利用深層特征融合豐富了語義信息,設計的新的二分類損失函數,改善了訓練過程中的難易樣本失衡,復雜場景下多尺度艦船檢測效果較好。針對大尺度遙感圖像中艦船目標檢測漏檢較多的問題,文獻[16]結合YOLOv3-tiny與特征映射模塊,增強了預測層獲取重要檢測特征的能力,對小尺度密集目標具有較高的檢測精度與速度。為提升模型的可移植性,文獻[17]利用堆疊的小尺度卷積充分提取圖像特征,改進了雙向密集連接模塊,提取高質量特征的同時降低了網絡復雜度,檢測模型能夠以較少的內存與計算成本實現較高的檢測精度。
錨框設計是目標檢測的重點。針對像素點少的小目標,要設置合適尺度與長寬比的錨框,衡量計算量與錨框數的平衡,避免引入過多參數導致算法成本提升。針對形態、尺度多變以及輪廓模糊等情況,利用特征金字塔、密集連接等可有效實現多分辨率艦船目標的特征提取。針對近岸背景碼頭、建筑物以及海岸干擾問題,采用注意力機制能夠較好改善復雜環境下的噪聲干擾,使檢測準確度得到提升。
基于候選框的艦船目標檢測方法檢測效果較好,但仍存在以下問題:一是需生成大量的候選框,用以篩選出與真實框重合程度更高的候選框,導致正負樣本不均衡,不利于算法收斂;二是候選框需人為設定大量的超參數,超參數的設置很大程度上依賴檢測任務與適用數據集,手動調優較為困難。因此衍生了一系列不依賴候選框(Anchor-Free)的目標檢測算法。Anchor-Free算法包括基于角點的檢測方法與基于關鍵點的目標檢測方法。
(二)豐肚法。這種方法實際上就是先提供給學生寫作框架,隨后在教師的引導下,學生自行完善和豐富框架內容,達成寫作教學目標。這種方法主要用于初次接觸寫作學習的學生。
基于角點的Anchor-Free檢測網絡如CornerNet[18]、CornerNet-Squeeze[19]等。算法將目標邊界框確定為一對關鍵點,通過檢測角點特征實現目標的歸類與定位。CornerNet首先預測目標框左上角與右下角關鍵點,再預測嵌入向量,使屬于同類物體對應角點間的嵌入向量達最小值,最后使用偏置L1損失微調角點位置。CornerNet算法中的角點池化提升了角點的定位精度。CornerNet- Squeeze提出了新的緊湊型沙漏網絡,利用1×1的卷積與深度可分離卷積降低了通道數與運算量,使CornerNet- Squeeze具有較高的檢測速度與準確度。基于中心點的Anchor-Free檢測方法原理為:算法預測特征圖中每個位置屬于中心點的概率,利用特征熱力圖確定目標邊框,最具代表性的為CenterNet[20]。由于無需候選框的設計與非極大抑制等操作,Anchor-Free算法檢測性能大幅提升。Anchor-Free檢測算法性能如表4所示。
文獻[21]提出了一種端到端的全卷積Anchor-Free網絡,預測船頭、船尾以及艦船中心3類關鍵點及角度,利用關鍵點生成艦船包圍框,引入了特征融合與特征增強模塊,對于雨霧遮擋、鄰近船舶干擾具有較好檢測魯棒性。文獻[22]在CenterNet基礎上設計了兩個優先分支,分別用于降低假陰性與假陽性樣本數,并結合雙向特征金字塔與YOLOv3檢測網絡顯著提升了相似并排船舶的檢測精度,實時性較好。針對訓練過程中的過擬合,圖像多尺度變化導致計算成本過高等問題,文獻[23]提出了具有密集注意力機制的Anchor-Free網絡,使用密集注意力特征聚合獲取高分辨率特征圖,通過密集連接與迭代融合提高網絡的泛化性能,此外,空間與通道注意力機制的引入能夠增強目標顯著性特征,對背景雜波具有較好的抑制效果。

表4 Anchor-Free目標檢測算法性能
艦船成像多為長矩形,大長寬比的檢測框包含復雜背景噪聲較多。以傾斜矩形框表征艦船目標,定位更精確,可較好反映艦船目標的方向、尺度、長寬比等信息。文獻[24]利用雙分支回歸網絡獨立預測方向與其他變量,提出了基于空間變量的多級自適應池化,使算法提取更有效的艦船特征,有效提升了艦船定位與分類準確度;文獻[25]基于Mask R-CNN,利用船首與船尾檢測結果估計艦船方向并實現目標分割,再結合船首關鍵點與掩膜最小邊界確定艦船的最終方向;文獻[26]所提算法分別預測目標中心點、中心點偏移以及斜框尺度與方向,改進了非極大值抑制,使其對斜框具有更好的適應性。文獻[27]利用平衡特征金字塔改善多尺度艦船檢測效果,結合IoU挖掘負樣本,并采用具有平衡L1損失的旋轉區域檢測分支實現了復雜背景下的密集艦船目標檢測。
卷積神經網絡能夠有效提取艦船目標的深層語義特征,復雜場景下的艦船目標檢測任務適用性較好。有向艦船目標檢測方法在檢測多方向、大長寬比的艦船時,定位與識別效果更精確,同時對艦船數據集標注要求更高;算法同時回歸艦船類別、位置與旋轉角導致檢測效率提升困難。
基于候選框的檢測方法計算候選框與真實框的重合率,利用重合率較大的候選框識別與定位目標,大量候選框的引入提升了目標的檢測效果,但實時性不足。基于回歸的檢測方法檢測速度顯著提升,但小型艦船目標占據多個網格的概率低,導致算法對小目標的定位準確性較差。Anchor-Free算法不依賴錨框,利用卷積神經網絡直接完成圖像輸入、關鍵點提取、位置回歸與尺度預測,參數設置更靈活,兼具檢測準確性與實時性優勢。有向艦船檢測方法在實現艦船分類的同時,回歸艦船的位置與方向,輸出檢測信息更全面,算法功能得到擴展;由于神經網絡需要同時識別艦船類別、回歸艦船位置與方向,網絡復雜度提升,導致檢測速度略有下降。總體而言,檢測精度更高、實時性更好的有向艦船目標檢測算法具有巨大發展潛力。
艦船目標檢測任務不同,適用的深度學習目標檢測網絡不同。依據艦船目標圖像數據來源,可將艦船目標檢測數據集劃分為基于光學遙感圖像的艦船數據,以及基于SAR圖像的艦船數據,常用數據集如表5、表6。

表5 光學遙感艦船圖像數據集

表6 SAR艦船圖像數據集
復雜戰場環境下準確檢測艦船目標有利于提升武器裝備作戰效能,但基于深度學習的艦船目標檢測算法多停留在理論層面,實際應用性能有待提升,主要存在問題為:
1) 遙感圖像檢測效果受氣象條件影響大,云霧遮擋易導致目標漏檢;SAR艦船檢測效果受靠岸、相似外觀散射體干擾強烈。復雜背景的簡單融合化處理對檢測性能的提升有限,如何設計魯棒性強的特征提取器,應對多角度、多尺度以及復雜岸島背景下的艦船檢測任務是研究重點。
2) 已有檢測模型多依賴遷移學習,將大型數據集的預訓練權重植入網絡,再針對任務數據集進行微調。微調方法可改善光學數據集檢測效果,SAR成像機理與遙感圖像差異較大,簡單的參數調整不適應SAR艦船檢測,亟需設計針對性較強的訓練模式,提升SAR單通道艦船檢測算法收斂性與檢測準確性。
3) 武器裝備打擊效果受艦船姿態、命中點影響較大。現有算法仍將艦船視為點目標或整體目標標注,無法有效檢測與打擊雷達陣面、駕駛艙等艦船要害部位。
4) 海上艦船目標,尤其是獲取軍艦數據具有較大時間、空間上的局限性;復雜島礁背景、煙霧、角反射器等干擾信息嚴重阻礙檢測精度的提升;紅外圖像、遙感可見光圖像、SAR圖像等多角度全方位的艦船圖像數據仍然存在缺口,統一的艦船目標檢測標準尚未建立。
1) Focal Loss可用于改善小尺度艦船與復雜島礁背景導致的正負樣本不均衡問題,提升算法收斂效果。合理借鑒其他領域相關技術改善算法性能,如利用自然語言處理中的特征關系對檢測結果進行二次判讀。此外,特征金字塔、多尺度特征融合、注意力機制等模塊能夠優化卷積特征提取能力,可用于提升算法檢測精度。
2) 遷移學習等參數微調方法無法有效緩解過擬合,針對SAR艦船目標等對位置敏感的檢測任務,可使用隨機初始化從頭訓練SAR特定數據;或有效融合多模態數據,實現高質量的特征細分,從而提升檢測性能。
3) 準確、高效的艦船目標檢測技術能夠提升裝備的全方位態勢感知能力。設計魯棒性強的特征提取器,使算法具備艦船要害部位的精確檢測能力,解算當前命中點與任務打擊點的導引誤差,提升裝備精確打擊能力與毀傷效能。
4) 針對數據集目標單一、成像質量低等問題,可采用生成對抗網絡與超分辨率重建思想,基于已有數據生成高分辨率的艦船圖像,或用于遮擋、非完備艦船的特征重建,豐富訓練樣本的同時有助于艦船目標檢測效果的提升。
5) 加速算法落地,提升實際應用能力。利用無人車、無人機搭載任務平臺,構建圖像檢測與跟蹤系統,提升檢測模型在實際場景的適用性。合理配置嵌入式計算機,構筑實時性更好、移動性更佳、檢測性能更優的艦船目標檢測網絡,為精確制導武器的研制提供有力技術支撐。
針對復雜多變的海戰場局勢,高效、準確的艦船目標檢測技術有助于完善作戰平臺的全方位態勢感知能力、海戰場精確打擊能力,為武器裝備對海上艦船目標的精細化選擇與精確打擊提供重要技術支撐,符合現代高技術戰爭發展趨勢,具有重大應用潛力與戰略意義。
消除或減輕復雜環境影響是提升艦船目標檢測精度的重要途徑。針對氣象條件多變、海雜波干擾、傳感器誤差等,需采用針對性更強的檢測算法。在設計特征提取器時,要綜合考慮運算量與精度的平衡,采用卷積分解或改進特征聚合方式實現模型的輕量化;合理設置網絡的深度與寬度,避免過擬合等問題。在數據開放的可行性及信息處理技術的推動下,亟需建立公開的、具有一致性評價標準的艦船目標檢測數據,供當前及未來相關領域檢測算法的測試與評估。此外,快速發展的云計算技術將顯著增強計算機數據處理能力,有效推進質量更高、檢測效果更好、適用性更廣的目標檢測算法應用與項目落地。