





摘 要: 海洋工程的日常任務經常會利用水下航行器來探測水下環境,針對水下復雜環境采集的圖像目標容易出現局部特征信息丟失,導致漏檢、檢測精度低的問題,提出基于增強局部特征的水下目標檢測方法。在主干網絡采用Faster Block 增強圖像特征提取能力;利用歸一化注意力模塊抑制不顯著的特征信息來提高網絡的效率;構建集中特征增強金字塔池化模塊增強對水下復雜背景下目標局部特征信息的捕獲能力;改進損失函數提高網絡模型對水下圖像目標預測效果。實驗結果表明,該方法平均精度相較于原模型提升了1.5 百分點,網絡推理速度為36.4,能夠有效地提升水下目標的檢測精度。
關鍵詞: 深度學習; 目標檢測; 水下圖像; 部分卷積; 注意力機制; 局部特征
中圖分類號: TB9; TP391 文獻標志碼: A 文章編號: 1674–5124(2025)01–0151–08
0 引 言
傳統的水下目標檢測任務多運用光學圖像處理[1]的方法來實現,然而水下環境較為復雜,漏檢的情況較為嚴重,為水下檢測任務帶來了一定的困難。隨著計算機視覺的革新發展,基于深度學習的目標檢測算法被提出,逐漸成為水下目標檢測的重要技術。目前,基于深度學習的目標檢測算法主要分為兩階段(two-stage) 和單階段(one-stage) 兩大類。兩階段方法主要包括Fast R-CNN[2] 等,單階段方法有SSD( single shot multibox detector) [3] 和YOLO(you only look once)[4-5]。
近年來,研究學者提出了許多水下圖像目標檢測的方法。文獻[6] 提出了RolMix 的圖像增強方法,能夠解決同一候選框中出現多個水下生物的情況。文獻[7] 通過雙域數據擴充和YOLOv7 結合的方式,提高對小目標的檢測精度。文獻[8] 通過在YOLOv5 的頸部結構中添加三重注意力機制來提高特征提取能力,以便高效定位小目標的位置,提升檢測精度。文獻[9] 在YOLOv5s 的主干和頸部分別采用了Transformer 編碼器模塊和協調注意力模塊,構建TC-YOLO 模型來實現對水下目標精度的提升。
上述研究大多數是通過優化網絡以及增強全局提取特征能力來提升水下目標檢測效果,而對于復雜的水下環境,冗雜的背景會導致圖像遠端目標局部信息丟失,難以被模型捕捉,影響了水下目標的檢測效果??紤]以上問題,以YOLOv7 為基礎,提出一種增強局部特征的水下目標檢測模型YOLOv7-ELF(YOLOv7-Enhance Local Features)。
1 網絡基本模型
YOLOv7 算法的網絡模型主要由4 個模塊組成,分別為輸入端口(Input)、主干網絡(Backbone)、頸部網絡(Neck) 和檢測頭(Head)。輸入端口先對目標圖像進行預處理,并將640×640 大小的目標圖像輸入到主干網絡中。主干網絡是由高效層聚合網絡(efficient layer aggregation network, ELAN)、多路徑卷積( multipath convolution, MPConv)和若干個CBS( 包含了卷積Conv、批處理歸一化BN 和SiLU 激活函數三個部分)組成。之后,主干網絡會輸出三個特征層到頸部網絡進行特征融合,頸部網絡采用上采樣和下采樣結合的方式,能夠獲取不同尺度的特征信息。最后,檢測頭部分主要采用了大、中、小三種規格,通過三種不同尺度的預測結果,完成對檢測目標邊界框的錨定。
2 改進網絡模型
改進的網絡模型如圖1 所示,在ELAN 中利用Faster Block 構建了FB-EL(Faster Block-ELAN)模塊,能夠增強主干網絡的提取特征能力。同時,在主干網絡和頸部網絡之間構建了集中特征增強金字塔池化模塊,能夠有效減少光照昏暗場景下目標出現局部特征丟失的現象,引入的歸一化注意力模塊能夠增強頸部網絡在提取圖像特征信息時對有效目標的關注度,獲得更多關于小目標的信息。最后,利用WIoU(Wise-IoU)損失函數提升對水下圖像目標的預測識別能力。
2.1 FB-EL 模塊
針對當前ELAN 模塊中普通卷積推理速度的問題,結合FasterNet 網絡中的Faster Block [10],構建了FB-EL 模塊, 結構如圖2( a) 所示。FasterBlock 主要由部分卷積(partial convolution, PConv)和兩個1×1 的卷積構成,選擇了BN 和ReLU 函數用于模塊中,獨特的倒置殘差結構能夠增強圖像的特征信息,同時利用PConv 提升主干網絡特征提取和推理的速度,結構如圖2(b)所示。普通的Conv要在全部通道上應用濾波器,而PConv 能夠利用特征圖中的冗余,僅在一部分輸入通道上應用,且不影響其余通道。因此,在ELAN 模塊中加入FasterBlock 能夠很好地增強模型對于水下目標的識別能力,提高目標檢測的精度。
2.2 CFEPP 模塊
水下復雜的環境會引起檢測目標與其他形狀類似的物體混淆,造成局部特征信息丟失,導致檢測精度效果不佳和漏檢現象發生。為了解決這類問題,本文提出了集中特征增強金字塔池化模塊( concentrated feature enhancement pyramid module,CFEPP)模塊,結構如圖3 所示。