湯永濤 林鴻生 劉 興
(1.海軍士官學校 蚌埠 233012)(2.南京航空航天大學 南京 210016)
我國沿海分布有大量港口,在國際形勢風云變化的情況下,港口的防御壓力巨大。敵對勢力可利用水下蛙人、機器人以及小型水下運載器等從水下趁虛而入,對重要設施進行破壞[1]。目前水下安全監視主要利用水聲技術對水下目標進行探測、分類、定位和跟蹤。但聲吶系統易受水下環境及目標屬性等條件制約,很難獲得準確、直觀的目標識別結果。相對于水聲而言,水下光學探測具有成像分辨率高、細節豐富、成像速度快等優點。因此,水下光學探測逐漸成為水下探測的一種有效輔助手段[1~2]。
但是,由于水和水體中的雜質對光信號存在著吸收、散射等效應,水下光學圖像普遍存在著對比度低、噪聲突出等問題[3~4]。這給水下目標的自動分類識別帶來困難。
深度學習在圖像分類識別方面表現非常出色。自 2012年Krizhevsky等提出AlexNet[5]以來,學者們開發出了多種用于分類識別的深度神經網絡結構,如 VGGNet[6]、GoogleNet[7]、ResNet[8]、ResNeXt[9]、NASNet[10]、EfficientNet[11]等。這些網絡結構在ImageNet數據庫上能得到很不錯的準確率(各種經典網絡在ImageNet數據庫測試集上的準確率見圖1(a))。但這些分類網絡在實際應用中存在兩個問題:一是用于訓練小型數據集時容易出現過擬合,因為它們都是針對大型數據庫進行設計的,網絡結構復雜,參數量巨大(見圖1(b));二是較難應用于移動設備,移動設備硬件性能受到限制,無法與服務器等大型硬件相比,這些大型網絡由于模型巨大,推理時間較長,在移動設備上應用會受到限制,實時性不能滿足要求?!?br>