周 洋,李翠梅,申 攀
(鄭州科技學院,河南 鄭州 450064)
人工檢測這種耗費勞動成本,且隨時間人為錯誤不斷疊加的傳統方法,已不適合對目標進行精準檢測[1–3],亟需一種更為高效的特征提取方法進行自適應地智能分析與處理。目前學術上較為常見的特征提取方法,多是利用深度卷積神經網絡展開,并在實踐中取得了較為理想的成效。然而該方法在訓練時,需要大量已標注的圖像數據。同時,由于特征提取模型過度依賴龐大的數據集,其只能針對檢測訓練數據中出現的目標類別,對新類別目標的檢測能力很低。
因此,為了實現艦船圖像輪廓特征提取的高效性及準確性,需要對目標的類別判定與定位回歸兩方面進行優化改進。在艦船圖像特征提取上,尋求一個準確的目標匹配方法與區域定位機制,由此提升艦船小樣本特征提取模型的準確率和泛化性能,并在有干擾樣本的檢測環境中,使其仍能獲得較為準確的檢測結果。本文基于小樣本學習的深度神經網絡對艦船樣本量較少的數據集進行訓練,獲得一個自適應、高效的小樣本特征提取模型,并針對特征向量在度量過程產生的信息丟失與偏移問題,設計一種艦船圖像輪廓特征投影提取的方法,由此實現對特定艦船目標的輪廓特征進行精準檢測,滿足小樣本特征提取的現實需求[4–5]。
基于深度學習的特征提取算法,如圖1 所示。按步驟輸出待測圖像的目標分類得分(通常為置信度得分和回歸得分)與檢測框圖,一般可完成對待測圖像的特征提取任務。雙階段特征提取流程包含特征提取、特征分類和輸出等步驟,而單階段特征提取流程直接進行特征提取與回歸,利用NMS 去除冗余框后輸出目標的檢測得分與位置框圖。

圖1 基于深度學習的特征提取算法流程Fig. 1 Target detection algorithm flow based on deep learning
然后,再完成整個模型的訓練與優化,使得模型的預測結果更加接近真實結果。
使用卷積神經網絡對待測圖像進行特征提取與分類回歸任務,卷積神經網絡主要由卷積(convolution)、激活(activation)和池化(pooling)3 個部分構成,當前較為經典的特征提取算法都是由多個基礎的卷積神經網絡組合而成。
在計算機視覺中,對特征提取所使用的卷積一般為2D 卷積,在x和y兩個方向上進行滑動,且卷積核的深度等于輸入特征的通道數。卷積即使用卷積核的權重與目標區域上對應數值進行乘積的和,卷積的數學表達式為:
式中:a 和b分別為卷積核的大小,wi為卷積核對應第i個元素的權重,xi為輸入圖像對應第i個元素的值,y為卷積的偏置大小。卷積核的數量決定了待測圖像進行卷積操作后輸出的特征層數。同時,根據任務需求自行設定卷積核的尺寸與滑動步長,調控輸出特征圖的大小,輸出特征圖尺寸的數學表達式為:
當卷積核的尺寸大于1 時,輸出艦船圖像輪廓特征的尺寸保持不變,可以使用尺寸為1×1 的卷積核來改變特征圖的通道數,也可使用填充(padding)方法對特征圖外圍補0 值來擴充。其數學表達式更新為:
式中:padding 為特征圖外圍補0 的層數。卷積后通常使用非線性激活函數(activation function)激活卷積網絡,激活結果為:
式中,h為使用的激活函數。sigmoid 函數輸出范圍為0~1,函數表達式為:
其輸出中心不在0 附近,會出現梯度彌散現象。Tanh 函數輸出范圍為-1~1,函數表達式為:
其中心值在0 附近仍存在梯度彌散的現象。ReLu函數輸出范圍為0 到正無窮,函數表達式為:
較少的計算量與較寬的梯度響應區間使得ReLu 函數得到廣泛應用。
激活卷積網絡后,通常使用池化(pooling)來降低特征圖的空間尺寸,進而提取特征圖中的主要信息,減小輸出特征圖的數據量,防止卷積網絡出現過擬合現象。常用的池化方法有最大池化與均值池化。最大池化是保留一個空間內所有數值的最大值,均值池化是保留一個空間內所有數值的均值。
卷積神經網絡的訓練誤差通常需要一個損失函數,衡量經卷積神經網絡輸出的結果和真實結果之間的差距。一般情況下,損失函數的數值越小表明其網絡性能越符合預期。面向不同任務所使用的損失函數類型差異較大,分類任務常用的損失函數為交叉熵損失函數,其表達式如下:
交叉熵損失函數對置信度較高但分類錯誤的值進行更大的懲罰。回歸算法中常用的損失函數為均方誤差損失函數,其表達式如下:
如圖2 所示,SSD 使用VGG 卷積神經網絡提取圖像特征,其網絡可獲取更多細節的語義信息,并提升模型對多尺度目標的檢測性能。
為測試樣本量對特征提取模型的性能影響,通過實驗驗證SSD 在不同樣本量情況下的檢測性能。實驗使用控制變量法,只改變每次訓練的圖像數量,其他變量均保持不變。實驗參數設置如下:學習率為0.000 5,batch size 為16,最大迭代輪數為50。實驗共進行7 輪,使用VOC2007 數據集,選取不同數量的待測圖像,且每幅圖像標注的目標個數也不同。訓練時,樣本圖像隨機從數據集中選取。測試時,每一輪均選用相同的100 幅圖像進行測試,且測試圖像均參與訓練過程。實驗使用的評價指標為mAP,準確地反映模型的檢測性能。實驗結果如表1 所示。

表1 SSD 在不同圖像數量訓練下的檢測性能Tab. 1 Detection performance of SSD in different image number training
觀察發現,當圖像數量為10 時,其實驗結果mAP 為0,說明模型在樣本量極少的情況下,無法提取和學習到目標特征,故無法檢測到目標。當圖像數量從20 逐漸增加時,mAP 隨樣本量的增加逐漸增大,表明SSD 的檢測性能隨樣本量的增加而逐漸增強。
假設一任務中,最優解為S1,設計模型的理論最優解為S2,設計模型的實驗最優解為S3,且在實際生活里的特征提取任務,其S1與S2均無法準確得到,只能通過實驗獲得最佳的S3。在樣本量充足的情況下,訓練得到的S3可近似看作S2;當樣本量較少時,S3與S2的距離會逐漸拉大,表明較少的樣本量會限制模型的檢測性能,無法充分表現其檢測效果。如何利用少量樣本進行特征提取,是本文的研究重點。
語義分割任務,是將樣本數據集分為支持集和查詢集,再與查詢樣本的特征數據關聯匹配,進而獲得查詢圖像的類別信息。該算法通過不斷增強分類的細粒度,提升網絡的語義分割性能,獲得良好的小樣本特征提取性能。遷移學習算法利用源數據集充足的樣本量,通過深度神經網絡多次訓練獲得較好的特征提取性能,將訓練完成的模型或知識遷移至小樣本的新類數據集中,通過網絡訓練獲得適應小樣本新類的目標分類器。
基于以上檢測方式,對艦船圖像輪廓特征進行分類。
1)圍繞30 張艦船圖像小樣本進行輪廓特征的向量分析。在此過程中,為了規避出現諸如各艦船圖像輪廓特征的相互干擾,特對搜集的樣本量進行特征拆解,并基于相似性度量檢測方法對其各投影子空間進行正交化處理。
2)通過對艦船圖像輪廓特征的小樣本模型進行反復訓練,不斷優化損失函數,在實際操作中可以迭代出艦船圖像輪廓的特征相似性,并基于損失函數提升子空間的類間差異性,從而增強其檢測類別概率,提升檢測方法的抗干擾能力。
分類模型實現的具體步驟如下:
首先,將本次搜集的艦船圖像輪廓特征導入到訓練好的網絡ResNet-18 中,得到相對應的輪廓特征向量f(xi),并計算第m類艦船圖像對應的輪廓特征均值:
基于上式,獲得第m類圖像的去均值集合:
采用主成分分析法對全艦船圖像輪廓特征樣本進行分解,得到對應的映射矩陣與投影子空間的轉換公式:
對艦船圖像輪廓特征樣本類別的投影子空間進行正交化處理,計算得出投影子空間的平方歐式距離:
式中,f(q)為查詢圖像的特征向量。在對圖像的類別進行分析時,計算查詢圖像q與每個投影子空間的距離,并借助softmax 函數計算出了艦船圖像輪廓特征屬于第m類圖像的概率:
最終,基于ResNet-18 網絡,實現對艦船的圖像輪廓特征的動態子空間分類。
采用ResNet 對搜集到的相關圖像進行特征輪廓提取,經整理后,其網絡結果如表2 所示。

表2 ResNet-18 網絡結構Tab. 2 ResNet-18 Network architecture
按照圖3 所示的正交化處理方式,基于前文相關數據對艦船圖像輪廓特征樣本構建動態子空間,得出協方差矩陣公式。

圖3 動態子空間正交化示意圖Fig. 3 Diagram of orthogonalization of dynamic subspaces
通過損失函數的參數回傳與優化,借助格拉斯曼數對艦船圖像輪廓特征各類子空間的差異性進行計算,得出距離度量公式:
通過損失函數的迭代最大化,對艦船圖像輪廓的各子空間差異化特性進行提取,由此提升特征提取方法的泛化能力。
關于交叉熵分類的損失函數為:
關于子空間的損失函數為:
將二元損失函數視為總損失函數,通過平衡損失函數前后項的量級與收斂速度,得出最終的二元損失函數為:
基于以上函數結果,將艦船圖像的樣本數據集進行訓練與優化,得出其輪廓特征的高效分類模型。
本文基于子空間投影對艦船圖像輪廓特征進行提取,通過動態正交化處理,經驗證可以提升子空間的特征差異性,完成對艦船圖像的輪廓特征的提取。