張 瑩,朱 晨,楊國亮
(江西理工大學 電氣工程與自動化學院,江西 贛州 341000)
包裹X光限制品檢測作為物流業及重點場所的重要安防措施,承擔著防止易燃、易爆等危險品,刀具、毒品等國家重點違禁品進入貨運渠道等工作。目前,安檢場所的包裹安檢工作是由經過專業培訓的安檢員來完成,但由于包裹內的物體擺放密集且存在重疊,致使X光安檢設備生成的圖像辨識困難,使得安檢員在判定包裹內的限制品時速度較慢,且辨別精度較低。
目前,計算機輔助識別X光中限制品的技術已被廣泛運用,但大多是基于傳統方式,如小波去噪[1]、圖像增強[2]等,提升效果有限。文獻[3]使用圖像建模的方法分離X光圖像的前景和背景,提升了圖像對比度;文獻[4-5]對目標建模形成立體化圖像,提高了安檢人員對部分重疊區域物體的識別能力。目前,關于限制品檢測在圖像處理、機器視覺等方面的深度學習日益得到普及[6-7]。基于此,本文提出一種用于包裹內密集重疊限制品檢測的Crowd-YOLOv3算法。
Crowd-YOLOv3算法基于YOLOv3算法[8]改進而成,主要對YOLOv3算法的FPN結構損失函數進行了優化。
YOLOv3算法在將主干網絡提取的特征信息進行檢測前,使用標準的FPN結構將深層特征圖中的語義信息復用至淺層特征圖中,用于提升算法對小目標的檢測效果。文獻[9]表明在FPN模型內部進行多樣的連接,有助于特征信息的復用,由此提出了NAS-FPN模型。本文針對YOLOv3算法的結構特點對NAS-FPN模型進行優化,將其嵌入到算法的主干網絡和檢測器之間,替換標準的FPN結構。
文獻[10]表明,算法的注意力可以通過調整對應目標在損失函數中的權值實現。Crowd-YOLOv3算法的側重點在于密集重疊區域的目標檢測,因此對圖像中的限制品重疊程度進行了判定。判定依據是數據集中標簽值給定的目標包圍框坐標值,使用IoG表示兩個目標的重疊部分與其中較小目標的面積比值,最終在標簽文件中使用密集程度值Crowd進行標注。判定算法如公式(1)所示:

Crowd值分別用0、1表示,其中0表示IoG≤0.6,1表示IoG>0.6。本文引入超參數αCrowd作為條件加權值,作用于原損失函數的位置損失和置信度損失部分。當Crowd為0時,αCrowd=1;當Crowd為1時,αCrowd=1.10。條件損失函數的應用使算法將更多的注意力投入到重疊程度較高的目標中,從而提升算法對密集目標的檢測精度。
本文分別采用YOLOv3算法和Crowd-YOLOv3算法對X光限制品圖像數據集進行測試,實驗環境為Ubuntu16.04系統,計算機語言為Python3.6,搭配PyTorch1.1深度學習框架與Nvidia GTX1070顯卡。
本文通過網絡獲取X光圖像限制品數據集,并對其中的數據進行清洗。數據集中的限制品有5類,分別是鐵殼打火機、黑釘打火機、刀具、電容電池、剪刀。清洗后的數據集中共有2 000張圖片,上述限制品對應圖片數量分別是1 222,2 426,2 113,2 668,2 023。數據集圖片按照9∶1的比例設置訓練集和測試集。
實驗中,YOLOv3算法和Crowd-YOLOv3算法的參數設定保持一致,輸入圖像的分辨率為416×416。每個算法訓練100個周期,優化方法采用隨機梯度下降法。訓練過程中,每批處理16張圖片,權值衰減為0.000 5,動量為0.9,使用Xavier方法進行參數的初始化設置。網絡的初始學習率為10-3,在第71訓練周期時,學習率調整為10-4;在第91訓練周期時,學習率降低至10-5,并保持至訓練結束。
本文在數據集的測試集中按照限制品的重疊程度選取了3張圖片,并分別用YOLOv3算法和Crowd-YOLOv3算法進行檢測。Crowd-YOLOv3算法和YOLOv3算法的檢測效果如圖1所示。

圖1 檢測效果對比圖
圖1中三幅子圖內限制物品的類別和數量關系見表1所列,YOLOv3算法和Crowd-YOLOv3算法識別結果見表2所列。結合表1和圖1可知,本文提出的Crowd-YOLOv3算法有效提升了YOLOv3算法在檢測密集、重疊目標時的性能。在圖1第一列中,Crowd-YOLOv3算法檢測到8個密集排列的電容電池,4個重疊的黑釘打火機,1個單獨的鐵殼打火機,對照標簽值,召回率達到86.67%,而YOLOv3算法的召回率僅為40%;在圖1第二列中,Crowd-YOLOv3算法仍無法檢測到與剪刀高度重疊的刀具,存在一定的局限性,但Crowd-YOLOv3算法的包圍框更精準;在圖1第三列中,Crowd-YOLOv3算法仍能檢測到單獨的限制物品,表明改進方法沒有影響Crowd-YOLOv3算法檢測單獨限制品的能力。實驗表明,本文提出的Crowd-YOLOv3算法能有效提升傳統算法的查準率和查全率,減少了限制品的漏檢和誤判現象。

表1 圖1中3幅子圖內限制物品的類別和數量關系

表2 YOLOv3算法和Crowd-YOLOv3算法識別結果
限制品檢測在安防行業應用廣泛。本文針對傳統限制品檢測方法的不足和YOLOv3網絡的缺陷,提出Crowd-YOLOv3算法。該算法通過在結構上引入FPN模型和構建條件損失函數,有效提升了檢測效果。實驗表明,該算法能有效提升限制品檢測精度,并為其他目標的檢測提供借鑒。