魏宏彬, 張端金, 杜廣明, 肖文福
(鄭州大學 信息工程學院, 河南 鄭州 450001)
目前,目標檢測主要包括傳統目標檢測技術和深度學習目標檢測技術。傳統的識別技術主要利用滑動窗口實現圖片內目標的搜索,然后通過HOG(histogram of oriented gradient)或者SIFT(scale-invariant feature transform)手工設計特征輸入到SVM[1]內進行識別。多尺度形變部件模型(DPM)[2]的提出實現了目標檢測。但傳統的檢測方法不僅檢測精度較低,而且魯棒性較差。
Girshick等[3]采用候選區域和卷積神經網絡結合的目標檢測方法取代了傳統方法。目前,基于深度卷積神經網絡經典的目標檢測算法主要有兩大類。一類是兩階段目標檢測方法,例如Faster RCNN[4]、R-FCN[5]和FPN[6]。該類算法第一階段對前景和背景進行分類以及邊界框回歸,第二階段利用第一階段的輸出再進一步地分類和邊界框回歸。另一類是一階段目標檢測算法,例如YOLO系列算法[7-9]和SSD算法[10]。與兩階段算法相比,該類算法利用深度卷積神經網絡提取的特征直接對目標進行識別和定位,滿足了實時性的要求,但識別精度較低。在實際應用中,目標檢測既要保證精度又要滿足實時性的要求,所以一階段目標檢測算法使用范圍較廣。其中YOLOv3算法[9]在一階段目標算法中檢測效果最佳,在COCO數據集上 51 ms內mAP為57.9%。
為提高超市的運行效率,使稱重設備能夠自動檢測蔬菜的種類,從而快速地為散裝蔬菜稱重打碼,筆者采用高清攝像機和網絡爬蟲技術收集蔬菜數據,并對數據進行篩選和標注,制作成用于檢測的蔬菜數據集。為保證能實時地檢測蔬菜目標,筆者以YOLOv3算法為基礎模型。……