何婧媛,謝生龍,田 原,田琴琴
(延安大學數學與計算機科學學院,陜西延安 716000)
計算機視覺是人工智能的一個領域,它訓練計算機以類似于人類的方式解釋視覺世界.由于技術的快速發展和足夠大的訓練數據集可用性的增加,計算機視覺領域的主題急劇增長,其中最有前途的領域之一是目標檢測.隨著目標檢測技術的發展,精度和準確性不再是唯一的衡量標準,檢測速度也是至關重要的.目標檢測在機器人導航、智能視頻監控、智能交通、醫療服務、人臉檢測等領域應用非常廣泛[1-3].目前大多數目標檢測是基于卷積神經網絡的,而如何設計更好的網絡結構是當前目標檢測的一個非常關鍵的問題.
目標檢測可以看作是由目標定位和目標分類組成的多任務學習問題.目標檢測算法分為實例檢測和類別檢測,在檢測過程中最重要的是特征,而人工設計的特征由于可分性差出現較高的分類錯誤率,低層特征表達能力弱,難以實現多目標檢測.傳統的目標檢測方法大多數都是分為區域選擇、提取特征和分類回歸這三個步驟,然而這樣的過程存在兩個問題,一個是區域選擇的策略效果差、時間復雜度高,還有一個是手工提取的特征魯棒性較差.基于深度學習的目標檢測算法分為兩階段方法和一階段方法,兩階段方法主要是指R-CNN系列、SPP-Net、R-FCN和FPN等,該方法通過Selective Search或CNN產生候選框,然后對候選框進行分類和回歸,其檢測準確率高[2];……