張 偉,劉 娜,江 洋,李清都
(1.上海理工大學 光電信息與計算機工程學院,上海 200093; 2.上海理工大學 醫療器械與食品學院,上海 200093; 3.重慶市互聯網信息辦公室,重慶 401120)
隨著經濟的迅速發展,我國城鎮人口數量急劇增加,城市生活垃圾也日益增多,而垃圾分類則是處理垃圾公害的最佳解決方案[1]。當下的關注熱點在于將垃圾進行無害化、資源化處理,因此合理有效地對垃圾進行回收利用具有一定的意義。對垃圾進行有效地分類是處理垃圾回收問題的前提[2]。目前,針對人工分揀垃圾環境差、分揀效率低等問題,研究人員提出建立垃圾識別與分揀智能化和自動化系統,通過利用深度學習技術來降低人工分類成本,節約人力資源[3]。
垃圾檢測屬于計算機視覺領域的目標檢測任務。傳統的檢測方法以HOG(Histogram of Gridie) 檢測器[4]、基于滑動窗口的VJ(Viola-Jones)檢測器和DPM(Deformable Part Model)檢測器[5]為代表。卷積神經網絡(Convolutional Neural Network,CNN)架構于2012年被首次提出,并逐漸成為了熱門研究方向。經過多年發展,深度學習領域已涌現出VGGNet、GoogLeNet、ResNet等多種神經網絡算法。最先被用于目標檢測的卷積神經網絡是R-CNN[6](Region-CNN)算法。該算法使用卷積神經網絡進行特征提取,使用Bounding Box Regression修正目標邊界框。不過R-CNN算法也有其弊端,串行式CNN前向傳播耗時長,且CNN特征提取、SVM(Support Vector Machines)分類和邊框修正3個模塊是分開訓練的,對于存儲空間的消耗較大。為了克服R-CNN的耗時問題,Fast R-CNN算法直接采用一個CNN提取全圖特征,減少了對存儲空間的占用。R-CNN和Fast R-CNN算法存在相同的缺陷,即存在耗時的Selectice Search,因此這兩種算法無法實現端到端的物體檢測。……