錢嵩橙,董博文,樊繼午,牛曌,蔣欣洳,方智

摘要: 由于垃圾種類較多,顏色與形狀差異大,選用人工分揀垃圾分類存在著非常大的困難,勞動力不足,工作量大,缺乏精準度。文章以MobileNet-V3small網絡算法為基礎,對垃圾圖像進行準確識別和分類,達到速度快、準確度高,借助CNN模型進行光譜特征分析并分類。通過自動化分揀垃圾,實現垃圾分類,大大降低了人工投入量,提高垃圾分類效率。
關鍵詞:垃圾;分類;MobileNet-V3;CNN
中圖分類號:TP18? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)35-0014-02
伴隨中國經濟社會的發展,人們日常生活質量的提高,以及城鎮化的迅速深化,生活垃圾生產量持續推高,全球已經面臨垃圾危機[1]。在我國當前城市建設中,目前城建基本定型,其中垃圾中轉站的建設也會對環境產生污染,所以垃圾分類的實施不容樂觀。在我國,垃圾分類還存在類別不夠細致、標準不夠清晰,居民的相關分類知識缺乏。因此,自動化智能化的分揀設備被逐漸運用在垃圾分類工作中。
另外,由于城市生活廢棄物中大多是廢棄物和廢物,因此人工分類也是廢棄物分類中必不可少的關鍵環節,有利于篩選無法使用傳統手段篩選的廢棄物以及對廢棄物實施質量管理。但是,進行人工垃圾分類將面臨工程量大、工作勞動強度大、分類效率低下和工作環境較差的問題,因此,亟須以智能、信息化的分類方式代替傳統分揀方式。本課題采用基于MobileNet-V3與CNN的深度學習分類模型。該模型將常見垃圾分成四種:其中包含可利用垃圾、危險垃圾、廚余廢物和一些其他垃圾。該模型將Mobilenet-V3 small網絡算法為基礎(主要設計載體),并使用新搭建的CNN模塊對數據集的光譜特征提取垃圾分析和計算,實現對垃圾目標的識別進行分類。
1 算法設計
在本次的實驗中,模型的調用中通過搜集垃圾圖片進行整合,每一組圖片里有且只有一種垃圾的一個圖片,照片的格式統一為jpg,標簽格式為txt,在此過程中始終保持兩者為一一對應的關系,由于采用的垃圾照片是隨機的,光線、尺寸、大小、對比度等不盡相同,其內部數據也很復雜多亂,所以更加符合平時垃圾識別的標準,貼切我們的生活實際情況。在進一步整合之后,添加數據集標簽,將垃圾種類分為數類,一個數字對應一個標簽即一個類別。
根據實驗要求,為了合理精準分類出實驗所需垃圾圖像。采用以MobileNet-V3 small網絡算法為基礎(此計算為本次實驗的主要設計載體),而在此基礎上優化該算法,采用CNN來進一步準確提高垃圾分類的效率。CNN 是通過模擬生物神經系統進行特殊設計的一種網絡模型,在圖像特征提取的過程中不需要人工思考具體特征,其局部鏈接和權重共享的特性在二維圖像處理上有著明顯優越性,可以直接作用于圖像的像素位置,因此人們能夠使用該網絡對輸入的垃圾像素進行獲取特性,完成了對垃圾目標的鑒別和分類。其中,CNN一般包含的內容塊有最大注入層、卷積層、最大池化層,全連接層和最大輸出層等,而其要使用的基礎模塊則為最大卷積層(用來獲取特征)和最大池化層(用來采樣并不會破壞識別結構),對垃圾進行初步識別分類。
最后,將已實現精準分類的圖像輸入MobileNet-V3 small網絡,并使用分組卷積減少了網絡的計算工作量,同時MobileNet也將分組卷積技術應用至極致,即網絡的分組數量和網絡的channel數量相當,從而將網站的計算量減少至最小化,并且使用NetAdap技術可以在計算與參量均受限的條件下,實現對不同網絡模塊的查詢,將搜索到的完整網絡模塊進一步輸入platform-aware NAS中,從而進一步微調,在確保精度的前提下大大提高了效率,得到所需的分類結果。
2 算法模型
2.1 CNN模型
CNN是一個具有卷積構造的深度神經網絡。CNN模型的使用能夠在保證一定精度的前提下進行高效、迅速地處理二維圖像[2]。CNN的出現,代替了常規全連接神經網絡中的矩陣加減法運算,其優點就是在GPU的并行計算能力下,還能有很大的運算效能,最經典的CNN包括輸入與輸出層、卷積運算層、池化層,全連接層與輸入輸出層等,實現了提取圖形特征功能的內核模塊為卷積層和池化層[3]。
卷積層與池化層可以將被提取圖像的特征進行從淺到深進行剖析,使原有的特征細節變得更加具體。在卷積運算的過程中,若在核維度為x的圖像里,要使上層網絡的m-1的輸出值<E:\2022知網文件\35\1xs202235\Image\image3.pdf>輸入下層的m中,此過程的計算公式為[4]:
[Zmx=g(lmx?zm-1+amx)]? ? ? ? ? ? ? ? ?(1)
其中:[Zmx]代表在上一層卷積運算中,核維度為x的特征圖,[lmx]代表第m層維度為x的權向量,[amx]代表第m層且維度為x的偏置單元,運算符[?]代表本次卷積運算的操作,g(y)為非線性的激勵函數。
在經過卷積層的運算后,需要提取的特征圖像會在池化層中進行卷積特征降維,其目的在于簡化運算,并對特征進一步具體化,從而提取出更加典型的特征。
在本次實驗中共運用四層CNN模型,先將圖片中的數據輸入輸入層中,其目的是保存圖片本身的結構。緊接著通過卷積層濾波的處理進入卷積層中,使用卷積核進行特征提取和特征映射,同時利用卷積層處理公式進行特征處理,使每一個卷積層中的神經元是都對應一個權重。當輸入進入池化層時,池化層中的“池化視野(filter)”會對輸入的數據進行掃描、計算,進一步進行卷積特征降維。再CNN模型尾部的全連接層主要對輸入的特征進行重新整合,避免特征信息的丟失。最后則由輸出層輸出初步的分類結果。
2.2 Mobilenet-v3 模型
在深度學習的過程中,使用輕量級網絡的優勢在于模型參數少、計算量小、測試速度更快,且適用于存儲空間和功耗受限的場景。而縮小模型的參數量一直是科研人員的研究努力方向,MobileNet-v1、MobileNet-v2便是其中的佼佼者。而本實驗中就使用了結合二者之間優點的生物識別網絡MobileNet-v3。MobileNet-v3的獨特創新的地方在于采用了互補搜索技術結構:即在同一網絡結構中,它可以通過順序的原則對每一層進行微小調整,而不是通過試圖推斷出不精確但整體的體系結構,同時調用NetAdapt技術和platform-aware NAS方法。其中,NetAdapt的普遍應用特點就是能夠在計算時間和參量均受限的條件下完成對各個互聯網模型的查找,使擴展層使用濾波器的數量達到最佳,并且瓶頸層輸出的通道數量也為最佳輸出,NAS主要是在查找并確定模塊之后完成對互聯網層的微調。在MobileNetV2模型中反轉殘余的誤差結構和變量[5],采取了1*1卷積算法構造,以便拓展到更高維的特征空間中,而其缺陷則是帶來了巨大運算費用和延遲。同時,為在保持低維數約減特性圖的前提下減少延遲,可以將平均池化前的層刪除并采取1*1逐點卷積來完成特征圖。特征生成層被刪除后,先前作為瓶頸映射的層不再要求。MobileNet-v3是繼承了MobileNet-v1與MobileNet-v2的優點且重在提高精度與檢測速度方面。MobileNet-v3集現有MobileNet-v1與MobileNet-v2思想于一體,其中最為關鍵是使用分段線性函數模擬sigmoid函數激發變量swish進行數值逼近的h-swish觸發變量,如公式(2)所示:
[h-swish[x]=x[ReLU6(x+3)]/6]? ? ? ? ? (2)
隨著模型參數的不斷縮小,應用非線性激活函數的成本逐漸降低。Sigmoid不便于保持數據的準確性需要煩雜的計算過程,其中,采用新的激活函數h-swish,在確保精度的前提下,也具有諸多的優勢,最重要的是實現了ReLU6的優化且能在量化模式下,減少誤差、提高精度的同時,也能極大提升速度,這些修改超過了當前的空間搜索范圍。
當然,使用h-swish還會帶來一定部分的延遲,但是量化版的h-swish能夠帶來精度的提升是值得的,在具體實驗中,還可以進一步進行軟件優化,在實際計算時,可以減少對內存的訪問開銷。
3 結束語
傳統的人工垃圾分類方法已經不足以處理人們生活中產生的垃圾,工作量大、工作強度高、分類效率低等問題亟待解決。基于MobileNet-V3和CNN的深度學習分類模型對垃圾圖像分類進行研究,根據算法提取圖像特征,采用以MobileNet-v3網絡算法為基礎,同時優化此算法,并用CNN和特征優選實現對垃圾目標的識別,提高垃圾分類的效率,并得出以下結論:
CNN可將大量參數降維成少量參數,將大數據量的圖片降維成小數據。通過搭建CNN模型對數據進行光譜特征分析實現初步垃圾分類與制圖。
MobileNet-V3具備互補搜索技術方式的優點,采用了NetAdapt和platform-aware NAS兩個網絡結構技術方法,可以在時間和參量的限制下查找網絡模塊,并微調網絡層。
本文通過基于CNN算法和MobileNet-V3算法的結合,對垃圾數據集以及圖像的處理進行實驗,并利用擴充垃圾指數等新特性,以增強輸入信號的時效性,并優化了基于CNN的垃圾分析和制圖的技術,是今后科研今后的主要工作方向。在將輸入的特征維度擴展后,便可深入分析研究網絡層次、參數對分類過程的作用,從而全面發掘CNN和MobileNet-V3的技術優點,以獲取表現更優的模型。
參考文獻:
[1] 呂君,翟曉穎.基于橫向視角的垃圾回收處理體系的國際比較研究及啟示[J].生態經濟,2015,31(12):102-106.
[2] Li E Z,Xia J S,Du P J,et al.Integrating multilayer features of convolutional neural networks for remote sensing scene classification[J].IEEE Transactions on Geoscience and Remote Sensing,2017,55(10):5653-5665.
[3] Hinton G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
[4] 劉戈,姜小光,唐伯惠.特征優選與卷積神經網絡在農作物精細分類中的應用研究[J].地球信息科學學報,2021,23(6):1071-1081.
[5] Shi C P,Xia R Y,Wang L G.A novel multi-branch channel expansion network for garbage image classification[J].IEEE Access,8:154436-154452.
【通聯編輯:唐一東】