郭章龍, 李宜汀 趙維 陳凱







關鍵詞: 智能化;深度學習;病害識別;卷積神經網絡;ResNet50_vd
0 引言
在當前人工智能與大數據驅動的全球傳統農業轉型趨勢下,我國農業裝備正朝著計算機集成化、高度智慧化的方向蓬勃發展。農作物病害識別是農業領域的關鍵問題之一,傳統的檢測方式主要依據人工觀察識別病害類別,往往有速度慢、強度大、主觀性強等局限性。
針對上述問題,國內外研究人員將人工智能技術應用于農作物病害識別領域,并已具備一定成效[1-7]。例如:宋大鵬等人[1]提出將深度學習用于水稻葉部病害識別任務中,通過引入深度可分離卷積機制,模型在速度和精度上均取得了較大程度的提升;王敬賢等[4]探究了不同深度的卷積神經網絡對農作物病害特征提取質量的影響,并針對數據集樣本數量少可能引發的過擬合問題,提出使用遷移學習調整參數的思想,并分別在實驗中予以驗證;曾偉輝等[5]針對實際場景下農作物病害識別精度較差的問題,提出一種深度殘差卷積神經網絡方法,通過參數共享反饋子網絡抑制了圖像背景,提升了模型的魯棒性。
隨著算力的不斷提升及深度學習領域的發展,大量深度模型已開始部署在邊緣設備中[6],這在很大程度上提高了農作物病害識別的自動化程度。本文將基于先進的ResNet50_Vd深度殘差網絡對農作物病害識別數據集進行識別,并通過對比試驗驗證該方法的可行性和有效性。
1 農作物病害識別模型
1.1 ResNet 網絡
傳統的卷積神經網絡(Convolution Neural Net? work, CNN)對圖像有較強的特征提取能力。越深的網絡能夠提取越豐富的抽象特征,并且這些特征具有語義信息。然而,增加網絡深度容易導致梯度消失和爆炸的問題。隨著網絡層數的增加,模型在一定程度上將出現退化現象,即在訓練集上的性能下降。上述問題并不屬于過擬合問題,因為過擬合的表現在訓練集上更好[8]。因此,如何解決深度CNN退化問題成為了深度學習的研究重點。2016年,何凱明團隊提出了有效的解決方法,即殘差網絡(Re? sidual Network,ResNet)[9]。該結構在神經網絡層數較深時,仍然展現出了強大的特征學習能力,其基本單元如圖1所示。
殘差網絡主要的突破點是“殘差”概念的提出,具體來說,是在兩層之間跨層映射,有效防止梯度消失和梯度爆炸情況的出現。假設一個殘差單元為yl,則其表達式為:
式中:xl 和xl + 1 分別表示的是第l層殘差單元的輸入和輸出;F 是殘差函數,表示學習到的殘差;h(xl )表示恒等映射;f 是ReLU激活函數。基于上式,可以得到從淺層l到深層L的學習特征為:
ResNet相比傳統卷積網絡,具有多個優點。首先,它通過在卷積層之間添加殘差連接,能夠解決梯度消失問題;其次,殘差網絡更好地利用了網絡的寬度,實現了更充分的信息流動;最后,殘差網絡訓練速度更快,更易于收斂,通常可以在更短的時間內獲得更高的準確度。
1.2 ResNet50-vd 結構
ResNet50網絡是殘差網絡的典型結構之一,其優點在于可以訓練非常深的神經網絡,并且可以在不同的層之間保持信息的傳遞。這使得ResNet50 在計算機視覺等領域有著廣泛的應用。目前針對ResNet50 網絡有較多改進策略,ResNet50_vd便是其中一種。ResNet50_vd 在ResNet50 的基礎上進行了一定的改進,以提高模型的性能和準確率,其主要的改進結構如圖2所示。
此外,與ResNet50相比,ResNet50_vd在整個模型上并沒有改動。本文選用該模型作為農作物病害識別模型,以提升識別任務的準確性,其完整的結構圖如圖3所示。
2 實驗與分析
2.1 數據預處理與實驗參數設定
本文一共使用農作物數據55 443張,數據量達到深度學習數據量要求。在使用數據前,首先進行了數據的預處理,其步驟如下:
首先,將數據進行縮放,將其大小統一變為(256, 2N5o6rm,3a);liz其at次ion,(B對N數);最據后進使行用了卷批積標神準經化網操絡作(C,N即N)B來at自ch動學習圖像特征,對農作物病害數據進行端到端的圖像分類[10],彌補人工提取圖像特征的局限性。圖4展示了部分農作物葉片圖像。
本次實驗使用的配置如下:GPU為Tesla V100 (40GB顯存),處理器核心數為4,RAM32GB,Disk100GB,深度學習框架PaddlePaddle。
式中:TP表示真正類,即樣本的真實類別是正類,并且模型識別的結果也是正類;FN表示假負類,即樣本的真實類別是正類,但是模型將其識別為負類;FP 表示假正類,即樣本的真實類別為負類,但是模型將其識別為正類;TN為真負類,即樣本的真實類別是負類,并且模型將其識別為負類。實驗過程中,模型的訓練參數設定如表1所示。
2.2 實驗分析
為表現ResNet50_vd在農作物病害識別中的優異效果,選取深度學習任務中應用廣泛的VGG 網絡、ResNet網絡作為實驗對比模型。圖5為各個模型在訓練集上訓練過程中的準確率和損失函數隨著遍歷次數的變化趨勢圖。通過圖5可以看到,模型在訓練集上擬合數據的有效性。
測試集上模型的表現效果往往可以證明其魯棒性,圖6展示了模型在測試集上的準確率和損失函數的變化趨勢。通過測試集上可視化結果可以看出,模型具有較好的魯棒性,在測試集上也能很好地擬合數據。實驗中的結果對比數據如表2所示。可以看出,模型在測試集上也有較高的預測精度,滿足實際場景需求。
3 結論
本文使用深度殘差神經網絡模型ResNet50_vd進行農作物病害圖像識別,該模型擁有較高的識別精度,并在對比實驗中展現了優異的性能。可以看出,將計算機視覺技術與病害識別結合,可以幫助農民快速、準確地識別作物病害,有助于提高農業生產效率和農作物產量。但是,本文僅研究了成像質量較高的識別情境,未來將繼續深入探索現實場景中無人機拍攝下的作物圖像,提高模型在小目標中的識別效果。