





摘要 探討了采用預訓練的卷積神經網絡(CNN)模型,如GoogLeNet、VGGNet和EfficientNet,作為特征提取器對蘋果葉片病害檢測準確率的影響。通過結合這3個CNN模型導出的深度特征,實現了深度學習特征的組合,使用提取的深度特征訓練了支持向量機(SVM)分類器。結果表明,所有CNN模型都能以顯著的準確率使用深度特征提取并檢測出蘋果葉片病害,整體分類準確率達到了99.42%。此外,該研究還提出了一種基于改進深度學習的方法,通過結合3個CNN模型的深度特征,進一步提高了預測性能。該方法在蘋果葉片病害檢測中表現出色,并有望應用于其他植物葉片的病害檢測。該研究為植物病害的自動識別提供了一種有效的方法,有助于農業生產的智能化和精準化。
關鍵詞 蘋果葉片病害;卷積神經網絡;深度特征提取;支持向量機;病害檢測
中圖分類號 S-058 文獻標識碼 A 文章編號 0517-6611(2024)23-0216-04
doi:10.3969/j.issn.0517-6611.2024.23.047
Detection of Enhanced Apple Leaf Disease Using Fused Deep Features from Pre-trained CNNs
ZHANG Zheng-feng, GAO Feng
(Xuzhou Vocational College of Bioengineering, Xuzhou, Jiangsu 221006)
Abstract A comprehensive examination of the application of pre-trained Convolutional Neural Networks (CNNs) was discussed, such as GoogLeNet, VGGNet and EfficientNet in detecting apple leaf diseases and pests. By addressing the limitations and gaps in existing research, we focused on enhancing detection accuracy by leveraging deep features extracted from these CNN models. The methodology involved the fusion of deep features obtained from the final fully connected layers of the CNNs, followed by the training of a Support Vector Machine (SVM) classifier. Results showed that all the CNN models demonstrated significant accuracy in detecting apple leaf diseases using deep feature extraction, achieving an overall classification accuracy of 99.42%. Furthermore, an improved deep learning approach was introduced which combined the deep features from the three CNN models, further boosting predictive performance. The methodology exhibited promising results in apple leaf disease detection and had potential applications in detecting diseases in other plant leaves. This research contributed to the development of automated and precise plant disease identification techniques, paving the way for intelligent and targeted agricultural production.
Key words Apple leaf diseases;Convolutional Neural Networks (CNNs);Deep feature extraction;Support Vector Machine (SVM);Disease detection
基金項目 中國高校產學研創新基金項目“基于VR的互聯網-紅色旅游應用研究-以淮海戰役烈士紀念塔園林景區為例”(2022IT061)。
作者簡介 張正風(1980—),男,江蘇徐州人,副教授,碩士,從事軟件工程和軟測量技術研究。*通信作者,副教授,碩士,從事動物繁殖和遺傳育種研究。
收稿日期 2024-04-03
蘋果作為全球公認的種植最廣泛的水果之一,因其營養價值和產量高而受到人們的喜愛,但是蘋果同樣不能免受病害的普遍影響,這對農業產量和質量構成了重大威脅[1]。盡管植物保護專家采用了傳統的視覺檢查方法來檢查植物病害,但這種方法既耗時又往往不準確[2]。在蓬勃發展的精準農業領域,對能夠提供速度和準確性的計算機輔助病害檢測系統的需求越來越高。
在利用基于傳統機器學習技術的研究中,蘋果葉片病害的識別已取得了重大進展,如支持向量機、隨機森林、BP神經網絡、主成分分析等。鄒永杰等[3]對蘋果葉片圖像的定向梯度直方圖和局部二元化圖形進行特征提取,同時使用SVM分類器對其進行分類,其準確率達到98.49%。研究人員使用改進的均值漂移Mean-Shift 算法對3種常見蘋果葉片病害病斑進行分割[4],并提取病斑圖像的4個顏色特征和7個基于和差直方圖的特征作為分類特征,通過計算歐式距離進行分類,準確率可達96%。然而,傳統機器學習模型的成功嚴重依賴于所選特征和必要的分割,這往往限制了最佳分類結果。
在利用基于機器學習技術的研究中,蘋果葉片病害的識別已取得了重大進展。“深度學習”描述了一種能夠在多個處理層上學習輸入表示的模型[5]。與傳統機器學習技術不同,深度學習促進了直接數據分析,消除了對特征提取的需求。深度學習在植物病害識別中的應用已得到廣泛研究。丁睿柔[5]針對蘋果葉片病害,改進了ResNet18網絡,通過添加通道與空間注意力機制以及特征圖隨機裁剪分支,優化了網絡性能。龍陽等[6]針對蘋果葉片病害在復雜環境下出現的多尺度病斑識別和定位不準確等難題,并提高對小目標病害特征的識別能力,提出了一種基于改進YOLO的蘋果葉片病害檢測算法。研究人員提出了基于改進Faster R-CNN的蘋果葉片病害識別方法,能夠在實際場景中進行無損測量識別,平均精度均值達到86.2%[7]。
鑒于此,筆者探討了采用預訓練的卷積神經網絡(CNN)模型,如GoogLeNet、VGGNet和EfficientNet[8]作為特征提取器對蘋果葉片病害檢測準確率的影響。通過結合這3個CNN模型導出的深度特征,實現了深度學習特征的組合,使用提取的深度特征訓練了支持向量機(SVM)分類器。
1 圖像數據集與研究方法
該研究數據取自已公開的AppleLeaf9數據集,該數據集是從PlantVillage、ATLDSD、PPCD 2020 和PPCD 2021 中融合得到的[9]。這個數據集匯集了不同來源的圖像,使得所提出的算法能夠識別出更多種類的蘋果葉部病害,尤其是在野外環境下也能表現出色,增強了模型在應對環境變化時的魯棒性。數據集中經過人工篩選的圖片數據包括鏈格孢葉斑病408張、褐斑病381張、蛙眼葉斑病360張、灰斑病339張、花葉病371張、白粉病410張、銹病361張、黑星病370張,共計8種病害3 000張圖片,圖片尺寸為256×256像素,所有圖片均為JPEG格式。圖1展示了該集合中的一些代表性的健康和患病蘋果葉片圖像。
該研究中CNN架構(如GoogLeNet、VGGNet和EfficientNet)的輸入圖像分辨率都為224×224像素,并且所有圖像都縮放到相應的尺寸。使用的所有模型都通過留出驗證技術(hold-out validation)進行了頭對頭(head to head)比較。數據集已按照訓練集與測試集4∶1的比例進行了劃分。所有模型都使用相同的一組準備圖像和測試圖像。表1列出了數據集的分類、病害名稱、按分類劃分的樣本大小以及用于訓練和測試的總圖像數量。
1.1 特征提取與模型融合策略
卷積神經網絡(CNN)的目的是在最小化人工特征工程的情況下自動從數據中學習有用的表示。CNN框架主要由2部分組成。第1部分包括卷積層、應用非線性激活函數和池化層,它們共同工作以從輸入數據中提取有用的特征表示[10]。第2部分由全連接層和Softmax層組成,負責將提取的特征映射到具體的類別標記上。
卷積層的濾波器能夠揭示數據內部的空間聯系,這是其強大之處。由于濾波器權重是共享的,因此可以實現更高效的過濾。當輸入數據中存在大量相同的特征實例時,學習過程不會受到影響。卷積操作的結果是加權和,隨后通過激活層消除線性依賴[11t1h6tTHwkZnmOUKAyeoZIA==]。該研究選擇使用線性整流單元(ReLU)作為激活函數,而不是雙曲正切或Sigmoid等其他函數。ReLU函數將負值置為0,從而生成特征圖。接下來,對數據進行池化處理以進一步減小其尺寸,可以選擇最大池化或平均池化。卷積操作的次數由多個超參數決定,如輸入大小、濾波器大小、步長和填充等。最后,數據被傳遞到全連接層,該層的作用是整合之前學到的特征。根據設計需求,可能存在1個或多個全連接層。最后一層全連接層將數據傳遞給Softmax層,Softmax層會計算出所有特征對應各個類別的概率,從而構建模型的預測結果。最終全連接層的輸出數量與輸入數據中的類別數量相等。
遷移學習是指使用與所研究問題類似任務訓練過的模型的過程[12]。在這一過程中,深度特征提取器會采用一個已經訓練好的CNN模型,并直接應用其默認參數(即權重),而不做任何額外的調整。隨后,針對新引入的分類任務,采用支持向量機(SVM)等分類算法進行處理。這種方法的核心在于,利用預先訓練好的CNN架構來為新的問題域提取有效特征。
GoogLeNet以其獨特的Inception模塊而廣受贊譽,該模塊通過多尺度卷積核的組合提升了網絡的表達能力,并在減少參數數量的同時保持了出色的性能[13]。VGGNet則以其深度堆疊的小卷積核而著稱,這種設計使得網絡能夠提取到豐富的特征信息,為圖像識別等任務提供了強大的支持。而EfficientNet則通過一種全新的復合縮放方法,均衡地調整網絡的深度、寬度和分辨率,實現了在保持高性能的同時,大幅降低了模型的計算成本。這3個網絡結構各具特色,均為深度學習領域的經典之作,對后續研究產生了深遠的影響。
1.2 支持向量機
為了利用深度特征提取所收集的數據,必須在該數據上訓練分類器算法。報告顯示,SVM分類器在多種農業圖像分類問題上表現優異[14]。該研究采用了Vapnik提出的支持向量機(SVM)分類器。
使用支持向量機(SVM)解決分類問題的第一步是找到一個最優超平面,這個超平面能夠最大化地將2類數據分隔開。在數學上,這個最優超平面可以通過求解一個二次優化問題來得到[15]。具體來說,給定一個訓練數據集{(xi,yi)}ni=1,其中xi∈Rd是數據點,yi∈{-1,1}是對應的標簽,SVM試圖找到一個超平面wTx+b=0(其中w∈Rd是法向量,b∈R是截距),使得該超平面能夠最大化地分隔兩類數據。
這個優化問題可以表示為:
minw,b12‖w‖2(1)
S.T.yi(wT+b)≥1,i=1,2,…,n(2)
式中,‖w‖2=wTw是法向量的二范數,用于度量超平面的“間隔”或“邊距”。約束條件yi(wTxi+b)≥1確保每個數據點都被正確地分類,并且距離超平面至少有一定的距離(這里是1,但可以通過縮放w和b來調整)。
這個優化問題是一個凸二次規劃問題,可以使用各種優化算法(如拉格朗日乘子法、SMO算法等)來求解。求解完成后,得到的最優w和b就確定了最優超平面,從而可以用于對新數據進行分類。
1.3 研究方法
該研究采用深度特征提取方法對蘋果葉片病害進行識別。該方法是一種遷移學習策略,利用預訓練的卷積神經網絡(CNN)模型提取特征。深度特征是從相應的全連接層中提取:VGGNet的FC8、EfficientNet的Head層和GoogLeNet的Loss-3,并提供了深度特征[16]。此外,還提出了一種使用深度學習的方法,將3個CNN模型中的每個模型的1 000個深度特征進行組合,以提高預測性能。在訓練階段,SVM分類器受益于獲得的深度特征。SVM沒有自定義設置;所有參數都保留其默認值。試驗中使用了i5-8550U CPU、16GB RAM、2GB GPU和240SDD。所有試驗均在MATLAB 2019b環境中運行。
該數據集包含足夠數量的圖像,可使用留出驗證技術對模型進行1∶1比較。數據集被分成2個相等的部分:第1部分用于訓練,第2部分用于測試[17]。在比較模型時,使用了準確度ACCURACY指標。真正(TP)、假負(FN)、假正(FP)以及真負(TN)均從混淆矩陣中獲得,并用于計算這些性能指標。以下是模型比較中使用的性能指標的數學表達式:
ACCURACY=TP+TNTP+FN+FP+TN(3)
圖3展示了深度學習算法的準確度性能比較。VGGNet的準確度從99.06%開始,最大識別準確度為99.22%。GoogLeNet的準確度從98.99%開始,最大達到99.31%。EfficientNet模型的準確度最小為99.15%,最大為99.29%。由于結合了深度特征和高效的訓練、測試技術,提出的模型最大準確度為99.27%,最小為99.41%。
結果表明,從具有更多層的CNN模型中提取深度特征需要更多時間。盡管系統在評估案例中表現良好,但在少數情況下確實遇到了問題,這可能是未來研究的主題。由于樣本稀缺,一些具有高模式變化的類別經常與其他類別混淆,導致假陽性或平均準確度降低。
2 討論
該研究對早期采用相關數據集的研究成果與聯合深度特征及支持向量機(SVM)的方法進行了全面對比。在對比過程中,綜合考量了多種關鍵因素,涵蓋現有方法論、作物種類、應用方式、分類數量以及整體準確率[18]。經過詳盡的分析與比較,結果清晰地揭示出聯合深度特征與SVM的方法在各方面均表現出更為優越的性能。
在討論蘋果葉片病害檢測的相關研究時,發現數據集的構成和試驗設置對結果具有顯著影響。首先,就類別總數而言,不同的研究可能涉及不同數量的病害類型。例如,在研究中,處理了包括健康葉片在內的多種病害類型,如蘋果黑星病、灰斑病等共計8類。這種多樣性使得模型能夠更全面地學習并識別各種病害特征。
其次,數據集的規模和劃分方式對模型的訓練效果至關重要[19]。試驗采用了包含數千張蘋果葉片圖像的大型數據集,并將其劃分為訓練集、驗證集和測試集。具體而言,使用了7 712張圖像進行訓練,1 928張圖像進行驗證以及80張圖像進行測試。這種劃分方式確保了模型能夠在充足的數據上進行訓練,并在獨立的測試集上評估其性能,從而提供更可靠的結果。
通過采用預訓練的CNN模型并結合深度特征融合方法,研究在蘋果葉片病害檢測方面取得了顯著成果。結果表明,模型在測試集上達到了較高的準確率,能夠有效識別各種病害類型。這一成功得益于預訓練模型強大的特征提取能力以及深度特征融合策略對模型性能的進一步提升[20]。
3 結論
該研究致力于探究深度特征提取在識別蘋果葉片病害方面的潛力。為實現該目標,采用了廣為人知的預訓練卷積神經網絡(CNN)模型,如GoogLeNet、VGGNet和EfficientNet。從這些CNN模型的最終全連接層中提取了共計1 000個深度特征,以增強支持向量機(SVM)分類器的性能[21]。通過融合來自3個CNN模型的深度特征,開發了一種深度學習技術,該技術顯著提高了預測準確性。文獻和試驗結果表明,雖然單獨使用每個CNN模型的深度特征可以獲得良好的分類效果,但結合多個模型的信息能夠取得更優結果。這歸因于不同CNN模型拓撲結構揭示了不同的判別特征集。該研究的最終目標是準確識別蘋果葉片病害,并提供針對性的農藥噴灑建議,同時相較于其他CNN算法,提升分類性能。
參考文獻
[1] 陳學森,韓明玉,蘇桂林,等.當今世界蘋果產業發展趨勢及我國蘋果產業優質高效發展意見[J].果樹學報,2010,27(4):598-604.
[2] 王樹桐,王亞南,曹克強.近年我國重要蘋果病害發生概況及研究進展[J].植物保護,2018,44(5):13-25,50.
[3] 鄒永杰,張永軍,秦永彬,等.應用于番茄病蟲害檢測的HOG特征與LBP特征的結合[J].南京師范大學學報(工程技術版),2019,19(3):21-28.
[4] 李柯泉,陳燕,劉佳晨,等.基于深度學習的目標檢測算法綜述[J].計算機工程,2022,48(7):1-12.
[5] 丁睿柔.基于卷積神經網絡的蘋果葉部病害識別與分割研究[D].泰安:山東農業大學,2022:30-40.
[6] 龍陽,肖小玲.基于多注意力機制的蘋果葉部病害檢測方法[J].江蘇農業科學,2023,51(23):178-186.
[7] 劉斌,徐皓瑋,李承澤,等.基于快照集成卷積神經網絡的蘋果葉部病害程度識別[J].農業機械學報,2022,53(6):286-294.
[8] AL-HIARY H,BANI-AHMAD S,REYALAT M,et al.Fast and accurate detection and classification of plant diseases[J].International journal of computer applications,2011,17(1):31-38.
[9] 邵明月,張建華,馮全,等.深度學習在植物葉部病害檢測與識別的研究進展[J].智慧農業,2022,4(1):29-46.
[10] 黨滿意,孟慶魁,谷芳,等.基于機器視覺的馬鈴薯晚疫病快速識別[J].農業工程學報,2020,36(2):193-200.
[11] AGARWAL M,SINGH A,ARJARIA S,et al.ToLeD:Tomato leaf disease detection using convolution neural network[J].Procedia computer science,2020,167:293-301.
[12] 郭文娟,馮全,李相周.基于農作物病害檢測與識別的卷積神經網絡模型研究進展[J].中國農機化學報,2022,43(10):157-166.
[13] 徐岸峰,黃學彬,王波.改進 GoogLeNet 的自然場景圖像多標記分類仿真[J/OL].計算機仿真,2024-01-23[2024-03-17].https://link.cnki.net/urlid/11.3724.TP.20240122.1111.002.
[14] 李紅光,于若男,丁文銳.基于深度學習的小目標檢測研究進展[J].航空學報,2021,42(7):100-118.
[15] 薛衛,程潤華,康亞龍,等.基于GC-Cascade R-CNN的梨葉病斑計數方法[J].農業機械學報,2022,53(5):237-245.
[16] 李就好,林樂堅,田凱,等.改進Faster R-CNN的田間苦瓜葉部病害檢測[J].農業工程學報,2020,36(12):179-185.
[17] ZHONG Y,ZHAO M.Research on deep learning in apple leaf disease recognition[J].Computers and electronics in agriculture,2020,168:1-6.
[18] FERENTINOS K P.Deep learning models for plant disease detection and diagnosis[J].Computers and electronics in agriculture,2018,145:311-318.
[19] 陳聰,于嘯,宮琪.基于改進殘差網絡的蘋果葉片病害識別研究[J].河南農業科學,2023,52(4):152-161.
[20] 張云龍,齊國紅,張晴晴.基于SVM的復雜環境下蘋果圖像的分割[J].智能計算機與應用,2017,7(1):14-16,21.
[21] GEETHARAMANI G,ARUN PANDIAN A.Identification of plant leaf diseases using a nine-layer deep convolutional neural network[J].Computers & electrical engineering,2019,76:323-338.