中圖分類號:S436.412 文獻標識碼:A 文章編號:2095-5553(2025)10-0192-12
Abstract:At present,the existing tomato leaf disease recognitionmodelhas the problems poor generalization low recognition accuracy.This paper proposesa tomato leaf disease recognition model basedon improvedEMA—iT that addresses theisues.The method uses the mainstream model Data-eficient image Transformers(iT)as the benchmark model,combines theExponential Moving Averagealgorithm with the iTmodel,adoptsself-knowledgedistilation method,enhances thetomatoleaf diseaserecognitionalgorithm through transfer learning toimproveitsrecognition accuracy.The model iscompared with VGG16,nsNet121,EficientNet,ResNet50,Vision Transformer,Swin Transformer, DCNN models,showing an accuracy improvement 1.1% to 14% .The improved EMA—iT model achieves an average accuracy 99.6% in the PlantVillage ten-class tomato leaf disease dataset. To evaluate the recognition performance tomato leaf diseases incomplex natural environments,this model wastested onthe Dataset
Tomato Leaves six-class tomato leafdiseasedataset,the PlantDoc dataset, the Tomato-Village dataset,achieving an average recognition rate 98.2% , 97.1% , 97.6% ,respectively.Compared with other models,the model demonstrated superior performance.The improved EMA—iT model proposed in thispaper has high recognition accuracyfor tomatoleaf diseasesincomplexnatural environmentscanefectivelyaid decision-making for tomato disease recognition systems in agricultural production
Keywords:tomato disease recognition;transfer learning;self-distilation;exponential moving average
0 引言
目前,中國位居亞洲番茄產量第一,同時也是全球最大的番茄生產國[1,截至2024年,中國的番茄產量種植面積約 120khm2 ,超過了美國加州,成為世界第一大加工番茄生產基地[2]。然而,番茄產業面臨常見病蟲害的威脅,這對番茄的產量和質量造成了顯著影響,嚴重制約了番茄產業的進一步發展[3]。傳統的番茄病害防治主要依靠農民長期以來積累的個人經驗,但這些方法往往不能及時高效地識別番茄病害,給農民造成了巨大的經濟損失[4。為有效降低農民損失,利用圖像識別技術對番茄病害進行防治具有重大意義。番茄病害通常從葉部開始蔓延至整個植株,及時準確識別番茄葉部病害的種類顯得至關重要[5]。因此迫切需要一種可靠的番茄病害鑒定方法,以確保番茄健康生長,提高番茄的產量和質量[6]。
近年來隨著人工智能在農業領域的發展,基于深度學習的圖像處理技術已逐漸成為該領域的重要研究方向,其中卷積神經網絡(CNN)在植物病害的檢測和分類方面取得顯著進展[。CNN可以有效地替代人工提取特征的方法,從而更準確地獲取圖像紋理與色彩中的病害信息,達到精準識別病害類型的目的[8]。VGGNet模型[9-11]、ResNet模型[12-14]和nseNet[15.16]等CNN網絡模型在圖像識別方面有更加廣泛地應用。姜紅花等[7提出了一種基于改進ResNet18的蘋果葉部病害多分類算法,并在原始ResNet18網絡的基礎上增加通道與空間注意力機制分支,在5類蘋果常見的葉部病害上準確率達到 98.25% 。劉敏等[18提出了一種基于多尺度融合網絡的蘋果病害葉片檢測方法,利用改進后的VGG一16網絡作為蘋果全局特征提取器,并使用SwinTransformer網絡作為局部特征提取器,最后將全局特征與局部特征進行融合,對于蘋果6類葉病檢測達到 93.98% 的準確率。張寧等[19提出了一種改進的AT—InceptionV3神經網絡番茄葉部病害檢測模型,該網絡以InceptionV3為主干網絡,結合多尺度卷積和注意力機制(CBAM)模塊,在Plantvillage公開番茄病害數據集中的5種番茄常見葉部圖像分類準確率達到 98.4% 。王志強等[20]提出一種基于多尺度特征融合和坐標注意力機制的輕量級網絡(MCA一MobileNet)模型,針對PlantVillage中的1O類番茄葉片圖像識別準確率達到 94.11% 。馬麗等[21提出一種基于MobileNetV3進行改進的番茄葉片病害分類識別研究方法,對于PlantVillage公共數據集和AIChallenge平臺數據集中5類常見的番茄病害葉片和1類健康葉片的平均識別準確率可達 97.29% ODhanalakshmi等[22]提出了一種基于Inception的序列網絡新變體,使用改進的輸人圖像特征和超參數對番茄數據集上的現有網絡進行分類,在PlantVillage番茄葉片數據集上實現了 96% 的平均識別精度。
CNN網絡模型在農業病害識別方面取得了卓越的成果,但是進行圖像識別需要大量的數據集和計算時間。遷移學習通過借助現有領域的知識重新應用于另一種相關的目標領域問題上,從而有效地彌補數據集樣本不足以及訓練模型收斂速度慢的問題。鄭一力等[23]提出了一種基于遷移學習的卷積神經網絡植物葉片圖像識別方法,使用AlexNet和InceptionV3模型得到的識別準確率分別達到 95.31%.95.40% 。陳聰等24提出一種基于改進殘差網絡的蘋果病害識別模型REP一ResNet,模型使用遷移學習的方式進行訓練,在復雜背景下的蘋果葉片病害識別中準確率達到97.69% 。牛學德等[25]提出了一種遷移學習和nseNet卷積神經網絡相結合的模型,針對10種番茄葉圖像的分類測試準確率達到 97.76% 。
Transformers于2O17年被Vaswani等提出用于機器翻譯任務,然后成為自然語言處理(NLP)領域眾多任務中最領先的方法。Dosovitskiy等[26]受到Transformer在NLP領域成功應用的啟發,將Transformer應用于計算機視覺領域,提出了VisonTransformer(ViT),ViT在通用圖像分類任務上展示出優越的可擴展性,甚至超過了主流的CNN網絡結構。然而,ViT模型在訓練的過程中需要大量的數據進行訓練才能達到良好的效果,導致在有限算力和數據的情況下出現訓練成本過高的問題。為了解決這些問題,Touvron等[27在2O21年提出了Data—efficientImageTransformers(iT)模型,iT模型是一種基于Transformer架構的計算機視覺模型,通過改進訓練策略和引入知識蒸餾的技術,使得模型在少量數據下仍能達到更高的性能。知識蒸餾最初由Hinton等28在2015年提出,主要通過訓練一個龐大且復雜的教師模型來傳遞知識給一個較小的學生模型,以減小模型的規模與計算復雜度,同時保持模型的性能。然而,傳統知識蒸餾主要依賴于外部教師模型,其訓練復雜度高和容量大增加了計算與儲存的負擔。當使用傳統知識蒸餾,教師模型與學生模型之間差異較大時,所得到的學生模型性能不一定最佳[29]。
為此,針對實際應用的復雜場景中番茄葉部病害識別種類少、模型精度低等問題,本文提出一種基于改進的iT模型,通過滑動平均指數算法(ExponentialMovingAverage)與iT模型相結合。為了使模型訓練過程更簡化和高效,本模型使用自蒸餾策略,學生模型在預訓練階段學習到的知識用于自身在目標數據集的訓練,學生模型與教師模型為同一模型,解決學生與教師模型之間因容量差異過大導致知識傳遞不充分等問題。同時使用遷移學習技術將模型iT在ImageNet數據集上進行充分訓練后得到模型參數遷移到番茄葉部病害目標數據集上,大大減少模型訓練的時間,提高模型訓練精度。在公開數據集PlantVillage中1O類番茄葉病以及DatasetTomatoLeaves中6類番茄葉病數據集上進行試驗。
1 材料與方法
1.1 數據集
選取PlantVillage、DatasetTomato Leaves、PlantDoc、Tomato—Village番茄病害數據集,這4個數據集覆蓋了從試驗背景到自然環境下的多種番茄病害圖像。其中選定PlantVillage數據集中1O個類別的番茄葉片圖像,包含9種病害和健康葉片總數共18835張,從中選取6000張具有代表性的種類圖像共10類,各類病害樣本展示如圖1所示。
圖1PlantVillage數據集番茄葉片病害圖像

DatasetTomatoLeaves數據集是在網站(https://data.mendeley.com/)中收集的自然場景下的番茄葉片圖像,由單葉、多葉、簡單背景和復雜背景組成,分別為細菌性葉斑病、黑霉病、灰斑病、健康、晚疫病、白粉病6個類別,共622張圖像,各類病害樣本展示如圖2所示。
圖2DatasetTomatoLeaves數據集番茄葉片病害圖像 Fig.2Dataset TomatoLeavesimage tomato leaf disease

采用的泛化性驗證數據集選取自PlantDoc數據集中的番茄病害葉片圖像,以及Tomato—Village中的多類別番茄病害分類(Multiclasstomatodiseaseclassification)數據集共同組建而成。PlantDoc數據集總共包含2598張圖像,涉及13種植物物種和多達17類疾病,選取其中的番茄數據共8類,分別為早疫病、晚疫病、細菌性葉斑病、葉霉病、番茄花葉病、斑枯病、健康葉片、黃化曲葉病毒病,共734張。PlantDoc數據集與實驗室控制條件下拍攝的圖像不同,該數據集的圖像反映真實農場環境的復雜性,其中的數據捕捉到自然環境中的背景噪聲、不同的照明條件和多樣的視角,各類病害樣本展示如圖3所示。
圖3PlantDoc數據集番茄葉片病害圖像 Fig.3 PlantDoc dataset tomato leaf disease image

Tomato—Village的多類別番茄病害分類數據集在印度拉賈斯坦邦的焦特布爾拍攝,在焦特布爾田地采摘番茄葉子,然后將單個番茄葉放置于白紙上進行拍攝。
該數據集共2103張數據,有8類番茄圖像數據,分別為早疫病、晚疫病、葉礦病、鎂缺乏癥、氮缺乏癥、鉀缺乏癥、斑點萎蔫病,各類病害樣本展示如圖4所示。
圖4Tomato—Village數據集番茄葉片病害圖像 Fig.4Tomato leafdisease imageinthe Tomato—Villagedatase1

1.2試驗數據預處理
PlantVillage原數據集中番茄葉圖片數量各個種類之間差別過大,例如番茄黃化曲葉病有5357張圖像,而番茄早疫病、番茄葉霉病以及番茄花葉病各只有1000張圖像,因此使用原數據集進行訓練可能會導致模型退化以及模型過擬合或欠擬合的問題。為保證數據集中各種番茄葉片圖像種類的平衡,以提高模型性能準確性,根據病害嚴重程度以及番茄葉形狀與顏色等特征,從PlantVillage原數據集中挑選6OOO張圖像,并使用數據增強的方法擴增到12000張圖像。
DatasetTomatoLeaves原數據集中圖像總數僅為622張,當數據量有限時,模型訓練期間容易出現過擬合,所以采用數據增強的方法以增加數據容量到6526張圖像。PlantDoc數據集與Tomato—Village數據集同樣采取類似的數據平衡策略,其中PlantDoc原蕃茄葉片數據集數量為734張,使用數據增強后達到2693張,并且每類數據平衡在330張左右。Tomato—Village原數據集為2103張,增強后圖像數量為4137張。
數據預處理所使用的方法包括圖像順時針旋轉90°,180°,270° ;調節圖像明暗亮度;通過高斯模糊添噪模擬真實自然場景。數據增強的方法不僅使網絡模型在訓練過程中從更多樣的圖像中學習,增強模型的泛化能力與通用性,而且有助于提高模型處理復雜場景的能力。最后將PlantVillage、DatasetTomatoLeaves、PlantDoc、Tomato—Village數據集中所有的圖像大小調整為227像素 ×227 像素,然后分別按照6:3:1的比例將數據集隨機劃分為訓練集、驗證集和測試集,數據增強圖像對比展示如圖5~圖8所示,數據預處理前后數量對比如表1~表4所示。
圖5PlantVillage番茄葉片原始圖像與擴充圖像 Fig.5 Original exped images tomato leaves in PlantVillage

圖6DatasetTomatoLeaves番茄葉片原始圖像與擴充圖像

圖7PlantDoc番茄葉片原始圖像與擴充圖像

圖8Tomato一Village番茄葉片原始圖像與擴充圖像 Fig.8 Original exped images Tomato-Village tomato leaves

表1PlantVillage番茄葉片數據集類別及數據增強前后數量Tab.1TypesquantityPlantVillage tomatoleaf datasetbefore afterdata enhancement

表2DatasetTomatoLeaves番茄葉片數據集類別 及數據增強前后數量 Tab.2Dataset Tomato Leaves:Category quantity before afterdata enhancement

表3PlantDoc番茄葉片數據集類別及數據增強前后數量 Tab.3CategoriesPlantDoctomato leaf dataset the number data before after data augmentation

表4Tomato一Village番茄葉片數據集類別及數據增強前后數量Tab.4 Tomato—Village tomato leaf dataset category quantity before after data enhancement

1.3番茄病葉識別模型選取與采用方法
1.3.1 iT模型
基于Transformer的分類模型VisonTransformer(ViT)需要在 3×108 張圖片海量數據上(JFT—300M)進行預訓練,再在ImageNet數據集上進行fune-tuning,才能達到與CNN方法相當的性能,這不僅需要大量的計算資源而且限制了ViT方法的進一步應用。iT無需海量預訓練數據,只依靠ImageNet數據,便可以達到SOTA的結果,同時依賴的訓練資源更少。
如圖9所示,iT使用自注意力機制來捕捉圖像特征,通過將圖像劃分為固定大小的“圖像塊\"(Patchtoken)并將其嵌入到向量空間(PatchEmbedding),以便在數據集上進行圖像分類。它引入了“類別令牌”(classtoken)來表示整個圖像的信息,并使用“蒸餾令牌\"(distillationtoken)用于接收教師模型通過“軟蒸餾”(Stdistillation)在相關任務上的訓練,使學生模型從教師模型中獲取知識。“蒸餾令牌”與“類別令牌\"相互補充,它們的嵌入逐漸變得相似但不相同,這是因為它們是生成相似但不相同的目標,以提供更豐富的信息。
圖9模型結構框架圖
Fig.9Model structure framework diagram

1.3.2 知識蒸餾架構
Hinton首次提出知識蒸餾架構,引入教師一學生模型的概念,其目的是將訓練好的教師模型所包含的知識遷移到另一個輕量學生模型上。這一過程主要是利用教師模型的軟目標(Stlabel)輸出作為知識指導,用來幫助學生模型更好地訓練,以達到更好的性能和精度。軟目標函數的表達式如式(1)所示。

式中: qi —軟目標輸出;exp——指數運算;Zi ———Stmax層輸出的分類類別概率;T- 溫度參數,用于控制輸出的平滑度,當溫度參數越高則輸出結果概率分布越平緩,當 τ 為1時, qi 為Stmax函數。
傳統的知識蒸餾方法通常采用復雜的教師模型來指導簡單的學生模型進行訓練,但是因為外部教師模型和學生模型在結構和參數上存在差異,會讓教師模型中的一些重要特征與知識無法傳遞給學生模型,模型之間的信息流失導致學生模型在識別任務上的性能下降。為了提高知識遷移的效率,使用的教師模型是在ImageNet完成訓練的iT模型,學生模型同樣為預訓練完成的iT模型,iT模型將在預訓練階段學習到的知識用來指導自身在特定數據集識別與分類。由于教師與學生模型是相同的模型結構,教師模型生成的軟目標與學生模型的輸出層匹配更一致,這種自蒸餾的策略可以有效地減小知識傳遞之間的誤差,使得學生網絡模型的精度更佳。
iT模型的軟蒸餾(Stdistillation)通過蒸餾溫度 τ 來平衡準確性和泛化性能,將教師模型和學生模型的Stmax輸出之間的KL散度損失函數(Kullback—Leibler)最小化得到軟蒸餾損失函數;學生模型的Stmax輸出與真實標簽之間計算交叉熵損失(CrossEntropy),兩個損失函數的加權和為最終損失函數,具體計算如式(2)所示。
Loss=(1-λ)LCE(?(Zs),y)+ λτ2KL(ψ(Zs/τ),ψ(Zt/τ))
式中: Zs,Zi —學生模型和教師模型的輸出;λ ——KL散度損失和交叉熵的系數;y 一真實值標簽;ψ —Stmax函數。
知識蒸餾結構如圖10所示。
圖10知識蒸餾結構 Fig.1O Structure knowledge distillation

1.4滑動平均算法
指數移動平均(EMA)是一種平滑時間序列數據的方法,EMA通常對模型的權重參數進行平滑處理,通過對模型訓練中的權重進行指數移動平均,使模型更加穩定,并提高在驗證集上的性能。該方法給予近期數據更高的權重,通過對歷史參數值進行加權平均,有助于降低模型參數在訓練過程中的波動性。
在模型參數的初始化階段,需要設定一個衰減率 β 該衰減率用于控制模型參數的更新速度。對于每個變量V ,EMA會相應地設置一個影子變量 Vt ,并確保其初始值與原變量保持一致。在每次運行變量更新時,影子變量的值會按照指數移動平均的方式更新, θ 為變量 V 在t 時刻的取值。 ?Vt 的更新公式如式(3)所示。

1.5 引用遷移學習
遷移學習(TransferLearning)是通過將已訓練過的數據所得到的知識遷移到新的相關任務中,以進行高效地處理。在病害識別任務中,采用遷移學習能夠顯著加速網絡模型的收斂過程,縮短訓練所需的時間,并且由于引入更多必要的數據量,還能提高模型的泛化能力,從而有效降低模型的過擬合風險。由于番茄葉部病害圖像數據量有限,傳統的卷積神經網絡在這一規模的數據上難以展現出良好效果。相比之下,iT模型在經過大型數據集的預訓練后,能夠學得較強的分類能力。因此,選擇采用遷移學習的方法進行預訓練,以充分利用在大規模數據上訓練得到的特征。
基于TensorFlow官方在ImageNet數據集上進行訓練,得到一個iT smalldistilled patch16224預訓練的模型參數。將預訓練好的參數作為改進EMA一iT模型的初始權重,替代原來的隨機初始化參數。選擇訓練時不凍結策略,使用PlantVillage數據集和DatasetTomatoLeaves數據集對遷移后的網絡參數進行微調,最終獲得一種在番茄葉片病害分類任務上表現出較強泛化能力和魯棒性的模型。
2 結果與分析
2.1試驗環境及模型參數
模型訓練以及優化在GoogleColab上使用TensorFlow框架完成。硬件配置為TeslaT4,16G顯存,12G內存,Intel(R)Xeon(R) $\textcircled { \omega } 2 . 3 0 ~ \mathrm { G H z }$ CPU,軟件環境為TensorFlow2.8.2,Python3.7.O。在模型訓練過程中選用Adam優化器,初始學習率為0.OOO1,采用余弦退火策略進行更新,訓練批次(batchsize)大小設置為1OO,由于PlantVillage數據集與DatasetTomatoLeaves數據集番茄病害葉片數目相差較大,所以訓練PlantVillage番茄病害數據集迭代次數(epoch)為60,DatasetTomatoLeaves番茄病害數據集迭代次數(epoch)為120。知識蒸餾溫度系數 (T) 設置為1,超參數λ設置為0.5。
2.2 評價指標
準確率(Accuracy)常作為分類模型的一個主要評價指標,但當樣本數據不均衡時,準確率高低主要受占比大的類別影響。因此,通過準確率Accuracy、平均精確率MeanPrecision、平均召回率MeanRecall和平均F1值4個指標評價模型的性能,各指標計算如式(4)~式(10)所示。







式中: k 某種作物的病害種類; n 作物病害種類數量;
真陽性; TN 真陰性; FP 假陽性; FN- 假陰性。
平均F1值分別為 99.5%.99.7% 和 99.7% 。由于PlantVillage數據集圖像是在控制條件下獲取,背景一致,照明條件理想,圖像噪聲較少,目標特征相對于自然背景下數據集比較明顯,有助于本模型更容易地識別出病害特征。從表5可以看出,EMA一iTDist相比于EfficientNet、VGG16、ResNet5O、nsNetl21、ViF一small、Swin—small、DCNN模型,準確率分別提高 14%4.9%2.6%1.8%2.8%2.5%1.1% ,平均精確率分別提高 13.7%.4.9%.2.7%.1.9% 、2.8%.2.7%.1.2% ,平均召回率分別提高 14.8% 、5.3%.2.9%.1.9%.2.7%.2.7%.1.7% ,平均 F1 值分別提高 14.6%.5.3%.2.9%.2%.2.7%.2.7% 1.7% ,EMA—iTDist的識別準確率在所有對比模型中最高。
2.3PlantVillage數據集下試驗結果
100 SAH EMA-iTDist8 nsNet121VGG1650EfficientNet20 vii-smal10 →DCNN0 20 40 60迭代次數為驗證改進后iT模型性能優勢,使用在單一背景下拍攝的PlantVillage番茄病害數據進行多個模型的訓練,包括目前著名的4種CNN神經網絡,即VGGl6、nsNetl21、EfficientNet、ResNet5O;近年提出的2種同類Transformer模型中具有代表性的Vision Transformer、SwinTransformer,以及Schuler等[30]提出的DCNN模型。將以上這些模型在相同試驗條件下進行比較,試驗結果如表5所示。
表5不同網絡模型在PlantVillage番茄葉片病害測試集 試驗結果比較 Tab.5 Comparison experimental results different network models on the PlantVillage tomato leaf disease test set %

如圖11所示,提出的EMA—iTDist模型在60輪迭代后對于PlantVillage中1O類番茄病害識別準確率達到 99.6% ,同時,平均精確率、平均召回率和
圖11為不同模型訓練準確率對比曲線,可以看出,研究提出的EMA—iTDist模型識別準確率優于其他模型。EMA—iTDist模型在第5次迭代中就趨于收斂狀態,且識別本模型訓練過程曲線波動幅度較小,因為EMA一iTDist模型引入遷移學習技術與指數移動平均(EMA)策略,模型首先在ImageNet數據集上進行預訓練,期間積累圖像特征知識,當模型將其知識遷移到番茄葉片數據集時,它能夠迅速識別出與之前學習過的特征相對應的病害圖像,其次EMA算法在訓練過程中對模型參數進行平滑處理,通過計算前幾次迭代參數的加權平均來更新當前的參數值,相較于其他模型更穩定。
表6為各種模型對PlantVillage中1O類番茄葉片病害識別準確率對比,可以看出,EMA一iT模型對于10類病害的識別準確率高于其他模型,平均準確率為 99.5% ,識別準確率比其他模型的最佳結果高出 1.9% ,EMA一iT模型對細菌性葉斑病、早疫病、晚疫病、葉霉病、斑枯病、二點葉螨病、輪斑病、黃化曲葉病毒病、健康、花葉病毒的識別準確率分別為 99% 、 99% 、 100% 、 100% 、 100% 、 99% 、 99% /100% 、 100% 、 99% 。在4種傳統CNN模型中,nsNet121平均識別準確率最高,為 97.6% ,但對輪斑病的識別準確率只有 93% ;EfficienNet對輪斑病的識別準確率為 70% ,對健康葉片的識別準確率為85% 。這是因為番茄輪斑病與番茄健康病具有高度相似的顏色特征,即它們在顏色方面通常呈現暗綠色,而番茄輪斑病在葉斑形態方面早期時為綠褐色水浸狀小斑點,大小 2~3mm ,在病斑不明顯時容易出現識別混淆。
表6各種模型對PlantVillage中十類番茄葉片病害數據集識別準確率
Tab.6 Recognition accuracy various models on the PlantVillage dataset ten types tomato leaf disea

2.4DatasetTomatoLeaves數據集下試驗結果
為驗證提出的模型在復雜背景下的識別效果,在田間拍攝下的DatasetTomatoLeaves番茄病葉數據集訓練模型進行試驗比較。DatasetTomatoLeaves番茄病葉數據集包含的圖像均在自然環境中拍攝,因此背景更加復雜多變,包括不同的植物、土壤或其他自然元素。此外,光照條件不穩定,病害特征與自然背景混淆,這些因素都增加模型對于圖像分類的難度。如表7所示,提出的EMA一iTDist模型實現最大的準確率,在準確率、平均精準率、平均召回率、平均 F1 值上達到 98.2%.98.1%.98.2%.98.1% 本模型與 VGG16、nsNetl21、EfficientNet、ResNet50、ViF一small、Swin一small、DCNN模型相比,準確率提高 0.4%~27.9% ,平均精確率分別提高 0.3%~ 26.6% ,平均召回率分別提高 0.3%~17% ,平均F1 值分別提高 0.3%~17.1% 。DCNN 模型在PlantVillage番茄病葉數據集中識別準確率為98.5% ,而在DatasetTomatoLeaves番茄病葉數據集中識別準確率為 76.1% ,因為DCNN模型網絡分別針對無彩色(L通道)和有彩色(AB通道)數據進行處理,這種設計可以更有效地利用色彩信息提高植物病害分類的準確性,PlantVillage番茄病葉數據在試驗條件下相比于DatasetTomatoLeaves番茄病葉數據集更容易識別。在自然背景下的數據集中,EMA算法通過對本模型參數進行平滑處理,減少背景噪聲和光照變化外部變化對模型性能的負面影響,這樣的平滑效果有助于模型在訓練過程中維持穩定,避免對特定噪聲的過度擬合,增強模型對自然場景中番茄病害特征的泛化能力。根據訓練過程繪制8種模型在DatasetTomatoLeaves數據集訓練精度曲線如圖12所示。
表7不同網絡模型在DatasetTomatoLeaves番茄葉片病害測試集試驗結果比較Tab.7 Comparison experimental results different networkmodelsontheDataset Tomato Leaves tomato leafdisease test set

表8為各種模型對DatasetTomatoLeaves番茄病害數據集葉片準確率對比,可以看出EMA一iTDist模型對自然狀態下的番茄病害葉片識別準確率在5種模型中最優,對于細菌性葉斑病、黑霉病、灰斑病、晚疫病、健康、白粉病6類番茄病害的平均識別準確率均達到 98.1% ,Swin一small是對比模型中識別準確率最高的模型,平均識別準確率為 97.8% ,可對黑霉病的識別準確率僅為 95.2% 。結果表明,提出的模型能夠很好地克服自然背景下的干擾,證明該模型具有良好的通用性與魯棒性。
ab.8 Acuracy various models in identifying leafdiseases in the Dataset Tomato Leaves tomato diseases datas

2.5PlantDoc與Tomato一Village數據集下試驗結果
為驗證EMA—iTDist模型在其他番茄病害數據集上的表現能力,選取了PlantDoc與Tomato—Village番茄病害數據集進行泛化試驗,本模型在120輪迭代后對于PlantDoc數據集識別準確率達到97.1% ,對Tomato—Village數據集識別準確率達到97.6% ,精度曲線如圖13所示。本模型在PlantDoc數據集中的準確率、平均召回率、平均 F1 值分別為97.1%97.2%.97.1% ;在Tomato—Village數據集中的準確率、平均召回率、平均 F1 值分別為 97.6% 、97.6%.97.4% ,如表9所示。
表8各種模型對DatasetTomatoLeaves番茄病害數據集葉片病害識別準確率

表9泛化試驗對比 Tab.9 Comparison generalization experiments %

本模型對于PlantDoc數據集中的早疫病、晚疫病、細菌性葉斑病、葉霉病、番茄花葉病、斑枯病、健康葉片、黃化曲葉病毒病8類番茄葉片識別平均準確率為 96.9% ,對于Tomato—Village數據集中的早疫病、晚疫病、葉礦病、鎂缺乏癥、氮缺乏癥、鉀缺乏癥、斑點萎蔫病8類番茄葉片識別平均準確率為 97.5% ,如表10和表11所示。泛化試驗表明,本模型在除PlantVillage和DatasetTomatoLeaves數據集之外,在PlantDoc與Tomato—Village兩個數據集表現同樣優秀,驗證本模型對不同的背景條件、光照條件以及不同病害特征的識別能力。
表10EMA一iTDist對PlantDoc8類番茄葉片 數據集識別準確率 Tab.10 Recognition accuracy EMA—iT Dist model on thePlantDoceight tomato leafdataset

在泛化試驗中,EMA—iTDist模型主要處理不同數據集中的變異性和噪聲。本模型所使用的指數移動平均算法通過對模型參數進行加權平均,使得每次迭代參數更新都是平滑過的,從而降低模型對于單個批次數據異常點的敏感性。這樣的參數更新方法有助于避免模型在訓練過程中由于遇到極端數據而發生劇烈波動,從而提高模型在不同數據集上的穩定性,減少模型在面對不同數據集時由于過擬合造成性能下降。使用自蒸餾技術提高EMA—iTDist模型的自學習和自適應能力,自蒸餾使得本模型能夠基于當前已學到的知識自我調整,對PlantDoc與Tomato—Village數據集中存在的特定病害表現和噪聲類型,模型能自動識別并調整對特征的處理方法。如在PlantDoc數據集中存在由光照引起的顏色偏差,而Tomato—Village中包含新型的番茄病害,自蒸餾幫助模型在不斷迭代中優化處理這些問題的能力。在本試驗中指數移動平均算法為模型提供了穩定的參數更新機制,而自蒸餾加強模型對關鍵病害特征的學習和適應性,使模型能在多變的自然環境中保持高效和準確的識別能力。
2.6 消融實驗
為驗證遷移學習以及指數移動平均算法對iT模型性能的影響,分別針對PlantVillage和DatasetTomatoLeaves兩種數據集建立4種模型 EMA+TL+ iTDist、EMA+iTDist、TL + iTDist、iTDist進行消融實驗。經過訓練,其他3種模型結構與iTDist相比具有更高的準確性,其中EMA + TL+iTDist在4種模型中具有最高的準確率,在PlantVillage番茄葉片數據集中識別準確率為 99.6% ,在DatasetTomatoLeaves番茄葉片數據集中識別準確率為 98.2% 表明遷移學習以及指數移動平均算法對于單一環境以及自然環境下的番茄葉病鑒定均有優秀的效果。表12和表13展示4種模型結構識別2種番茄葉病數據集的結果。
表12PlantVillage番茄葉片數據集Tab.l2PlantVillage tomato leaf dataset

表13DatasetTomatoLeaves番茄葉片數據集Tab.13 Dataset Tomato Leaves tomato leaf dataset%

從表12可以看出,在PlantVillage番茄葉片數據集中EMA + TL+iTDist的識別準確率比基礎模型iTDist高出 4.7% 。從表13可以看出,在DatasetTomatoLeaves自然狀態下的番茄葉片數據集中識別準確率表現同樣優秀,比基礎模型iTDist高出 2.5% 。
圖14和圖15展示4種模型結構在兩種番茄葉片數據集上的訓練準確率對比曲線。由圖14和圖15可知,在PlantVillage番茄葉片數據集與DatasetTomatoLeaves數據集上,相比于沒有使用遷移學習的模型,EMA + TL + iTDist與TL+iTDist模型從訓練剛開始就有較高的精度,EMA + TL + iTDist在前5輪訓練迭代中達到 95% 以上的準確率,且在10輪迭代以后曲線達到相對穩定的狀態,曲線收斂速度遠超其他模型,原因是在使用遷移學習后,模型在ImageNet數據集的預訓練過程中學到了大量圖像特征,然后在兩種番茄葉片數據集中能迅速針對病害圖像對應已經學習到的特征,完成番茄葉病的識別。由圖14和圖15可知,相比于沒有使用滑動平均算法的模型,EMA + TL + iTDist與EMA + iTDist模型識別曲線更加平滑與健壯,在PlantVillage番茄葉片數據集訓練精度曲線中,雖然在前期EMA + 與iTDist沒有TL+iTDist與iTDist模型收斂速度快,但在30輪訓練迭代之后EMA + iTDist開始收斂,在后期超過TL+iTDist與iTDist模型。在PlantVillage數據集中模型識別準確率、平均準確率、平均召回率、平均 F1 值與原模型iTDist相比分別提高 3.7%.3.8%.4.1%.3.9%

3結論
針對番茄病害識別模型準確率不高、識別番茄葉部病害種類低等問題,將滑動平均指數算法和iT模型用于設計番茄葉部病害識別模型,引入遷移學習技術與自蒸餾策略。為驗證試驗設計方法的有效性,在PlantVillage、Dataset Tomato Leaves、PlantDoc、Tomato—Village數據集上進行試驗并對結果進行分析。
1)所提出的模型在公共數據集PlantVillage中10類番茄葉病識別準確率達到 99.6% 。在DatasetTomatoLeaves中6類番茄葉病數據集上的識別準確率達到 98.2% 。在泛化試驗的PlantDoc數據集中的識別準確率為 97.1% ,在Tomato—Village數據集中的識別準確率為 97.6% ,試驗證明本模型具有優秀的病害識別以及泛化能力。
2)基于改進EMA—iT與遷移學習的番茄葉片病害識別方法為農作物病害預警系統提供一種創新性的解決方案,為農業智能化發展提供有力支持,促進農業生產的效率和品質提升。
參考文獻
[1]陳明均,賀坦.全球蔬菜產業發展現狀[J].中國果菜,2025,45(5):1-8.
[2]甘中祥,劉磊,李鑫,等.我國加工番茄產業現狀與發展分析[J].中國蔬菜,2025,1(6):9-13.
[3]嚴婉榮,王寶,吉訓聰,等.番茄病毒病種類及主要鑒定方法研究進展[J].分子植物育種,2024,22(16):5357-5367.
[4]譚海文,潘玲華,吳永瓊,等.2019年桂林番茄病害發生情況調查初報[J].蔬菜,2021(12):37-40.
[5]賈少鵬,高紅菊,杭瀟.基于深度學習的農作物病蟲害圖像識別技術研究進展[J].農業機械學報,2019,50(S1): 313-317.Jia Shaopeng,Gao Hongju,Hang Xiao. Researchprogress on image recognition technology crop pests diseases based on deep learning[J].Transactions theChinese Society for Agricultural Machinery,2019,50(S1):313-317.
[6]王翔宇,溫皓杰,李鑫星,等.農業主要病害檢測與預警技術研究進展分析[J].農業機械學報,2016,47(9):266—277.Wang Xiangyu,Wen Haojie,Li Xinxing,et al. Researchprogress analysis mainly agricultural diseases detection early warning technologies [J]. Transactions theChinese Society for Agricultural Machinery,2Ol6,47(9):266—277.
[7]周飛燕,金林鵬,董軍.卷積神經網絡研究綜述[J].計算機學報,2017,40(6):1229—1251.
[8]藍金輝,王迪,申小盼.卷積神經網絡在視覺圖像檢測的研究進展[J].儀器儀表學報,2020,41(4):167—182.
[9]Abade A,FerreiraPA,de Barros Vidal F.Plant diseasesrecognition on images using convolutional neural networks:A systematic review[J].Computers Electronics inAgriculture,2021,185:106125.
[10] Simonyan K,Zisserman A. Very deep convolutionalnetworks for large-scale image recognition [J]. arXivpreprint arXiv:1409.1556,2014.
[11]許景輝,邵明燁,王一琛,等.基于遷移學習的卷積神經網絡玉米病害圖像識別[J」.農業機械學報,2020,51(2):230-236,253.Xu Jinghui,Shao Mingye,WangYichen,et al.Recognition corn leaf spot rust based on transferlearningwithconvolutionalneuralnetwork[J].Transactions the Chinese Society for AgriculturalMachinery,2020,51(2):230—236,253.
[12]王春山,趙春江,吳華瑞,等.采用雙模態聯合表征學習方法識別作物病害[J].農業工程學報,2021,37(11):180—188.Wang Chunshan,Zhao Chunjiang,Wu Huarui,et al.Recognizing crop diseases using bimodal joint representationlearning [J]. Transactions the Chinese SocietyAgricultural Engineering,2021,37(11):180-188.
[13]劉斌,徐皓瑋,李承澤,等.基于快照集成卷積神經網絡的蘋果葉部病害程度識別[J].農業機械學報,2022,53(6):286-294.Liu Bin,Xu Haowei,Li Chengze,et al.Apple leafdisease identification method based on snapshot ensembleCNN[J]. Transactions the Chinese Society forAgricultural Machinery,2022,53(6): 286-294.
[14]胡志偉,楊華,黃濟民,等.基于注意力殘差機制的細粒度番茄病害識別[J].華南農業大學報,2019,40(6):124—132.
[15]Huang G,Liu Z,Van r Maaten L,et al.nselyconnected convolutional networks [C]. Proceedings theIEEE Conference on Computer Vision PatternRecognition,2017: 4700—4708.
[16] Zhong Y, Zhao M. Research on deep learning in apple leafdisease recognition [J]. Computers Electronics inAgriculture,2020,168:105146.
[17]姜紅花,楊祥海,丁睿柔,等.基于改進ResNet18的蘋果葉部病害多分類算法研究[J].農業機械學報,2023,54(4):295-303.Jiang Honghua,Yang Xianghai,Ding Ruirou,et al.Identification apple leaf diseases based on improvedResNetl8[J].Transactions the Chinese Society forAgricultural Machinery,2023,54(4):295-303.
[18]劉敏,周麗.基于多尺度特征融合網絡的蘋果病害葉片檢測[J].中國農機化學報,2023,44(8):184—190.Liu Min,Zhou Li. Apple disease leaf detection based onmulti scale feature fusion network[J]. Journal ChineseAgriculturalMechanization,2023,44(8):184—190.
[19]張寧,吳華瑞,韓笑,等.基于多尺度和注意力機制的番茄病害識別方法[J].浙江農業學報,2021,33(7):1329-1338.
[20]王志強,于雪瑩,楊曉婧,等.基于WGAN和MCA一MobileNet的番茄葉片病害識別[J].農業機械學報,2023,54(5):244—252.
[21]馬麗,周巧黎,趙麗亞,等.基于深度學習的番茄葉片病害分類識別研究[J].中國農機化學報,2023,44(7):187—193,206.MaLi,Zhou Qiaoli,Zhao Liya,etal.Classification andrecognition of tomato leaf diseases based on deeplearning[J].JournalofChineseAgriculturalMechanization,2023,44(7):187—193,206.
[22]DhanalakshmiR,BalakrishnanK,Sinha BB,etal.Tomato leaf disease identification by modified inceptionbased sequential convolution neural networks [J]. TheImagingScience Journal,2023,71(5):408-424.
[23]鄭一力,張露.基于遷移學習的卷積神經網絡植物葉片圖像識別方法[J].農業機械學報,2018,49(S1):354-359.
[24]陳聰,于嘯,宮琪.基于改進殘差網絡的蘋果葉片病害識別研究[J].河南農業科學,2023,52(4):152—161.
[25]牛學德,高丙朋,南新元,等.基于改進DenseNet卷積神經網絡的番茄葉片病害檢測[J].江蘇農業學報,2022,38(1): 129—134.
[26] Dosovitskiy A,Beyer L,Kolesnikov A,et al. An image is worth 16×16 words: Transformers for image recognition at scale[J]. arXiv preprint arXiv: 2010.11929,2020.
[27]Touvron H,Cord M,Douze M,et al.Training data-efficient image transformers amp;.distilation through attention [C]. International Conference onMachine Learning PMLR,2021: 10347—10357.
[28]Hinton G,Vinyals O,Dean J. Distilling the knowledge in a neural network[J].arXiv preprint arXiv:1503.02531,2015.
[29] Zhang L,Song J,Gao A,et al. Be your own teacher: Improve the performance of convolutional neural networks via self-distillation [C].Proceedings of the IEEE/CVF International Conference on Computer Vision, 2019: 3713-3722.
[30] Schuler J P S,Romani S,Abdel-Nasser M,et al. Color-aware two-branch DCNN for eficient plant disease classification[C].Mendel,2022,28(1):55-62.