





摘要:玉米葉片是玉米進行光合作用的主要器官,其生理生態的快速檢測對玉米的質量和產量起著至關重要的作用。因此,文章提出一種基于YOLOv5模型的玉米葉片識別方法。文章利用Kinect 2.0相機水平獲取了玉米植株生長時期的圖像數據;利用YOLOv5模型,實現了玉米葉片目標檢測,并將其與YOLOv3和YOLOv7進行對比。結果表明:YOLOv5模型的精確度、召回率、F1分數分別達到了94.7%、95.2%和93.4%,其平均精度均值與YOLOv3和YOLOv7相比提高了3.9%、1.4%。該成果為玉米葉片實時檢測系統的研發注入了強大動力,同時也在人工智能育種和估產領域展現了不可或缺的技術支撐作用。
關鍵詞:玉米;葉片;深度學習;YOLOv5;識別模型
中圖分類號:TP39"""""""" 文獻標志碼:A
0 引言
玉米是世界5大主要食用作物之一,在人類以及家禽畜牧業的糧食供給需求上起著非常重要的作用[1]。玉米葉片是生物學上的光合產物工廠,在玉米的生物生產和生態功能、營養轉運與分配中起著關鍵性的作用,是玉米生命活動與生長發育的重要決定因素[2]。因此,對玉米植株葉片進行健康狀況檢測,對探究葉片對植株生長的作用規律以及玉米的優良品種選育具有重要意義。
基于YOLOv5模型的玉米葉片識別技術已經順利地執行了各種任務,包括對農作物的果實、病蟲害、稈部以及生長狀況的詳盡評估和分析[3]。陸嬌嬌等[4]提出了一種通過優化YOLOv5模型中的注意力機制和損失函數進行改進的農作物蟲害圖像識別方法,有效提高了蟲害圖像特征提取的精度,實現了蟲害的高效識別。王瑞彬等[5]提出了一種通過融合深度殘差網絡ResNet50和注意力機制對SSD算法進行優化的目標檢測算法,顯著提高了成熟草莓的檢測精度,達到了20.20%的提升。徐澤華等[6]提出了一種運用卷積神經網絡結合OpenCV、固態硬盤(Solid State Disk,SSD)及TensorRT的優化技術,實現了高效且快速的植物葉片病害識別和分類。Li等[7]提出了一種利用改進的YOLOX-Tiny目標檢測網絡,結合卷積注意力模塊、mixup數據增強策略和中心IOU損失函數,提高了玉米疾病檢測的精確率。胡文澤等[8]通過改進Cascade R-CNN模型,結合ResNet50和特征金字塔網絡,有效提升了農業機器人在自然環境下對玉米幼苗的檢測精度。李涵等[9]提出了一種在ResNet34基礎上加入CBAM注意力模塊的CBAM_ResNet34卷積神經網絡模型,能更精確地識別并分類相似的玉米病害,其精確率達到了88.1%。付中正等[10]提出了一種利用特征輔助學習和數據增強的SSD網絡對西蘭花葉片進行檢測的方法,提高了在復雜環境下對西蘭花葉片檢測的精確率。
傳統方法存在對玉米葉片識別的準確性和效率不高的問題。因此,本文提出了基于YOLOv5模型的玉米葉片識別方法。本文通過Kinect2.0相機構建了水平實驗采集平臺,采集了生長時期玉米完整植株數據;采用YOLOv5算法構建玉米葉片識別模型,并使用機器學習評價指標對模型結果進行評價。本文提出的YOLOv5模型對玉米葉片檢測具有較高的精確率,能夠為玉米生長進行指導,對推動農業可持續發展具有重要意義。
1 YOLOv5網絡模型
YOLOv5是一種高效的單階段目標檢測算法。該算法汲取了許多先進網絡結構的優點,在保證高檢測精度的同時,維持較高的檢測速度,能夠實現實時檢測目標。YOLOv5的網絡結構主要由輸入端(Input)、主干網絡(Backbone)、頸部網絡(Neck)和輸出檢測層(Head)4個部分組成。其中,輸入端通過數據增強技術,如縮放、裁剪和顏色調整,來增強模型的泛化能力和適應性。同時,該模型還優化了圖像處理和錨框生成機制,以適應不同的檢測任務。
主干網絡采用CSPDarkNet53結構,通過跨階段的特征提取算法——共空間模式(Common Spatial Pattern,CSP)算法塊降低計算的復雜度;同時,利用SPPF模塊提高感受野并增強空間層級的特征提取能力。頸部網絡結合了特征金字塔網絡(Feature Pyramid Network,FPN)和路徑聚合網絡(Path Aggregation Network,PAN),通過融合不同層級的特征,增強特征的語義信息,從而提高檢測的精度。FPN提供自頂向下的信息傳遞,而PAN則強化了自底向上的信息流。輸出檢測層將不同尺度的有效特征層通過1×1卷積輸出,生成網絡的最終檢測結果。本文應用的YOLOv5模型結構如圖1所示。
圖1中YOLOv5的組件FOCUS、Resunit、CSP1_X、CSP2_X、SPP等分布在模型的不同部分,共同實現圖像的多尺度特征提取、特征增強和空間信息增強,以提高模型的檢測性能。FOCUS通過不同尺度的卷積和上采樣,生成豐富尺度的特征圖,用于模型的輸入端(Input);Resunit通過殘差連接和批量歸一化增加網絡的非線性表達能力,應用于模型的主干網絡(Backbone);CSP1_X和CSP2_X利用CSP算法塊進行特征融合,減少參數量和計算量,應用于模型的頸部網絡(Neck);SPP對特征圖進行空間金字塔池化,增強特征圖的空間信息,應用于模型的輸出檢測層(Head)。依據常禧龍等[11]的Adam優化器進行模型訓練,優化公式為:
θt+1=θt-αβ1mt-1+(1-β1)gt(1-βt1)β2vt-1+(1-β2)g2t1-βt2+ε(1)
其中,gt表示梯度,mt-1、vt-1分別表示上一時刻的一階矩和二階矩估計,β1、β2表示動量參數,θt表示第t次迭代后的參數值,α表示初始學習率,ε表示一個很小的常數(通常取10-8),用于避免除以0的情況。
2 模型訓練與結果分析
2.1 訓練模型
2.1.1 訓練環境
本文的實驗環境為Windows 10操作系統,CPU為Intel(R) Core(TM) i5-4590,主頻為3.30 GHz,葉片識別模型的搭建使用Python 3.11開發環境,深度學習框架選用Pytorch。GPU使用NVIDIA GeForce GTX 1050 Ti進行運算加速,GPU的運行內存為8 GB,使用12. 2 CUDA,并使用Python語言編程訓練。
本文的數據集包括254個文件和標簽,其中訓練集含102張圖片,測試集含25張圖片,用于有效訓練檢測模型。
2.1.2 訓練結果
在訓練YOLOv5模型時,本文將輸入圖像的大小調整為640×640像素,為了加速模型的學習過程,設定初始學習率為0.01,動量因子系數設置為0.937來加速梯度傳播。同時,為了防止模型在訓練過程中過度擬合訓練數據,權重衰減系數設置為0.0005,在每次迭代中,本文使用4個樣本作為一個batch,整個訓練過程持續300個epochs。
損失函數是評估模型預測性能的核心指標,通過將預測結果與實際數據之間的偏差量化,幫助判斷模型的性能是否趨近最優。當損失函數曲線趨于收斂時,意味著模型性能已趨近最優,預測效果顯著提升。依據劉笑意等[12]的研究對模型進行損失函數分析,損失函數曲線如圖2所示。
由圖2可以看出,隨著epoch的增加,損失函數曲線逐漸降低,趨于平穩。YOLOv5模型在前50輪訓練中表現出極快的損失下降速度,凸顯了其高效的學習能力。隨著epoch的增加,損失函數值逐漸降低并趨于平穩,最終穩定在0.024左右。此外,YOLOv5模型的損失函數不僅下降速度快,而且損失曲線波動較小,呈現平滑的趨勢。這充分說明了在玉米葉片識別任務中,YOLOv5模型的預測效果較好。
2.2 仿真結果分析
2.2.1 不同模型預測的精確率-召回率曲線分析
本文對比了YOLOv5模型、YOLOv3模型、YOLOv7" 模型的玉米葉片識別的精確率(P)、召回率(R),結果如表1所示。
由表1可知,YOLOv5模型在玉米葉片檢測任務上表現最佳,精確率高達94.7%,召回率也達到了95.2%。這說明YOLOv5模型在確保檢測精確性的同時,能夠覆蓋大部分真實的玉米葉片實例。相比之下,YOLOv3的精確率與YOLOv5相近,但召回率僅為87.3%,這表明該模型識別玉米葉片的精確度較高,但遺漏了較多的實例。而YOLOv7的精確率略低于YOLOv5,但召回率高于YOLOv3。這表明該模型在減少漏檢方面有所改進,但識別精確性仍不及YOLOv5。因此,在玉米葉片檢測任務中,YOLOv5因其較高的精確率和召回率而表現得更加出色。
不同模型的精確率-召回率(P-R)曲線對比結果如圖3所示。由圖3可以看出,YOLOv5模型的精確率在召回率小于0.62時保持在93%左右。當YOLOv3模型的召回率為0.57,YOLOv7模型的召回率為0.60時,二者模型的精確率穩定在93%左右。YOLOv3和YOLOv7模型的P-R曲線在召回率為80%左右出現拐點,而YOLOv5模型的拐點出現在召回率為90%左右,表現更為平滑。因此,在相同的交并比條件下,YOLOv5模型在目標檢測任務中表現最佳,其平均精度和召回率均高于YOLOv3模型和YOLOv7模型。此外,YOLOv5模型的精確率維持在較高水平的時間更長,P-R曲線更平滑,預測效果更穩定。
2.2.2 不同模型玉米葉片識別預測性能對比分析
本文使用調和精確率和召回率有相同權重的F1分數、平均精度均值(mean Average Precision, mAP)2個指標對比分析不同模型對于玉米葉片識別的性能。其中,計算玉米葉片識別中“leaf”這一類別的平均精度(Average Precision,AP)值,可以通過計算其P-R(精確率-召回率)曲線下方的面積來實現。由于本文只涉及一個識別目標,AP值等同于多類別情況下的mAP。不同模型的F1分數與mAP值如表2所示。
在精確率和召回率中,任意一個指標的提高通常伴隨著另一個指標的降低。因此,單獨評價任一指標不足以全面評估模型性能。F1分數作為精確率和召回率的綜合評價指標,值越高,模型在玉米葉片識別任務中展現出的性能越卓越。由表2可知,YOLOv5模型檢測的F1得分是93.4%,而YOLOv3模型玉米葉片檢測的F1得分為89.5%,YOLOv7模型檢測的F1得分是91.2%。YOLOv5相較于YOLOv3和YOLOv7模型分別提升了3.9%和2.2%。YOLOv5模型在玉米葉片識別任務中達到了94.0%的平均精度,而YOLOv3和YOLOv7模型在玉米葉片識別任務中的識別率分別達到了90.1%和92.6%。YOLOv5模型的mAP值有了顯著提升,這充分說明了YOLOv5模型在玉米葉片識別任務上的優越性,表現出了較強的泛化能力,具有更高的識別精度。
3 結語
本文提出了一種基于YOLOv5模型的玉米葉片識別方法,并成功將其應用于玉米植株生長時期的葉片探測。通過利用Kinect2.0相機獲取的玉米植株圖像數據,本文結合深度學習技術,構建了一個高效且準確的玉米葉片識別系統。與YOLOv3和YOLOv7相比,YOLOv5模型在玉米葉片的識別精確率和召回率上均取得了顯著優勢,分別達到了94.7%和95.2%,平均精度均值較其他2個模型有所提升。同時,本文展示了YOLOv5算法在農業領域的有效性和適用性,突顯了深度學習技術在提高農業生產效率、優化田間管理以及促進農業可持續發展方面的潛力。通過自動化、智能化的玉米葉片識別,本文能夠準確監測玉米植株的生長狀況,及時發現并處理生長問題,進而提升產量和質量。這種方法可推廣到其他農作物的識別與檢測,助力農業智能化和精準化發展。隨著深度學習技術的不斷進步,農業生產將迎來更高效、環保和可持續的新時代。
參考文獻
[1]崔愛民,張久剛,張虎,等.我國玉米生產現狀及發展變革[J].中國農業科技導報,2020(7):10-19.
[2]楊健釗,朱新廣.面向碳達峰與碳中和的植物合成生物學[J].合成生物學,2022(5):847-869.
[3]岑海燕,朱月明,孫大偉,等.深度學習在植物表型研究中的應用現狀與展望[J].農業工程學報,2020(9):1-16.
[4]陸嬌嬌,段峰峰.改進YOLOv5模型下農作物蟲害圖像識別算法仿真[J].計算機仿真,2023(11):156-160.
[5]王瑞彬,楊世忠,高升.融合殘差網絡與注意力機制的草莓檢測[J].中國農機化學報,2024(1):266-273.
[6]徐澤華,李堅孝,鄧樹源,等.基于TensorRT的植物葉片病害實時檢測分類模型優化[J].計算機系統應用,2023(2):94-101.
[7]LI S, YANG Z, NIE H, et al. Corn disease detection based on an improved YOLOX-Tiny network model[J]. International Journal of Cognitive Informatics and Natural Intelligence,2022(1):1-8.
[8]胡文澤,王寶聚,耿麗杰,等.基于Cascade R-CNN的玉米幼苗檢測[J].農機化研究,2023(5):26-31.
[9]李涵,唐友,辛鵬,等.基于改進ResNet34的玉米病害分類研究[J].無線互聯科技,2023(13):127-130.
[10]付中正,何瀟,方逵,等.基于改進SSD網絡的西蘭花葉片檢測研究[J].中國農機化學報,2020(4):92-97.
[11]常禧龍,梁琨,李文濤.深度學習優化器進展綜述[J].計算機工程與應用,2024(7):1-12.
[12]劉笑意,段納,徐止政,等.基于改進YOLOv5的蘋果葉病害識別算法[EB/OL].(2024-05-13)[2024-06-05].https://link.cnki.net/urlid/31.1260.TP.20240511.1226.002.
(編輯 王雪芬)
Corn leaf recognition method based on YOLOv5 model
LUO" Su, GUAN" Hai’ou*
(College of Information and Electrical Engineering, Heilongjiang Bayi Agricultural University,
Daqing 163319, China)
Abstract: Corn leaf is the main organ of corn for photosynthesis, and the rapid detection of its physiological ecology plays a crucial role in the quality and yield of corn. Therefore, this paper proposes a corn leaf recognition method based on the YOLOv5 model. The image data of corn plant growth period is acquired by using Kinect 2.0 camera level, and by using YOLOv5 model, corn leaf target detection is realized and compared with YOLOv3 and YOLOv7. The result shows that the precision, recall, and F1-score of the YOLOv5 model reached 94.7%,95.2%, and 93.4%, respectively, and compared with YOLOv3 and YOLOv7, its mean average precision value is improved by 3.9% and 1.4%. The results injects strong impetus to the research and development of real-time detection system for corn leaf,and also demonstrates its indispensable technical support in the field of artificial intelligence breeding and estimation yield.
Key words: corn; leaves; deep learning; YOLOv5; recognition model
基金項目:國家重點研發計劃;項目名稱:優質專用、耐密高產、宜粒收玉米品種篩選標準體系構建;項目編號:2023YFD2301701。
作者簡介:羅蘇(2002— ),男,本科生;研究方向:計算機科學與技術。
*通信作者:關海鷗(1980— ),男,教授,博士;研究方向:計算機應用技術與人工智能。