












doi:10.15889/j.issn.1002-1302.2024.20.017
摘要:為解決溫室環境草莓果實的快速準確識別問題,提出了一種基于改進YOLO v5s的草莓成熟度檢測方法。使用基于Channel Shuffle的多路聚合網絡替換YOLO v5s中的C3模塊,在豐富模型特征提取能力的同時,使得網絡模型輕量化。同時采用SE注意力機制和最大池化層重構下采樣模塊,提高模型對有效通道的關注度。利用自制的草莓數據集對改進模型進行評估,結果表明,改進模型(YOLO-SR,YOLO-Strawberry Ripeness)的mAP達98.0%,模型大小僅為5.6 MB,在GPU(RTX 3060)上的單張平均檢測速度僅8.2 ms。與原始YOLO v5s相比,YOLO-SR的mAP提升0.8百分點,參數量和浮點計算量分別減少60.0%和54.9%。本研究使用TensorRT加速引擎將模型部署到Jetson Nano平臺,結果表明,固定輸入分辨率為480×480且使用半精度推理時模型的檢測效率最高,mAP和檢測時延分別為97.7%和69.4 ms,相比于YOLO v5s原始網絡,mAP仍提高了0.5百分點,推理速度提升64%。該輕量化方法能夠快速準確地對溫室環境下的草莓果實成熟度進行檢測,為智慧農業技術在草莓種植中的應用提供可選擇方案。
關鍵詞:草莓;目標檢測;輕量化;YOLO;SE注意力
中圖分類號:TP391.41" 文獻標志碼:A
文章編號:1002-1302(2024)20-0138-09
收稿日期:2024-03-06
基金項目:福建省自然科學基金(編號:2019J01403);福建農林大學科技創新專項基金(編號:KFB23165A)。
作者簡介:陳仁凡(1997—),男,河南信陽人,碩士研究生,主要從事深度學習在農作物中的應用研究。E-mail:3211239007@fafu.edu.cn。
通信作者:謝" 知,博士,副教授,碩士生導師,主要從事農業信息感知技術研究。E-mail:xz@fafu.edu.cn。
草莓果實芳香多汁,營養豐厚,被譽為“水果皇后”,有著較高的營養價值,據聯合國糧食及農業組織的統計數據顯示,2021年草莓在全球范圍內的產量高達0.126億t,收獲面積為52萬hm2[1-2]。然而草莓生長培育過程中的智能化水平較低,生長狀態檢測和果實采摘仍需要大量勞動力。因此,草莓產業的智能化種植顯得尤為重要,而精準識別果實是智能化種植的先決條件。
傳統機器學習的果實識別首先提取果實的物理特征,再使用模式識別分類器進行分類[3-5],例如支持向量機[6]、極限學習機[7]和隨機森林[8]。Ibba等使用草莓的生物阻抗數據來訓練機器學習分類器取得了較好的成果,但生物阻抗數據獲取復雜[9]。Shao等使用便攜式光譜成像技術對草莓3個成熟階段進行采集,并使用偏最小二乘判別分析和最小二乘支持向量機進行評估,該方法可用于田間草莓成熟度評估,但操作復雜[10]。傳統的機器學習檢測算法在復雜的自然環境下魯棒性和泛化能力較差,識別準確率較低,難以滿足實際應用中的需要。
近年來,隨著深度學習的發展,基于卷積神經網絡的計算機視覺技術在農作物識別中取得了巨大成就[11-13]。相比于傳統的機器學習技術,深度學習具有更強大的特征學習能力和更高的魯棒性。深度學習能夠有效提取圖像中的局部和全局的關鍵信息,從而更好地區分不同類型的農作物。目前已有諸多研究關注于深度學習在水果成熟度檢測中的應用。Fan等提出在深度學習中結合暗通道增強技術對4種不同成熟度的草莓進行識別,解決了夜間采集光照較暗的問題[14]。Phan等提出了YOLO v5m分別結合ResNet-50、ResNet-101和EfficientNet-B0對3種不同成熟度的番茄進行分類,為番茄自動收獲提供了一種精確的方法[15]。Liu等提出一種改進的DenseNet,并運用結構化稀疏運算方法提高特征傳播的精度,該方法在檢測率上優于其他方法[16]。上述這些基于深度學習的方法一般模型較大,計算成本高昂,難以在嵌入式和移動端設備中部署。
自然界中的機器視覺任務存在背景復雜、光照變化、噪聲等干擾,為了提高模型的準確率,基于卷積神經網絡的深度學習網絡逐漸加深加寬,導致模型的計算量、參數量和內存占用都在不斷增大,難以在實際應用中部署到算力和存儲空間有限的嵌入式設備中。為了解決該問題,研究者們在深度學習網絡輕量化方向做了多種嘗試[17-18]。Chen等設計了SE-CSPGhostnet替換YOLO v4的主干特征提取網絡,使得模型參數減少了82.79%,并應用在葡萄檢測中[19]。Lan等使用模型剪枝技術對Swin Transformer的多層堆疊結構進行修剪,最后將修剪后的模型部署到Jetson Xavier上,實現果園內無人機實時巡邏[20]。Lyu等為實現雌雄荔枝花的快速檢測,使用多教師預激活特征蒸餾,選擇相對復雜的YOLO v4和YOLO v5I作為教師模型,選擇相對簡單的YOLO v4-tiny作為學生模型,并將最終的學生模型部署到FPGA嵌入式平臺[21]。
草莓生長環境復雜,果實大小各異,遮擋嚴重,一般的方法模型易造成果實的漏檢和誤檢。為了滿足草莓高度精確檢測要求,開發一種魯棒性和泛化性好,并可部署到邊緣設備的輕量化檢測模型十分必要。因此,本研究提出了一種新的草莓成熟度檢測模型YOLO-SR,該模型在檢測精度提升的同時,實現了模型的輕量化,綜合檢測性能優越。
1" 材料與方法
1.1" 圖像采集
草莓成熟度數據集在2023年3月拍攝于福建省福州市閩侯縣農心農業科技示范園。拍攝所用設備為iPhone13,距離草莓果實10~20 cm并不斷調整拍攝角度和距離進行拍攝。數據集圖像在白天拍攝于科技示范園內的溫室大棚,該數據集分為3個部分:未成熟草莓圖像、半成熟草莓圖像和成熟草莓圖像,其中包括不同大小、背景和果實遮擋重疊等真實場景。最終經過篩選獲得3 350張草莓圖像,未成熟、半成熟和成熟草莓樣本數量分別為 10 371、3 788、2 084個。
1.2" 數據集構建
由于草莓成熟度相關的數據集比較匱乏,所以本研究根據上述草莓圖像建立了與草莓成熟度相關的數據集RS_0(Ripeness of strawberries v0)。該數據集包括上述的3 350張涵蓋3種成熟度的草莓果實圖片,草莓圖片的分辨率統一縮放為1 080×1 080,圖片格式為jpeg。使用LabelImg對該圖像中的草莓果實區域進行標注,并保存了2種標注格式(txt和xml),其中txt為YOLO系列網絡的標注格式,xml為PASCAL VOC2007標注格式。
為了平衡不同類別草莓樣本之間的數量,本研究篩選出半成熟和成熟樣本并使用了一系列數據增強方法,例如翻轉、模糊、加噪聲和HSV變換等(圖1)。經過數據增強后,半成熟樣本從3 788個擴充到8 746個,成熟樣本從2 084個擴充到3 556個。
1.3" YOLO v5網絡模型
YOLO v5是一種基于深度卷積神經網絡的目標檢測模型,其主要結構由主干(backbone)、頸部(neck)和頭部(head)組成。主干采用一種基于CSP
(cross stage partial)的DarkNet網絡結構,用于提取不同尺度的特征圖,并通過跨尺度特征融合方式進行整合,以充分獲取全局目標信息;頸部使用FPN(feature pyramid network)和PAN(path aggregation network)相結合方式來加強特征表達;頭部負責目標檢測和類別信息的預測。
1.4" 網絡模型的改進
本研究對原始YOLO v5模型進行3個方面的改進,改進后的YOLO-SR模型如圖2所示。首先,將YOLO v5s中的C3模塊更換為更加高效和輕量的MANCS模塊,使模型在顯著降低參數量和運算量的同時,較大程度上提升模型的信息捕捉能力和特征融合能力;其次,把下采樣模塊(后3次)替換為MP_SE模塊,使得模型進一步輕量化,同時增加模型的特征提取能力;最后,將頸部網絡中的Concat模塊替換為Chuncat模塊,讓模型在不增加額外參數量的情況下,弱化特征圖之間的相關性,增強模型的非線性表達能力,從而提高模型的擬合能力和泛化能力。具體改進如下:
1.4.1" 特征提取模塊的改進
YOLO v5s主干和頸部使用的特征提取模塊為基于CSP架構的C3模塊。其主要作用是增加網絡深度和感受野,使模型學習到更深層次的特征,提高特征提取能力。
由于C3結構對不同深度特征的融合能力有限,并且在YOLO v5s中參數量高達3.9 M,浮點計算量(FLOPs)高達9.66 G。因此本研究通過改進一種基于Channel Shuffle的多路聚合網絡(MANCS),以替換YOLO v5s中的C3結構,從而提高模型的性能和計算效率。這種多路聚合網絡的結構主要包括2個重要的特點:一是使用Channel Shuffle模塊來增加不同特征之間的交互和信息流通;二是采用多路聚合策略,將不同層級的特征圖按照通道維度拼接的方式進行聚合,進一步提高特征融合能力。
MANCS的結構如圖 3所示。輸入特征圖經過上分支和下分支之后,特征圖通道數縮小為原來的1/4。在上分支中使用了深度可分離卷積,可以大大降低模型的計算量和參數量,并且降低模型的過擬合風險。同時在上分支中使用了SE注意力機制,可有效提高模型對于特征圖中重要信息的關注度,進一步提高模型的特征表達能力。接下來將上下分支的所有4個模塊特征圖按照通道維度拼接,恢復通道數為輸入通道數。再經過Channel Shuffle操作將Concat拼接后的特征圖在通道維度上進行劃分和重組,以增加特征圖的多樣性,減少特征圖之間的相關性和信息冗余,從而增強模型對不同特征的非線性表達能力。最后再經過標準卷積模塊將通道數改變為輸出通道數。使用MANCS結構替換C3結構后的參數量為0.9 M,FLOPs為2.73 G,相比于之前的C3結構,參數量降低了76.9%,FLOPs降低了71.7%。
1.4.2" 下采樣模塊的改進
YOLO v5s共有5次下采樣操作,其中后3次下采樣操作使用核尺寸為3、步距為2的卷積核來進行,該方法雖然取得了很好的效果,但仍存在一定局限性。比如,為了縮小特征圖的尺寸,必須壓縮丟棄一些信息,可能導致一些關鍵的目標信息丟失,從而影響模型性能。
為了解決這一問題,本文設計了一種基于Maxpool最大池化和SE注意力機制的下采樣模塊(MP_SE)。如圖 4所示,MP_SE采用一種并行結構,將輸入特征圖按照通道維度劃分為2個部分,分別輸入到上、下2個分支中。這樣做有2個好處:一是將不同通道的信息進行處理,從而提取更加豐富的特征信息;二是特征圖被劃分成2個部分并輸入到不同的分支中進行處理,最后再將處理后的特征圖進行拼接,該方法減少了計算量,提高運行效率。下分支使用了最大池化和標準卷積,最大池化層是一種無參數操作,可以有效降低模型參數量,并且能保存更多的關鍵特征信息。上分支使用了SE注意力機制和核尺寸為3、步距為2的標準卷積,可以提取到更具針對性的特征信息。最后將2個分支輸出的特征圖按照通道維度拼接起來,綜合2個分支提取到的不同特征信息,從而豐富模型的特征提取能力。
1.4.3" 特征拼接模塊的改進
YOLO v5頸部網絡中使用了PAN結構,利用Concat模塊將來自主干網絡中的特征圖和頸部網絡中的特征圖按照通道維度拼接起來,保留高分辨率和高層語義信息的同時,進一步提高了模型對不同尺度目標的識別能力。然而Concat模塊只是簡單地將2個形狀相同
的特征圖拼接起來,不能豐富模型的非線性表達能力。本研究采用的Chuncat模塊不同于Concat模塊,如圖5所示,Chuncat依次將要拼接的2個特征圖按照通道維度劃分為2個部分,并分別加入到2個空列表中,最后再將2個列表里的特征圖拼接起來。所以該方法在不增加參數量的前提下,弱化了特征圖之間的通道相關性,增強模型的非線性表達能力。
1.5" 模型部署
改進模型部署于Jetson Nano平臺,Jetson Nano是NVIDIA公司開發的帶有GPU處理器的嵌入式開發板,也是一款功能強大的小型計算機,專為入門級邊緣AI應用程序而設計。Jetson Nano支持Pytorch、TensorFlow、Caffe和Keras等主流的深度學習框架,同時內置了能夠加速推理的TensorRT加速引擎。Jetson Nano的GPU采用Maxwell架構,支持半精度浮點計算,相比于傳統的單精度浮點計算,使用更少的位數來表示數值,能夠減少存儲需求和計算復雜度。Jetson Nano測試場景如圖 6所示。
TensorRT是由NVIDIA開發的一種高性能推理引擎,專為深度學習推理任務而設計[22]。它針對NVIDIA GPU, 提供了一系列優化技術和功能,可以
實現快速、低延遲的推理,適用于各種場景,包括嵌入式設備、數據中心服務器和云計算平臺等。TensorRT的整體工作流程如圖7所示,圖 7-a顯示了TensorRT的生成工作流,它通過Builder使用給定的優化配置參數和網絡定義來創建一個優化的推理引擎;與此同時還提供了一些優化技術,如層融合和動態張量內存;此外,它可以允許用戶設置混合精度(例如float32、float16)。圖7-b顯示了生成進行推理的執行上下文的工作流。
從優化模型性能和節省存儲空間的角度出發,為了節省Jetson Nano 的GPU顯存、內存和算力,本研究采用了模型精度轉換的方式,將模型的數據類型從32位浮點數轉換為16位浮點數。
2" 結果與分析
2.1" 試驗環境及參數設置
本試驗的硬件環境為Intel" coreTM" i5-12600K 3.7 GHz、NVIDIA GeForce RTX 3060和32 G內存,軟件環境為Windows10操作系統,使用Pytorch 1.11深度學習框架,結合CUDA 11.3進行訓練。
模型部署設備采用英偉達公司的Jetson Nano,GPU為128-core NVIDIA MaxwellTM,CPU為Quad-Core ARM" Cortex-A57 MPCore,內存為4 G,顯存為8 G。相應配置系統為ARM版Ubuntu 18操作系統,模型運行環境配置為Jetpack 4.6、Python 3.6、 Pytorch 1.8、Torchvision 0.9、Cuda 10.2、Cudnn 8.0。
本試驗采用SGD優化器進行優化,輸入圖像分辨率為640×640,學習率為0.01,動量為0.937,權重衰減為0.000 5,批尺寸為16,交并比為0.5,并訓練100個輪次(Epoch)。
2.2" 評價指標
評價草莓成熟度檢測模型的性能指標有精確度(precision,P)、召回率(recall,R)、平均精度均值(mAP)、參數量(parameters)、浮點計算量(FLOPs)、權重大小(memory size)和平均檢測時延(latency)。P、R和mAP可以用以下方程式來計算。
P=TPTP+FP×100%;
R=TPTP+FN×100%;
mAP=∑APN=∑∫10P(R)dRN。
式中:TP表示正確識別為正樣本的數量;FP表示將負樣本錯誤地識別為正樣本的數量;FN表示將正樣本錯誤地識別為負樣本的數量;AP為平均精度;mAP為目標各類別AP的均值,是一種綜合考慮定位精度和分類精度的指標,它基于Precision-Recall曲線得出,能夠全面評估算法的準確性和魯棒性;N為樣本量。
2.3" 模型訓練
模型訓練過程中的準確率、召回率和mAP的變化情況如圖8-a所示。由于本次試驗使用了在Strawberry_DB0 數據集上訓練100 個輪次的 YOLO v5s 模型權重進行訓練,因此模型在第0輪的mAP就達到了70%以上。隨著訓練過程不斷迭代,mAP不斷上升并趨于平緩的收斂狀態。模型訓練過程中驗證集上的損失變化如圖8-b所示。模型的邊界框損失、目標損失、類別損失和總損失在60輪以后都趨于穩定,結合圖8-a可知,該模型達到收斂狀態。最終準確率、召回率和mAP分別達到94.6%、94.8%和98.0%。由于使用了域內遷移學習,本研究的改進模型在較短時間內達到收斂狀態。
2.4" 消融試驗
本研究使用基線網絡YOLO v5s和改進的 YOLO-SR在Strawberry_DB0進行訓練,消融試驗結果見表 1。其中試驗1為基線網絡YOLO v5s,試驗1~4為逐步優化了各個模塊的消融試驗。如表所示,試驗2為使用了MANCS模塊的網絡模型,雖然準確率降低了0.4百分點,但是召回率和mAP分別上升了0.8、0.4百分點,浮點計算量(FLOPs)降低了 6.4 G,說明MANCS模塊在降低計算量的同時,引入的SE注意力機制和Channel Shuffle提高了模型的特征表達能力和融合能力,從而改善了模型對一些難以檢測目標的識別能力。試驗3采用MP_SE下采樣模塊進一步降低了計算量,其中使用的SE注意力機制,增強了模型對目標的關注力,從而使模型的準確率和mAP均得到提升。試驗4引入Chuncat模塊,增強了模型的非線性表達能力,提升了模型的目標分類能力和檢測能力,使得準確率、召回率和mAP比基線網絡分別提升0.8、0.7、0.8百分點,FLOPs降低了9.3 G。
2.5" 不同注意力機制對比試驗
本研究在設計MANCS模塊時,為了探究不同注意力機制對草莓成熟度檢測性能的影響,在消融試驗2的基礎上(僅將特征提取模塊C3替換為MANCS)將MANCS中的SE注意力機制替換為不同的注意力機制,通過對比分析以達到模型最優化的目標。
表2顯示了不同注意力機制在本研究提出的MANCS模塊中達到的效果。通過對比SE、 CBAM、ECA、CA和TA的試驗結果并計算各評價指標之間的標準差(STD),發現以上5種注意力機制在mAP、浮點運算量、權重大小和參數量等方面的波動不大,但檢測時延的2列指標所分別代表的CPU和GPU上的檢測時延波動較大。這說明在MANCS模塊中使用不同的注意力機制對模型的平均檢測時延有較大影響。合適的注意力模塊不但可以提高模型的特征提取能力和檢測精度,還應該節省模型推理時延,提高模型的性能。綜合以上幾個指標的標準差,選擇波動較大的評價指標作為首要篩選指標。因此本研究選擇檢測時延最低的SE注意力作為特征提取模塊MANCS的注意力機制。
2.6" 不同檢測模型對比試驗
為詳細比較本研究提出的YOLO-SR模型對草莓成熟度的檢測能力,選取目前流行的目標檢測網絡(Faster R-CNN、SSD、RetinaNet、YOLO v4-tiny和YOLO v7-tiny等)進行對比試驗。
表3中所有模型的輸入圖片分辨率均為640×640,其中SSD的主干網絡為VGG16,Faster R-CNN的主干網絡為ResNet50。試驗結果表明,本研究所提出方法的mAP為98.0%,相比于YOLO v5s提高了0.8百分點;相比于Faster R-CNN、SSD、RetinaNet、YOLO v4-tiny分別提高了10.9、8.9、10.9、10.4百分點;相比于YOLO v7-tiny和YOLO v8s提升并不明顯,但浮點計算量分別減少50.0%和77.3%。在以上列舉的幾種模型中,本研究提出模型的mAP最高,說明該模型對草莓果實識別能力較強,減少了在監測過程中的誤檢率和漏檢率。此外,本研究模型浮點計算量僅為6.5 G,參數量僅為2.8 M,相較于YOLO v5s,分別減少了54.9%和60.0%;與此同時,其在Jetson Nano上每張圖片的實時檢測速度為136.6 ms/張,在GPU(RTX3060)中的檢測速度為8.2 ms/張,與原始YOLO v5s相比,平均檢測時延分別減少了56.8、2.4 ms。因此,YOLO-SR更適合完成在溫室環境下對草莓成熟度的識別任務。
為驗證模型在不同的周圍環境下對草莓的檢測效果,分別選取密集、高曝光、 遮擋和小目標的草
莓圖像進行測試。選取置信度閾值為0.45、IoU閾值為0.6進行檢測。圖 9顯示,在有遮擋和重疊的情況下,改進模型仍然能夠很好地識別和區分不同的成熟度。當果實顏色和背景葉片的顏色十分接近或拍攝圖片遭受強曝光時,該模型依然能很好地成功識別出目標。
為了進一步測試模型的泛化能力,本研究把互聯網上隨機下載的草莓圖像作為輸入,圖10-a和圖10-c是改進后模型YOLO-SR的識別結果,圖10-b和圖10-d是原始YOLO v5s的識別結果。從圖中可以發現,在一些小目標的檢測中,2種模型均存在一些漏檢和誤檢。圖10-a中左上角1號和2號框中草莓花被錯誤識別為果實;圖10-b中3號和4號框中被遮擋隱藏起來的草莓果實發生了漏檢;圖10-c和圖10-d中1號框中的草莓果實均發生漏檢,5號框中的草莓都出現了錯誤識別的情況;圖10-c的5號框雖然識別到草莓但是未正確框出;圖10-d的5號框中草莓直接未被識別到,此外, 1~4號框中草莓均未識別到。綜合以上對比,在面對遮擋嚴重的草莓果實時,原始YOLO v5s的漏檢誤檢比率更大,而改進后的模型具有更高的檢測能力和泛化能力。
2.7" 在Jetson Nano部署的性能
本研究在嵌入式開發板Jetson Nano部署了原始YOLO v5s和改進后的模型。為了進一步降低嵌入式設備的計算壓力,探索使用不同分辨率的圖像作為模型的輸入并導出相應分辨率的模型,再使用TensorRT進行加速推理。由表4可以看出,半精度的模型相比于單精度權重大小大幅減小,分辨率小的模型權重大小也在一定程度上減少。此外,從YOLO v5s和YOLO-SRl是否使用TensorRT加速可以看出,雖然使用TensorRT加速引擎成倍增加了模型的權重大小,但是檢測時延在一定程度上減小;另外,觀察YOLO-SRl的前2行可以發現,使用TensorRT加速后的mAP有稍小幅度的降低。表中還可以看出,相比于單精度推理,使用半精度推理時模型的權重大小和檢測時延均有所減少,而mAP幾乎保持不變。最后,對比3種不同分辨率下的數據發現,隨著分辨率的降低,模型檢測的速度越來越快,當固定分辨率為320×320并使用半精度推理時,模型的檢測時延低至36.8 ms,但此時的mAP較低;當固定分辨率為480×480并使用半精度推理時,模型的檢測時延為69.4 ms,mAP為97.7%,相較于基線網絡YOLO v5s仍高出0.5百分點,延遲卻顯著減少了124 ms。
3 結論
為了在嵌入式設備等低GPU運算能力的平臺上實現草莓果實的實時定位和成熟度區分,本研究提出一種基于改進YOLO v5的草莓果實實時成熟度檢測算法YOLO-SR。采用一種基于Channel Shuffle的多路聚合模塊替換YOLO v5中的C3模塊,使得模型輕量化,同時該模塊與SE注意力機制共同作用能有效提高模型對重要通道的關注度,豐富模型的特征提取能力。此外,YOLO-SR使用了更加輕量化的下采樣模塊進一步減少模型參數量和運算量。改進后的模型相較于原始的YOLO v5s,mAP提高0.8百分點,同時浮點計算量僅為 6.5 G,參數量僅為2.8 M,分別減少了54.9%和60.0%。本研究將YOLO-SR模型部署到Jetson Nano嵌入式開發板,并使用半精度推理和TensorRT加速引擎加速模型的檢測速度。通過對比不同分辨率圖像作為輸入對模型性能的影響,發現使用480×480分辨率時,模型的性能最佳,此時模型在Jetson Nano上的推理速度低至69.4 ms,mAP為97.7%,相比于原始YOLO v5s,mAP仍提高了0.5百分點,推理速度提升64%。
研究結果表明,YOLO-SR模型能有效減輕嵌入式設備的算力壓力,提高檢測速度,可以廣泛應用于GPU嵌入式平臺實現草莓果實成熟度的實時檢測。本研究工作推進了目標檢測算法的實際部署和應用,對促進智慧農業的發展具有積極意義。在未來的工作中,筆者將進一步壓縮模型,以滿足其在資源更加受限的小型邊緣設備上的使用要求。
參考文獻:
[1]陳仁凡,謝" 知,林" 晨. 基于YOLO-ODM的溫室草莓成熟度的快速檢測[J]. 華中農業大學學報,2023,42(4):262-269.
[2]劉小剛,范" 誠,李加念,等. 基于卷積神經網絡的草莓識別方法[J]. 農業機械學報,2020,51(2):237-244.
[3]邵志明,王懷彬,董志城,等. 基于近紅外相機成像和閾值分割的蘋果早期損傷檢測 [J]. 農業機械學報,2021,52(增刊1):134-139.
[4]田" 冉,陳梅香,董大明,等. 紅外傳感器與機器視覺融合的果樹害蟲識別及計數方法[J]. 農業工程學報,2016,32(20):195-201.
[5]李" 季,楊淑婷,馬" 菁. 基于計算機視覺的枸杞蟲害計數方法研究[J]. 寧夏農林科技,2018,50(10):50-52,封2.
[6]Zhang C,Guo C T,Liu F,et al. Hyperspectral imaging analysis for ripeness evaluation of strawberry with support vector machine[J]. Journal of Food Engineering,2016,179:11-18.
[7]Bao R,Chen W N,Tang G X,et al. Classification of fresh and processed strawberry cultivars based on quality characteristics by using support vector machine and extreme learning machine[J]. Journal of Berry Research,2018,8(2):81-94.
[8]姜友誼,劉博偉,張成健,等. 利用無人機多光譜影像的多品種玉米成熟度監測[J]. 農業工程學報,2023,39(20):84-91.
[9]Ibba P,Tronstad C,Moscetti R,et al. Supervised binary classification methods for strawberry ripeness discrimination from bioimpedance data[J]. Scientific Reports,2021,11:11202.
[10]Shao Y Y,Wang Y X,Xuan G T,et al. Assessment of strawberry ripeness using hyperspectral imaging[J]. Analytical Letters,2021,54(10):1547-1560.
[11]李天華,孫" 萌,丁小明,等. 基于YOLO v4+HSV的成熟期番茄識別方法[J]. 農業工程學報,2021,37(21):183-190.
[12]張萬枝,張弘毅,劉樹峰,等. 基于改進YOLO v7模型的馬鈴薯種薯芽眼檢測[J]. 農業工程學報,2023,39(20):148-158.
[13]董雁凱,王玉超,李博梾,等. 基于改進YOLO v5的黃瓜霜霉病分級方法[J]. 江蘇農業科學,2023,51(22):213-220.
[14]Fan Y C,Zhang S Y,Feng K,et al. Strawberry maturity recognition algorithm combining dark channel enhancement and YOLO v5[J]. Sensors,2022,22(2):419.
[15]Phan Q H,Nguyen V T,Lien C H,et al. Classification of tomato fruit using YOLO v5 and convolutional neural network models[J]. Plants,2023,12(4):790.
[16]Liu J,Pi J,Xia L R.A novel and high precision tomato maturity recognition algorithm based on multi-level deep residual network[J]. Multimedia Tools and Applications,2020,79(13):9403-9417.
[17]羅志聰,李鵬博,宋飛宇,等. 嵌入式設備的輕量化百香果檢測模型[J]. 農業機械學報,2022,53(11):262-269,322.
[18]李" 云,邱述金,趙華民,等. 基于輕量化YOLO v5的谷穗實時檢測方法[J]. 江蘇農業科學,2023,51(6):168-177.
[19]Chen J Q,Ma A Q,Huang L X,et al. GA-YOLO:a lightweight YOLO model for dense and occluded grape target detection[J]. Horticulturae,2023,9(4):443.
[20]Lan Y B,Lin S M,Du H W,et al. Real-time UAV patrol technology in orchard based on the swin-T YOLOX lightweight model[J]. Remote Sensing,2022,14(22):5806.
[21]Lyu S L,Zhao Y W,Liu X Y,et al. Detection of male and female Litchi flowers using YOLO-HPFD multi-teacher feature distillation and FPGA-embedded platform[J]. Agronomy,2023,13(4):987.
[22]Shin D J,Kim J J.A deep learning framework performance evaluation to use YOLO in nvidia jetson platform[J]. Applied Sciences,2022,12(8):3734.