






doi:10.15889/j.issn.1002-1302.2024.20.029
摘要:為了快速準(zhǔn)確地識(shí)別番茄葉片病蟲害,從而提升番茄產(chǎn)量和品質(zhì),在有限設(shè)備資源條件下實(shí)現(xiàn)番茄病蟲害的精準(zhǔn)防治,針對(duì)以往番茄病蟲害識(shí)別算法數(shù)據(jù)標(biāo)注成本過高的問題,提出一種基于改進(jìn)FixMatch算法的半監(jiān)督番茄病害圖像識(shí)別方法。首先,對(duì)真實(shí)場(chǎng)景采集的番茄病蟲害數(shù)據(jù)進(jìn)行深入分析,挖掘出數(shù)據(jù)集規(guī)模不明、類間數(shù)據(jù)不均衡性較為嚴(yán)重的特性,在原始FixMatch算法的基礎(chǔ)上,引入k-means聚類算法篩選出代表性數(shù)據(jù)進(jìn)行標(biāo)注,以提高標(biāo)注數(shù)據(jù)的性價(jià)比。其次,設(shè)計(jì)一種自適應(yīng)偽標(biāo)簽數(shù)據(jù)補(bǔ)充模塊,使得在半監(jiān)督分類算法迭代過程中,自適應(yīng)地調(diào)整不同類別的偽標(biāo)簽判定閾值,并且引入Focal Loss,以保證模型免受類別不均衡的影響。試驗(yàn)結(jié)果表明,在kaggle提供的公開數(shù)據(jù)集New Plant Diseases Dataset的10種番茄病害上,本研究提出的半監(jiān)督番茄病蟲害識(shí)別算法僅使用2 000張(約訓(xùn)練數(shù)據(jù)的10%)的標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練,在測(cè)試集上的準(zhǔn)確率可達(dá)到98.16%,比原始FixMatch算法提高了1.34百分點(diǎn)。經(jīng)過對(duì)比試驗(yàn)表明,本研究提出的基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊比隨機(jī)挑選的準(zhǔn)確率提高23.92百分點(diǎn),基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊在困難樣本類別上比原始FixMatch算法高出5.00百分點(diǎn)。綜上所述,本研究所提出的基于改進(jìn)FixMatch算法的半監(jiān)督番茄病蟲害識(shí)別算法能夠提高半監(jiān)督圖像識(shí)別任務(wù)的準(zhǔn)確率,對(duì)于真實(shí)場(chǎng)景下如何挑選數(shù)據(jù)標(biāo)注以及如何制定訓(xùn)練過程中的偽標(biāo)簽監(jiān)督策略都有著積極的參考意義,降低了番茄病蟲害識(shí)別模型的數(shù)據(jù)標(biāo)注成本,助力智慧農(nóng)業(yè)發(fā)展。……