999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于小樣本學習的植物葉病分類研究*

2021-03-12 02:02:44
智慧農業導刊 2021年10期
關鍵詞:分類方法模型

吳 蔚

(泰山學院 信息科學技術學院,山東 泰安 271000)

植物葉病是影響植物正常生長的重要因素之一。在現代農業中,及時準確地對農作物葉部病害種類進行識別并采取針對性防治措施,對于保證農作物的產量和質量穩定增長具有重要的意義。傳統的植物葉病種類識別主要通過請教專家或者咨詢有經驗的農民。然而這類知識的獲取存在成本高、時效低、準確率不穩定等缺點。因此采用機器的方式對植物病害種類進行自動化識別在現代農業管理中獲得越來越多的青睞。

前幾年主要通過諸如支持向量機(Support Vector Machines,SVM)、K-means、貝葉斯等傳統機器學習方法進行葉病分類識別。隨著設備計算能力的迅速提升和大數據技術的不斷發展,越來越多的研究者將目光轉向深度學習領域。例如Ferentinos[1]使用深度卷積神經網絡進行植物葉病的檢測和診斷,可以達到99.53%的識別成功率。模型訓練數據來源于公開數據庫,包含87848張圖片。Waheed[2]使用密集卷積神經網絡結構進行玉米葉病種類識別,通過手動收集的方式獲取了12332張圖片進行模型訓練,最高準確率達到了98.06%。

深度學習是機器學習領域重要的分支之一,其深層網絡結構對應著龐大的網絡模型參數,通常需要大量的樣本數據進行訓練才能獲取較好的效果。如果訓練數據過少,網絡模型很容易出現過擬合的現象。然而,很多現實應用中數據獲取非常困難,有些是因為數據獲取的人力、物力成本較高,而有些則是小概率發生的事件,無法在短時期內大量獲取。反觀人類的學習方式,并不需要很多數據就能夠實現較好的學習效果。比如教給嬰幼兒認識一種新的動物,常常一張訓練圖片就能讓他們學會識別。為了讓計算機也能像人類一樣學習,深度學習的一個新分支——小樣本學習,逐漸引發越來越多研究者的興趣。

使用小樣本學習解決分類問題是指模型使用少量訓練數據就能獲取對于新類別的識別能力,目前主要有三類方法:數據增強、遷移學習和元學習。數據增強方法主要通過圖片的翻轉、裁剪、尺度變化、色彩抖動等數據生成技術擴充樣本,解決小樣本的問題。比如Hu等人[3]提出了一種條件式深度卷積生成對抗網絡進行茶葉葉病種類的識別。該方法可以生成與源域數據分布一致的訓練樣本實現數據增強,解決小樣本學習的問題。遷移學習指在源域和目標域中實現知識的遷移。源域通常包含與目標域數據相關或類似的大量數據樣本,通過對源域數據進行訓練,獲取對目標域數據底層特征的識別能力,然后通過目標域數據對網絡模型進行微調,從而獲取對目標域數據的識別能力。通常只對模型的最后幾層模型參數進行微調,而前面層次的參數保持固定,防止造成過擬合。比如Chen等人[4]使用深度遷移學習方法進行植物葉病分類識別,該方法設計了一種改進的VGGNet網絡結構INC-VGGN,并使用大型公開數據庫ImageNet進行網絡模型的預訓練,最終達到了91.83%的準確率。元學習是一種學習如何學習的方法,而不是直接學習知識本身。當模型具備了學習的能力后,即使只有少量的訓練樣本也能快速掌握分類的能力。因此元學習是一種更接近人類學習方式的方法。

本研究提出一種基于小樣本學習的植物葉病分類方法,采用元學習的方式對植物公開數據集中的葉病樣本數據進行分類研究。實驗結果驗證了小樣本學習方法在植物葉病分類應用中的有效性,值得在農業領域進一步推廣研究。

1 相關理論介紹

1.1 卷積神經網絡

卷積神經網絡(convolutional neural networks,CNN)是深度學習典型的網絡模型之一,包含卷積運算且具有深層的網絡結構,近幾年在計算機視覺、自然語言處理等領域獲得了突破性進展。傳統機器學習主要通過手工方式設計特征,而基于CNN的網絡模型則能夠實現端到端的特征自動提取。CNN網絡模型主要由卷積層、池化層和全連接層構成。

1.1.1 卷積層

卷積層的功能是通過卷積核對輸入數據進行卷積運算,并加上一個偏差值得到特征提取結果。卷積層的模型參數由卷積核和偏差值部分構成。可以對多個卷積層進行疊加從而設計出不同復雜程度的卷積網絡。第i層卷積網絡的特征輸出Zi可表示為:Zi=f(Zi-1Wi+b)i,其中Zi-1表示卷積層的特征輸入(Z0表示輸入圖像),Wi表示第i層卷積核的權重,bi表示第i層卷積核的偏差值,f表示激活函數。

1.1.2 池化層

經過卷積層的特征提取后,輸出的特征輸入到池化層進行特征的選擇和過濾。池化層可以減輕輸出特征對位置的敏感度,因此同一種物體即使所處位置略有差異,也可以被模型很好的識別。常用的池化方法有極大池化和均值池化,分別計算池化窗口內的極大值和平均值。第i層池化層的第j塊池化區域的特征輸出xij可表示為:xij=Poo(lxi-1,)j,其中xi-1,j表示上一層的特征輸出,Pool表示池化函數。

1.1.3 全連接層

深度網絡模型的最后幾層通常連接一層或多層全連接層用于圖像分類任務。特征經過全連接層后得到分類預測結果,接著使用softmax回歸函數將結果值變為值為正且和為1的概率分布。全連接層中第i個輸出結果Pi可表示為:,其中 K 表示最后一個連接層的神經元個數,z代表最后一個連接層的輸出向量。

1.2 元學習

傳統的深度學習將所需要的數據劃分為訓練集、驗證集和測試集。訓練集用于對網絡模型進行調參;從訓練集中可提前選取一小部分樣本數據作為驗證集,用于模型訓練時對模型的泛化能力進行評估,通常作為模型是否停止訓練的依據;測試集用于對模型的泛化能力進行最終測試,但不能用于模型訓練階段的調參。與傳統深度學習劃分數據集的方式不同,元學習將所需數據劃分為元訓練集和元測試集,以及必要時設置的元驗證集。元訓練集的基本訓練單位是任務,其進行模型訓練是依靠任務驅動而非數據驅動。每個任務包含支持集和查詢集,前者通常只提供少量的數據用于模型調參,這也是小樣本的由來,后者用于驗證模型在該任務上的泛化能力。通過大量不同任務的訓練,模型會找到一組敏感參數能夠快速適應新任務的學習。元測試集也包含多個任務,每個任務被劃分為支持集和查詢集,前者提供少量數據讓模型迅速適應新的任務,而查詢集則用于測試這種適應性的效果。

2 研究方法

本研究提出一種基于小樣本學習的農作物病害種類分類方法,以下分別從數據集、特征提取、元學習方法幾方面加以介紹。

2.1 數據集

本研究使用公開數據集PlantVillage[5]進行植物病害分類研究。該數據集包含54303張植物葉子圖像,其中涵蓋14種植物和26種葉病類型,根據植物和葉病類型(包含健康類型)的組合形成了38種類別。隨機選取26種類別樣本作為元訓練數據集,6種類別樣本作為元驗證數據集,剩余6種樣本作為元測試數據集。不同數據集合之間的類別沒有交叉。

2.2 特征提取模塊

本研究使用Inception V3網絡[6]中全連接層之前的層次進行輸入圖像的特征提取。該模型將傳統網絡層次中較大的卷積核進行分解,從而減少參數數量。比如3×3卷積核被分解為不對稱的3×1和1×3兩種。同時它使用了批量歸一化方法,減輕了深度網絡層次中梯度消失的問題。該模型使用的Inception模塊組對網絡層次的深度和寬度進行了均衡設計,提升了模型進行特征表達的能力。

2.3 元學習方法

采用元學習方法進行植物葉病分類主要包含以下兩個步驟:

2.3.1 元訓練階段

本階段使用元訓練數據集進行模型訓練。如前所述,訓練階段采用任務驅動方式進行。每個任務中隨機采樣N個類別的樣本,每個類別包含T個數據。所有類別中的前K(K<T)個數據構成支持集,表示為,其中xi表示輸入的支持集中第i個圖像數據,yi表示對應的分類標簽。此即為小樣本學習中的N-way K-shot方法。K值通常較小,比如可取為1,3,10等值。每個類別剩余的T-K個數據構成查詢集,表示為

每個任務中的支持集用于使模型建立一種分類模式,而查詢集則用于對這種分類模式的優劣進行驗證并調優。本研究使用原型方法[7]用于支持集分類模式的建立。對于一個N-way K-shot任務,其中的類別k對應的原型特征ck可表示為:

其中xi表示類別為k的第i個樣本數據,f?表示參數為?的函數映射,通過神經網絡自動學習。接著查詢集中的樣本使用同樣的特征提取模塊獲取對應的特征,并度量與每個原型特征的距離。本研究使用歐幾里得距離進行度量。給定兩個n維矢量X={x1x2…xn}和Y={y1y2…yn},其歐幾里得距離可表示為:

對于查詢集中某個標簽為k的樣本x,計算出其與每個原型特征之間的歐幾里得距離后,再經由softmax函數便可進一步計算出對該樣本分類預測的概率分布。其被預測為類別k的概率可表示為:

元訓練階段的目的是讓原型特征能夠盡可能準確地描述對應類別的特征屬性,并使得預測分類結果為k的概率最大。因此定義模型最終損失函數如下:

2.3.2 元測試階段

經過元訓練階段后的網絡模型便具備了小樣本預測的能力。元測試數據集中的支持集經由特征提取模塊獲得對應的特征,計算出每個類別的原型;然后對查詢集中的每個樣本進行類別預測,用于測試模型訓練的效果。

3 實驗結果及分析

為了對本研究算法進行驗證,進行了相關實驗。所有輸入圖片的分辨率被處理為84×84,并采用小批量隨機梯度下降算法進行模型損失函數的優化。實驗中元訓練數據集中的支持集根據設定的N-way K-shot參數進行采樣,查詢集與支持集的采樣類別數N相同,每類樣本數固定為15。元測試集中固定生成500個任務,每個任務采樣方式同元訓練集,計算所有任務的分類準確率的平均值,用于評估對應參數設定下的分類效果。

表1對使用遷移學習方法和本研究小樣本學習方法的植物葉病分類準確率進行了對比。其中遷移學習方法中使用通過ImageNet數據集進行預訓練的Inception V3網絡結構用于分類,本研究小樣本學習方法設定參數N=5,K=10。可以看出,使用遷移學習方法用于小樣本農作物病害分類研究中的準確率較低,只有42.6%,而本研究方法獲得了相對較高的準確率,達到了81.2%。

表1 基于交叉熵損失函數和焦點損失函數的分類準確率對比

圖1展示了不同參數配置的N-way K-shot進行植物葉病分類的準確率對比。可以看出當K相同時,N=3的分類準確率均高于N=5時。這是因為需要分類的類別數越多,意味著相對更難的分類任務,準確率也會降低。當N值固定時,隨著K值增大,分類準確率呈現線性增長的趨勢。這可以解釋為描述每個類別的信息越多,計算出的原型特征越能準確的代表對應類別,因此越能得到較高的分類準確率。

圖1 不同參數下的分類準確率

4 結束語

本文基于小樣本學習方法進行植物葉病分類研究,通過元學習方法構建N-way K-shot任務進行模型的訓練,并構建每個類別的原型用于度量待預測樣本所屬類別。通過與傳統深度學習的對比驗證了元學習方法在處理小樣本應用問題上的有效性。同時通過改變小樣本學習過程的參數配置揭示了影響分類準確率的一些關鍵特性。未來的研究中將繼續探索小樣本學習方法在農業領域的應用。

猜你喜歡
分類方法模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 91精品视频播放| 99re热精品视频国产免费| 国产一级毛片高清完整视频版| 欧美一级专区免费大片| 高清色本在线www| 亚洲国模精品一区| 国产精品九九视频| 国产不卡在线看| 99在线视频免费| 亚洲黄网在线| 国产福利一区二区在线观看| 国产午夜小视频| 色综合国产| 在线人成精品免费视频| 国产一在线观看| 国产成人高清精品免费| 久久亚洲中文字幕精品一区| 99热这里都是国产精品| 国产精选自拍| 麻豆国产在线观看一区二区| 中文字幕亚洲另类天堂| 亚洲天堂免费观看| 在线色国产| 青青操视频在线| 欧美精品亚洲精品日韩专区| 9丨情侣偷在线精品国产| 色呦呦手机在线精品| 国产网站免费| 国产尤物在线播放| 久久一日本道色综合久久| 亚洲精品欧美日本中文字幕 | 国产一级α片| 中文字幕中文字字幕码一二区| 国产欧美中文字幕| 无码aⅴ精品一区二区三区| 日韩精品中文字幕一区三区| 人妻精品久久无码区| 久久国产精品嫖妓| 国产精品久线在线观看| 亚洲日韩每日更新| 欧美丝袜高跟鞋一区二区| 国产亚洲精品91| 亚洲无线观看| 色噜噜中文网| 欧美一区二区啪啪| 热思思久久免费视频| 婷婷色狠狠干| 久久久久无码精品| 亚洲天堂日韩av电影| 久热中文字幕在线| 国产丝袜第一页| 日韩在线播放中文字幕| 久久久久久久97| 青青青伊人色综合久久| 精品视频第一页| 国产一级做美女做受视频| 精品天海翼一区二区| 综合成人国产| 青草视频免费在线观看| www.亚洲一区二区三区| 凹凸国产分类在线观看| 欧美第一页在线| a级毛片在线免费| v天堂中文在线| 免费国产黄线在线观看| 最新无码专区超级碰碰碰| 色婷婷视频在线| 97在线观看视频免费| 四虎AV麻豆| 岛国精品一区免费视频在线观看| P尤物久久99国产综合精品| 日韩在线影院| 欧美一区二区三区不卡免费| 制服丝袜一区| 超清无码一区二区三区| 99久久精品国产自免费| 日韩一区精品视频一区二区| 一本久道热中字伊人| 国产香蕉在线视频| 国产麻豆va精品视频| 国产无码在线调教| 国产美女在线免费观看|