999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BP神經網絡的粳稻種子拉曼光譜鑒別方法研究

2023-12-18 05:25:48祝子涵田芳明高嘉欣
中國糧油學報 2023年10期
關鍵詞:特征模型

祝子涵, 譚 峰, 田芳明,2, 高嘉欣, 白 楠

(黑龍江八一農墾大學信息與電氣工程學院1,大慶 163319)

(農業部農產加工品質量監督檢驗測試中心2,大慶 163316)

水稻是人類最重要的糧食作物之一。因不同稻區的天氣溫度、天氣濕度、降雨量、土壤成分、日照程度等自然生態環境因素有著明顯差異,為使水稻種植地區的水稻產量最大化,將合適的水稻品種種植到對應的水稻種植區域顯得尤為重要[1]。但因種子市場不規范操作,由種子品種選購錯選問題產生的種子發芽率低、產量低等一系列糾紛時常發生。因此,針對不同水稻種植區域的水稻種子品種快速鑒定識別對現在的農業生產具有重要實際意義。

目前國內外水稻種子鑒別的方法主要包括形態學方法、田間種植法、化學鑒定法、電泳法、分子標記法、電子鼻法和理化檢測法等[2,3],形態學方法效率低速度慢且較為主觀。田間種植鑒定法鑒別精度不高、周期長且受環境影響過大,耗費大量人力物力。化學鑒定法雖然鑒別精度高,但耗時過多,對樣品有損傷,需要專門的操作人員。電泳法中蛋白質電泳法較為常見,圖譜對水稻品種的鑒別因基因的表達有時受發育階段的環境因素的影響,某些品種因基因組相近無法找到特異性蛋白而影響判別正確率。分子標記法中常用SSR分子標記法,其方法雖然測量水稻品種較為可靠,但操作難度較高且對操作人員水平要求較高,無法大規模作業。電子鼻法主要通過辨別氣味來實現品種鑒別,受環境因素影響過大,識別率不高,存在明顯的弊端。而理化檢測法中的光譜測定法依靠其無損、快速、便捷、客觀、準確、高效、操作簡單、不受環境影響等優勢,迅速在品種鑒別方面得到廣泛發展。因此,探究基于快速檢測的種子品種鑒別方法對于深化該領域的研究具有重要的理論意義。

拉曼光譜分析技術是以光學質譜方法為基礎,在待測樣品的屬性值和拉曼光譜數據之間建立分類或回歸模型。由于拉曼光譜技術具有速度快、測量方便、成本低、無破壞等優點,已經被廣泛應用于農業[4]、食品[5]、石化[6]、醫藥[7]等各個方面。

目前,基于拉曼光譜技術的水稻品種鑒別主要是以國內水稻的粗分類、少品種、小范圍進行分類鑒別。沙敏等[8]對粳稻、秈稻和糯稻進行粗分類區分,雖然取得良好鑒別效果,但分類過于簡單,需對具體水稻品種間的鑒別進行進一步研究。孫娟等[9]采用拉曼光譜技術結合化學計量法雖然能更精準實現對水稻品種間的鑒別,但是鑒別水稻品種較少僅為4種,需對多品種水稻種子鑒別進一步探究。朱培培等[10]采用拉曼光譜技術可以快速、準確、便捷、高效的針對粳稻種子多品種鑒別,但是鑒別地域僅為寒地水稻,地域較為狹小單一,需對地域分布更為廣泛的粳稻種子鑒別進行進一步研究。因此,實驗提出基于拉曼光譜技術針對多地區多品種粳稻種子的鑒別方法研究具有重要意義。

1 材料與方法

1.1 實驗材料

粳稻的主要產地為長江以北地區,為使研究具有一定的地域代表性,按照東北(黑龍江)、華北(天津)、華中(河南)、華東(山東、江蘇)地區來選擇粳稻種子進行研究[11,12]。實驗選用黑龍江、天津、山東、河南、江蘇5個產地的20個不同品種粳稻種子作為樣品,其中包含黑龍江6個品種,天津、山東各3個品種,河南、江蘇各4個品種。樣本信息如表1所示。

表1 水稻樣本信息表

1.2 儀器與軟件

光譜采集采取操作Advantage 532拉曼光譜儀,光譜測量波長范圍為200~3 400 cm-1,激發波長為532 nm,激發功率為100 mW,積分時間為1~6 s,分辨率為1.4 cm-1,結合ProScope HR軟件獲取樣品光譜信息。實驗使用LJJM-2011精米機對水稻種子進行脫殼處理,脫殼率≥99%,工作電壓為220 V,工作頻率為50 Hz,電機功率為750 W,1次工作時間為50~80 s可調,1次實驗用量為50~170 g。數據分析軟件采用MatlabR2018a實現。

1.3 光譜的獲取

對脫殼后的樣本進行挑選,剔除有破損、堊白度高、干癟畸形等問題的種子,將挑選后的粳稻種子樣品按1~20編號存放在的密封袋中并標記對應地區和品種。為保證實驗結果不受到外界因素的影響,測量前將全部粳稻種子樣本與光譜儀放在同一室內環境下靜置24 h, 確保樣本的環境條件與儀器環境條件相同。每個品種的粳稻種子均隨機選取15個作為該品種的實驗樣本集,20個不同品種共計300個種子樣本集。在產地和品種分類鑒別中,選擇每個品種樣本集的4/5用作訓練集,剩余1/5的樣本集作為測試集,即訓練集樣本數為240個,測試集樣本數為60個。

1.4 光譜的預處理

拉曼光譜檢測由于樣本因素、環境因素、儀器因素等因素影響,產生的無關信息和背景噪聲對分析結果會產生很大影響。因此,為了得到準確的光譜信息,需要對數據進行預處理以減少影響。實驗采得所有粳稻種子樣品光譜信息范圍為200~3 400 cm-1,但是光譜曲線在3 200~3 400 cm-1范圍內沒有特征峰值,且在200~400 cm-1范圍內僅有1個特征峰值在269 cm-1,所有大米種子均有這一特征,可知這一特征光譜為C骨架振動歸屬為淀粉[13]。為提高模型運行速度減少運行時間,將這兩個波段截除掉,只保留400~3 200 cm-1的光譜信息作為初始光譜信息。對比SG平滑、一階導數(1-Der)、二階導數(2-Der)、迭代自適應加權懲罰最小二乘法(AIRPLS)、多元散射校正(MSC)和標準正態變量變換(SNV)6種數據預處理方法對分類結果的影響。原始光譜數據及其6種預處理方法后的光譜數據如圖1所示。選取對模型識別準確率提升最大的方法作為最終預處理方法。

圖1 粳稻種子樣本原始光譜數據與預處理后光譜數據

1.5 光譜的特征波段提取

由于預處理后的光譜數據量仍較大,為了減少建模數據量,提升模型運行速度,實驗采用篩選強度較低的競爭性自適應重加權采樣算法(CARS)和篩選強度較高的連續投影算法(SPA)對粳稻種子光譜數據進行特征波段篩選,以提高模型效率[14]。CARS和SPA 2種特征波段提取算法都是采取計算均方根誤差(RMSE),并選擇與均方根誤差最小值相對應的波段變量子集,將所提取出來的波段變量子集作為拉曼光譜信息的特征波段。

1.5.1 CARS提取特征波段

實驗使用CARS方法對預處理優化后的拉曼光譜數據進行特征篩選,篩選過程如圖2所示。在實驗過程中,將蒙特卡洛采樣次數設置為50。從圖2中的波段數曲線可以看出,運行次數增加的過程中,光譜特征波段數量迅速減少,隨后曲線逐漸變得平緩,速度由快到慢表示選取過程由海選變為精選。運行次數增加的過程中,交互驗證均方根誤差RMSECV的值呈現先低速下降隨后相對迅速上升的趨勢,表明選取過程由無用信息被逐漸剔除到有用信息也被剔除。圖2中回歸系數路徑曲線是波段提取過程中每次采樣中每個波段變量的回歸系數路徑。當采樣次數為18時RMSECV獲得最小值,此時對應的特征波段數量用于檢測粳稻種子模型分類的效果最好,相應的最佳特征波段數為248。因此,選取該248個特征波段對應的強度值作為后續建模數據。

圖2 變量變化、五折交互驗證及變量回歸系數變化路徑與運行次數關系曲線

1.5.2 SPA提取特征波段

采用SPA方法對預處理優化過后的拉曼光譜數據進行特征波段提取,基于最小均方根誤差RMSEP值確定特征波段的最佳數目。由圖3可見,最佳特征波段數對應均方根誤差(RMSE)為0.703 88,特征波數為14。選取該14個特征波段對應的強度值作為后續建模數據。

圖3 SPA提取特征波段

1.6 遺傳算法優化BP神經網絡

誤差反向傳播(Back Propagation, BP) 神經網絡是當今使用最普遍的人工神經網絡結構之一,是一種按照信號前向傳播、誤差逆向傳播方式訓練的多層前反饋神經網絡,BP神經網絡具有優秀的解決擬合回歸問題能力和解決復雜度高的分類問題能力。傳統BP神經網絡包括3層結構,即輸入層、隱藏層和輸出層。原始光譜數據裁剪后有2 801個節點,水稻產地共有5個類別,隱含層設置為單層,根據經驗公式[15]神經元個數初始設置為4。因此BP神經網絡有2 801個節點在輸入層, 設置4個節點在隱含層,輸出層有5個節點。使用默認的S型函數在隱含層作為傳遞函數,輸出層使用默認的線性函數,網絡指定參數中學習率為0.001,目標誤差為0.001,最大迭代次數設為1 000。最終得到一個初始結構為3層拓撲結構的BP神經網絡模型。

BP神經網絡雖然能夠有效地適用于分類、擬合等任務,但在尋求最優解的時候,很有可能陷入局部最優、預測誤差較大的情況[16];而遺傳算法則是一種通過對自然進化過程的模擬來尋求最優解的方法。所以構建遺傳算法(Genetic Algorithm, GA)優化的BP神經網絡模型,對BP神經網絡的初始權值、閾值進行優化,使被優化后的BP神經網絡可以更好地實現對函數的輸出。

采用GA算法優化BP模型,遺傳算法優化后的個體適應度變化曲線如圖4所示,其終止迭代次數為100。平均適應度與最佳適應度隨著進化代數不斷提升,說明GA算法能夠對BP模型原算法進行優化。結果表明,當進化次數達到70時,個體達到最佳適應度。

圖4 個體適應度變化曲線

2 結果與分析

2.1 不同產地粳稻種子快速分類鑒別

水稻的質量和風味不僅受到父本母本遺傳給自身的基因影響,還受到地理條件包括土壤質量、水源質量等和氣候環境包括降雨量、日照時間、日照強度等的影響,因此不同產地的水稻品質相差明顯。由于其相似的外觀,肉眼很難將其分辨,所以利用拉曼光譜技術,針對黑龍江、天津、山東、河南、江蘇5個地區20種不同品種粳稻種子,進行光譜采集,對采集的粳稻種子光譜數據進行預處理、特征波段提取操作,建立BP神經網絡模型后,用遺傳算法優化BP神經網絡模型提升模型運行效率,達到快速區分不同產地粳稻種子目的。

2.1.1 預處理結果

預處理結果如表2所示。未進行預處理的光譜在BP神經網絡模型中的識別準確率為85%,經過SG、1-Der、2-Der、Airpls、MSC和SNV預處理之后的光譜在BP分類模型中的識別準確率分別為90.00%、86.67%、80.00%、83.33%、83.33%和85.00%,其中SG平滑識別準確率最高,達到90.00%。因此在后續實驗研究中,選擇SG平滑的預處理方法進行深入建模分析。

表2 不同預處理方法建模鑒別結果

2.1.2 特征波段提取結果

在SG平滑處理原始光譜基礎上,特征波段提取如表3所示。雖然2種方法均減少建模數據量,減少模型運行時間,但SPA方法對模型識別準確率較使用之前有所下降,CARS方法相比于使用之前對模型的運行速度和識別準確率均有提升,模型運行時間為40s,識別準確率為91.67%。因此在后續實驗研究中,選擇CARS的特征波段提取方法進行深入建模分析。

表3 不同特征波段提取方法建模鑒別結果

2.1.3 遺傳算法優化結果

根據經驗公式[17]優化隱含層神經元個數,不同隱含層神經元個數建模鑒別結果如表4所示。確定選取26為最佳隱含層神經元個數后,將BP神經網絡模型的權值閾值用遺傳算法優化,GA-BP模型對不同產地粳稻種子識別準確率由98.33%提升至100.00%,運行時間由74 s提升至26 s。說明建立的BP神經網絡分析模型的預測精準度高、運行速度快,對不同產地粳稻種子能實現快速分類鑒別效果。

表4 不同隱含層神經元個數建模鑒別結果

2.2 相同產地不同品種粳稻種子快速分類鑒別

為進一步研究同為粳稻、相同產地,但不同品種的大米之間的分類效果,分別以黑龍江6個品種之間、天津3個品種之間、山東3個品種之間、河南4個品種之間、江蘇4個品種之間為研究對象,進行光譜采集、數據預處理、數據特征波段提取、建立BP神經網絡分析模型并用遺傳算法優化,達到快速區分相同產地不同品種粳稻種子目的。

2.2.1 黑龍江地區

以黑龍江地區的龍稻3、龍稻4、龍稻6、龍粳29、龍粳39、龍粳1624共6個品種粳稻種子采用2.1.1優選SG平滑預處理方法、2.1.2優選CARS特征波段提取方法、選取最佳隱含層神經元個數后,用遺傳算法優化BP神經網絡模型的權值閾值,建立網絡拓撲結構為136-19-6的最佳GA-BP神經網絡模型。最終模型識別準確率為94.44%,運行時間為4s。說明建立的BP神經網絡分析模型的預測精準度高、運行速度快,對黑龍江地區不同品種粳稻種子能實現快速分類鑒別效果。

2.2.2 天津地區

以天津地區的金粳18、金粳818、津稻372共3個品種粳稻種子采用2.1.1優選SG平滑預處理方法、2.1.2優選CARS特征波段提取方法、選取最佳隱含層神經元個數后,用遺傳算法優化BP神經網絡模型的權值閾值,建立網絡拓撲結構為100-15-3的最佳GA-BP神經網絡模型。最終模型識別準確率為100%,運行時間為1 s。說明建立的BP神經網絡分析模型的預測精準度高、運行速度快,對天津地區不同品種粳稻種子能實現快速分類鑒別效果。

2.2.3 山東地區

以山東地區的圣香66、圣稻16、臨稻13號共3個品種粳稻種子采用2.1.1優選SG平滑預處理方法、2.1.2優選CARS特征波段提取方法、選取最佳隱含層神經元個數后,用遺傳算法優化BP神經網絡模型的權值閾值,建立網絡拓撲結構為86-10-3的最佳GA-BP神經網絡模型。最終模型識別準確率為100%,運行時間為1 s。說明建立的BP神經網絡分析模型的預測精準度高、運行速度快,對山東地區不同品種粳稻種子能實現快速分類鑒別效果。

2.2.4 河南地區

以河南地區的鄭旱2號、鄭旱6號、鄭旱10號、洛稻998號共4個品種粳稻種子采用2.1.1優選SG平滑預處理方法、2.1.2優選CARS特征波段提取方法、選取最佳隱含層神經元個數后,用遺傳算法優化BP神經網絡模型的權值閾值,建立網絡拓撲結構為86-14-4的最佳GA-BP神經網絡模型。最終模型識別準確率為91.67%,運行時間為3 s。說明建立的BP神經網絡分析模型的預測精準度高、運行速度快,對河南地區不同品種粳稻種子能實現快速分類鑒別效果。

2.2.5 江蘇地區

以江蘇地區的南粳46、南粳58、南粳5055、南粳9108共4個品種粳稻種子采用2.1.1優選SG平滑預處理方法、2.1.2優選CARS特征波段提取方法、選取最佳隱含層神經元個數后,用遺傳算法優化BP神經網絡模型的權值閾值,建立網絡拓撲結構為86-12-4的最佳GA-BP神經網絡模型。最終模型識別準確率為91.67%,運行時間為1 s。說明建立的BP神經網絡分析模型的預測精準度高、運行速度快,對江蘇地區不同品種粳稻種子能實現快速分類鑒別效果。

3 結論

選用黑龍江、天津、山東、河南、江蘇5個不同地區20個不同品種的粳稻種子進行分類鑒別方法研究。在對比實驗6種預處理方法對模型建模及判別影響中,SG平滑預處理方法在判別模型中識別準確率高于其他5種預處理方法。在探究光譜特征波段提取方法對模型建模及判別影響中,針對預測效果和運行速度綜合考慮,CARS特征提取方法提取的光譜特征優于SPA特征提取方法。GA算法也加快了BP神經網絡模型的運行速度,提高了模型識別準確率。

在SG平滑預處理、CARS特征波段提取拉曼光譜數據和GA算法優化BP神經網絡模型后建立最佳GA-BP神經網絡模型。其中,不同產地(黑龍江、天津、山東、河南、江蘇)粳稻種子模型識別準確率達到100%,運行時間為26 s;相同產地不同品種粳稻種子模型識別準確率均在90%以上,平均識別準確率為95.56%,平均運行時間為2 s。說明拉曼光譜技術結合BP神經網絡判別分析模型能夠有效快速準確鑒別粳稻種子的產地和品種。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 日韩成人午夜| 国产又粗又猛又爽视频| 黄色网在线| 中文字幕人妻无码系列第三区| 国产亚洲欧美另类一区二区| 欧美国产在线一区| 黑人巨大精品欧美一区二区区| 日本午夜精品一本在线观看| 91精品免费久久久| 日韩欧美中文字幕一本| 日韩黄色大片免费看| 91麻豆精品国产91久久久久| 国产亚洲男人的天堂在线观看| 国产拍揄自揄精品视频网站| 亚洲AV永久无码精品古装片| 国产特级毛片| 另类综合视频| 91精品亚洲| 黑色丝袜高跟国产在线91| 超薄丝袜足j国产在线视频| 中文字幕在线不卡视频| 日韩第一页在线| 在线欧美一区| 国产99免费视频| 好久久免费视频高清| 国产精品一区二区国产主播| a毛片免费观看| jizz在线免费播放| 亚洲国产日韩欧美在线| 国产理论最新国产精品视频| 免费Aⅴ片在线观看蜜芽Tⅴ| 国产成人精彩在线视频50| 中文字幕人妻av一区二区| 日本午夜影院| 国产人在线成免费视频| 国产白浆在线| 精品视频一区二区观看| 亚洲天堂视频网站| 亚洲人在线| 亚洲黄色成人| 亚洲狼网站狼狼鲁亚洲下载| 国产真实乱人视频| 久久久成年黄色视频| 欧美亚洲国产精品久久蜜芽| 国产激情国语对白普通话| 原味小视频在线www国产| 日本久久久久久免费网络| 亚洲国产成人精品一二区| 91亚洲精选| 亚洲 成人国产| 亚洲中文字幕无码mv| 亚洲国产系列| 老色鬼欧美精品| 亚洲综合狠狠| 欧美一区精品| 激情乱人伦| 欧美劲爆第一页| 国内精品九九久久久精品| 蜜臀AVWWW国产天堂| 亚洲无码视频一区二区三区| 伊人五月丁香综合AⅤ| 亚洲人成网址| 久久77777| 538国产视频| 中文字幕色站| 国产美女免费网站| 国产精品七七在线播放| 欧美一级高清视频在线播放| 区国产精品搜索视频| 国产精品女主播| 国产麻豆91网在线看| 久久99国产乱子伦精品免| 中文字幕1区2区| 亚洲婷婷六月| av在线手机播放| 69av在线| 国产精品女主播| 国产精品三级专区| 国产97公开成人免费视频| 欧美午夜在线观看| 九九热精品在线视频| 国产视频一区二区在线观看 |