





摘要:為快速精準識別水稻種質資源,開發一種基于高光譜的高效識別方法。以9種稻種為試驗樣品,利用光譜儀測定2 700顆種子的高光譜反射率,利用主成分分析法(principal component analysis,PCA)對高光譜數據進行降維處理。為探討PCA最佳的主成分個數,比較了不同主成分個數與判別分析法(線性判別、二次判別和馬氏距離判別)組合在基于種子高光譜數據建立水稻品種識別模型中的效果。對全波段數據樣本進行主成分分析,以2~20個主成分個數作為特征變量,以預測集正確率為評價指標,建立3個品種判別模型,并比較其預測效果。結果表明,以累積貢獻率≥85% 為評價標準,選擇2 個主成分,3 種模型預測集正確率分別為32.14%、38.69%和33.73%;以特征值≥1為標準,選擇11個主成分,預測集正確率為68.21%、87.33%和83.18%;若考慮模型的正確率,選擇20個主成分,預測集正確率分別為84.99%、95.71%和95.32%。利用主成分分析+判別分析方法的稻種高光譜品種識別模型可行,但主成分個數不同,判別分析法的評價標準不同,識別效果差異大。當主成分個數相同時,3種判別標準中二次判別分析方法的識別效果最佳,最佳組合為20個主成分個數+二次判別分析法,預測集正確率為95.71%。研究結果表明基于高光譜技術與主成分分析的識別方法可快速識別不同稻種,具有較高的應用價值。
關鍵詞:稻種;高光譜技術;主成分分析;品種識別
doi:10.13304/j.nykjdb.2023.0640
中圖分類號:S126 文獻標志碼:A 文章編號:10080864(2025)03010408
水稻品種繁多,不同品種稻種存在差異,有的品種間差異大,有的品種間差異并不十分明顯[1-3]。隨著水稻品種數量增加,在種子種植、運輸和儲藏過程中易發生混雜和種質質量降低現象,造成利益損失。稻種品種分類主要有電泳法、分子標記法及基于人工嗅覺、拉曼光譜及近紅外光譜的識別技術[34]。其中,人工嗅覺識別技術誤差較大,電泳法、 分子標記法、拉曼光譜技術以及近紅外光譜技術存在樣品準備工作繁瑣、耗時長、不能無損檢測等缺陷。高光譜技術可在一系列波長下獲取被測對象光譜信息,對被測物外部特性和內部成分進行綜合分析[4],廣泛用于農產品品種分類、損傷識別以及安全檢測等領域[56]。
利用高光譜技術進行農業物料品種識別的研究主要集中在大豆、玉米、小麥等作物。楊歡等[7]基于高光譜技術提出無損、快速的玉米種子純度識別方法;黃敏等[8]利用高光譜技術結合多尺度三維卷積神經網絡構建小麥種子的品種快速識別模型;段丁丁等[9]基于冠層光譜數據進行不同馬鈴薯品種區分研究。由于高光譜數據為高維非線性數據,具有數據量大、噪聲、冗余和多重共線性等問題。因此,利用高光譜技術進行品種分類時降低數據維度、提高模型分類準確率和計算效率成為了關鍵。主成分(principal componentsanalysis,PCA)分析法具有減少原始數據信息損失、簡化數據結構、避免主觀隨意性等優點,可將多個存在相關關系的性狀指標簡化為幾個能反映原來主要性狀指標的綜合指標[10],因而在許多領域的綜合評價中被廣泛應用。本課題組前期利用主成分分析方法對雜交稻芽種物理特性進行評價,構建了科學評價體系,初步判定各種雜交稻種樣本的綜合得分,表明主成分分析方法具備構建科學的量化評價體系能力[11]。
為此,本文基于高光譜技術與主成分分析開發一種水稻品種識別方法。該方法利用光譜儀測定種子高光譜反射率,結合主成分分析法對高光譜數據進行降維,確定最佳主成分個數,并比較不同主成分個數與3種判別分析法(線性判別、二次判別和馬氏距離判別)組合在基于種子高光譜數據建立的水稻品種識別模型中的效果,以期為開發水稻品種及品質快速無損檢測的專用儀器提供理論支持。
1 材料與方法
1.1 供試材料
選用華南稻區的9種水稻為試驗樣品,由華南農業大學和廣東省金稻種業有限公司提供,分別是五優1179、五優6133、泰豐優208、順兩優1179、培雜泰豐、特優2068、恒豐優1179、軟華優1179、軟華優6100。試驗于2022年12月至2023年2月在桂林廣西師范大學機械工程中心實驗室進行。
1.2 數據采集及試驗樣本劃分
篩選顆粒飽滿種子,采用高溫烘干法測定含水率[11],得到種子含水率分布在39.7%~52.1%。將手持式物料光譜探測針放在每顆所測種子測定部位處,如圖1所示,在護穎、內穎、外穎以及稃尖4個部位測量光譜數據,數據經斷點校正之后,取均值作為該種子的光譜數據。為消除光譜數據在采集時首端與末端產生的噪音,選擇400~2 300 nm的光譜數據進行分析。