伍恒 李明周 張航



摘要:以新和地區種植的大田哈密瓜為研究對象,采集不同物候期哈密瓜果實樣本,采集高光譜數據并通過Savitzky-Golay一階導數(SG-1)、Savitzky-Golay二階導數(SG-2)、標準正態變換(SNV)、多元散射校正(MSC)4種光譜預處理方法進行預處理,建立廣義回歸神經網絡(GRNN)和概率神經網絡(PNN)2種哈密瓜物候期判別模型,以模型判別正確率為評價指標,結果顯示,所建模型均能很好地識別哈密瓜果實物候期。將采集到的4個時期的哈密瓜果實樣本光譜組合成10組具有輸入變量的光譜樣本,分別建立GRNN和PNN判別模型,以模型運行時間作為模型評價指標,得出以3個時期的哈密瓜樣本光譜所建立的SG-1-GRNN和SNV-PNN模型為最優,運行時間為 0.046 9 s,運行速率最多可提高57%。
關鍵詞:高光譜成像技術;哈密瓜物候期;神經網絡;判別方法
中圖分類號: S652.101 ?文獻標志碼: A ?文章編號:1002-1302(2019)22-0258-06
瓜果蔬菜是人們日常生活中飲食的主要組成部分,在很多國家,瓜果蔬菜在飲食結構中所占的比重可達40%以上,它不僅能夠為人體提供基本的維生素、食用粗纖維和基本礦物質,還能夠為人類提供大量的蛋白質、碳水化合物等營養物質。產于新疆地區的哈密瓜由于生長氣候等條件的獨特性,具有水分充足、含糖量高的獨特品質,深受水果市場和人民群眾的青睞。新疆是全國著名的哈密瓜產區,具有哈密瓜生長所需的必要自然氣候條件。由于農民對大田哈密瓜播種期選擇的不恰當,造成了哈密瓜果實成熟度不一致,影響了哈密瓜在水果市場上的整體聲譽和銷量,采收期哈密瓜果實物候期鑒別技術是亟待探索的研究領域。
有導師學習的神經網絡以其良好的學習能力被廣泛地應用于各個領域,不僅可以用于擬合解決回歸問題,還可以用于解決模型識別問題以及分類識別問題。前人研究多針對蘋果[1]、油桃[2]、玉米[3]、咖啡豆[4]、西瓜種子[5]等農產品進行品種鑒別,而針對農產品物候期的鑒別鮮有報道。因此,對大田種植哈密瓜從坐果后至果實完全成熟不同物候期進行深入研究,解決哈密瓜在生產中由于播種期不同導致的果實成熟度不一致、經濟效益低等問題,建立一套針對新疆哈密瓜果實物候期鑒別的近紅外高光譜模型是十分必要的。
1 材料與方法
1.1 種植區概況
新疆阿克蘇地區新和縣屬溫帶大陸性干旱氣候,擁有充足的光照,蒸發量較大,熱量十分充足;降水稀少,氣候相對干燥,晝夜溫差較大。該地區熱量資源十分豐富,無霜期長達200 d以上。年平均日照時數保持在2 894.6 h左右,年平均積溫為4 412.3 ℃,年均氣溫保持在10.5 ℃左右,年平均降水量約為64.0 mm,平均蒸發量為1 992.7 mm;目前累計擁有土地資源82.2萬hm2,其中耕地面積為3.0萬hm2,沙地面積為13.3萬hm2,試驗所選種植區土質為沙質壤土。
1.2 不同物候期果實采集方法
在哈密瓜花期過后15 d,第1次采集哈密瓜樣本,數量為120個,采樣方法為5點取樣法,后續采樣仍采用第1次采樣的方法,第2次采樣與第1次采樣時間間隔15 d,第3次采樣與第2次采樣時間間隔15 d,第4次采樣與第3次采樣時間間隔15 d,至哈密瓜果實完全成熟共采集哈密瓜果實樣本4次,共計500個左右不同生長時期的哈密瓜樣本。5點采樣方式如圖1所示,陰影部分為采樣區域。將種植區地塊沿對角線分成如圖所示的9個大采樣區,再將對角線上5處采樣區按照同樣的方式均分成9個小采樣區,沿對角線保留5處小區塊作為樣本采集的區間,共計25塊區間。針對不同生長期的果實樣本,進行小區間單獨采集,將同一生長期樣本混合均勻,以保證樣本的隨機性和盡可能全面地包含種植區內樣本的所有信息。
1.3 果實高光譜數據采集
1.3.1 近紅外高光譜成像系統 試驗所用的高光譜成像系統(圖2)為北京卓立漢光儀器有限公司出品的“蓋亞”高光譜分選儀,該系統核心部件包括均勻光源、光譜相機、電控移動平臺、計算機及控制軟件等部分。工作原理是采用光源照射放置于電控移動平臺上的待測樣品,樣品的反射光通過鏡頭被光譜相機捕獲,得到樣品的一維圖像,隨著電控平臺的移動,樣品連續前行,從而得到一個既包含影像信息又包含樣品光譜信息的三維數據立方體。
1.3.2 高光譜數據采集與處理 高光譜采集系統的參數設置情況如表1所示。
感興趣區域(ROI)選取與平均光譜提取的步驟與方法:在ROI區域選取時選取整個圖像的中間部分,避開表面具有明顯缺陷的圖像數據。ROI選擇完成之后,計算選擇區域的平均光譜,輸出txt格式的文本,用于后續的建模。ROI選取和平均光譜提取過程重復3次,取平均值作為該樣品的平均光譜,參與后續建模計算。圖3為感興趣區域選取與平均光譜提取過程。
高光譜數據采集與平均光譜提取采用ENVI軟件完成,后續光譜預處理與建模采用MATLAB軟件完成。預處理采用SG-1、SG-2、標準正態變換(SNV)、多元散射校正(MSC)等4種方法完成,建模采用廣義回歸神經網絡(GRNN)和概率神經網絡(PNN)等2種。
2 結果與討論
2.1 光譜預處理
利用高光譜采集系統采集到的不同物候期哈密瓜果實的原始光譜如圖4所示。原始光譜中除了包含樣品本身的信息外,還含有其他無關的信息、雜散光產生的無關信息、樣品采集時的背景噪聲等[7]。在利用化學計量學的方法建立模型時,采用不同的譜圖預處理方法能夠消除光譜數據中的無關信息和噪聲。本試驗采用SG-1、SG-2、SNV、MSC4種光譜預處理方法對光譜數據進行預處理。Savitzky-Golay卷積求導是通過最小二乘的方法計算得到與卷積平滑系數相似的導數系數,導數光譜可以有效地消除基線和背景的干擾,提高分辨率和靈敏度,同時能夠有效地分辨出重疊峰[8]。圖5為經過S-G一階導數、S-G二階導數處理后的光譜圖。SNV主要用來消除固體顆粒的大小、表面散射以及光程變化對光譜數據造成的影響[9]。對需要SNV變換的光譜采用公式(2)進行轉換。
3 結論
(1)通過經過SG-1、SG-2、SNV、MSC 4種方法預處理后的4個時期哈密瓜樣本光譜所建立的GRNN和PNN模型,對于哈密瓜物候期的判別具有很高的正確率。(2)對于廣義回歸神經網絡(GRNN),同時考慮輸入變量的包容性,以SG-導數和MSC預處理方式為最優,運行時間為0.046 9 s,比運行速度最慢的模型提高了39.95%。(3)對于概率神經網絡(PNN),同時考慮輸入變量的包容性,以采用標準正態變換(SNV)和SG-1預處理方式效果最好,模型運行時間為0.046 9 s,比其他預處理方式運行時間加快了24.96%。(4)在保證模型識別正確率的情況下,同時考慮輸入變量樣本的采集成本、樣本包容度以及運行時間等因素,最優的樣本采集方式與建模組合為以處于二、三、四期的哈密瓜樣本光譜經過SG-1-GRNN和SNV-PNN模型為最優,運行時間為 0.046 9 s,與其他模型相比最多可提高運行速率57%。
參考文獻:
[1]馬惠玲,王若琳,蔡 騁,等. 基于高光譜成像的蘋果品種快速鑒別[J]. 農業機械學報,2017,48(4):305-312.
[2]黃鋒華. 基于高光譜成像技術的油桃品質檢測及品種判別研究[D]. 晉中:山西農業大學,2016.
[3]楊小玲. 高光譜圖像技術檢測玉米種子品質研究[D]. 杭州:浙江大學,2016.
[4]鮑一丹,陳 納,何 勇,等. 近紅外高光譜成像技術快速鑒別國產咖啡豆品種[J]. 光學精密工程,2015,23(2):349-355.
[5]張 初,劉 飛,孔汶汶,等. 利用近紅外高光譜圖像技術快速鑒別西瓜種子品種[J]. 農業工程學報,2013,29(20):270-277.
[6]余克強,趙艷茹,李曉麗,等. 高光譜成像技術的不同葉位尖椒葉片氮素分布可視化研究[J]. 光譜學與光譜分析,2015,35(3):746-750.
[7]楊 佳. 傅里葉變換紅外光譜技術在芝麻油真偽鑒別、摻偽與品質分析中的應用[D]. 北京:北京林業大學,2013.
[8]楊 燕. 基于高光譜成像技術的水稻稻瘟病診斷關鍵技術研究[D]. 杭州:浙江大學,2012.
[9]張 俊. 茉莉花茶品質的近紅外化學計量學研究[D]. 杭州:浙江大學,2012.
[10]郭 朔. 近紅外光譜分析技術快速檢測液態乳制品品質的研究[D]. 長春:吉林大學,2008.