王 冬,韓 平*,吳靜珠,趙麗麗,徐 恒
1. 北京農業質量標準與檢測技術研究中心,北京 100097 2. 全國生態環保優質農業投入品評價技術機構(CAQS-TRP-004),北京 100097 3. 北京工商大學食品安全大數據技術北京市重點實驗室,北京 100048 4. 北京博普特科技有限公司,北京 100193
玉米種子不完善粒(Defective Kernals)指有缺陷或受到損傷但尚有使用價值的玉米顆粒。 中華人民共和國國家標準GB 1353—2018 《玉米》[1]規定, 1, 2, 3, 4和5等級玉米中, 不完善粒含量分別為不超過4.0%, 6.0%, 8.0%, 10.0%和15.0%; 中華人民共和國農業行業標準NY/T 519—2002 《食用玉米》[2]規定, 1, 2和3等級玉米的不完善粒占比不超過5.0%。 熱損傷粒是指發熱或干燥受熱后籽粒顯著變色或受到損傷的顆粒, 是不完善粒的一種。 玉米干燥過程對溫度有嚴格的規定。 中華人民共和國國家標準GB/T 21017—2007《玉米干燥技術規范》規定[3], 食用玉米、 淀粉發酵工業用玉米、 飼料用玉米的允許受熱溫度分別為50, 55和60 ℃。 超過規定的干燥溫度很容易導致玉米種子熱損傷。 熱損傷玉米種子不僅在種子活力方面會受到影響, 而且在營養價值、 口感等方面亦會降低其價值。 中華人民共和國國家標準GB/T 5494—2019 《糧油檢驗 糧食、 油料的雜質、 不完善粒檢驗》[4]規定了不完善粒的檢測方法, 包含電動篩選器法和手篩法。 然而, 目前對熱損傷粒的檢測仍需人工觀察玉米種子表皮、 胚、 胚乳是否有顯著變色, 不同檢驗人員對玉米種子不完善粒定義理解存在偏差, 檢驗時把握尺度也有差異, 玉米種子不完善粒檢驗過程中很可能出現差異較大的情況[5]; 相對于蟲蝕粒、 病斑粒、 破損粒、 生芽粒、 生霉粒等其他種類不完善粒, 熱損傷粒外觀的改變相對而言不明顯, 故較其他不完善粒更難以準確分辨。 因此, 針對玉米種子熱損傷粒, 建立一種客觀、 高效、 無損、 快速的檢測方法成為當前亟待解決的問題。
隨著化學計量學的發展和計算機技術的進步, 近紅外光譜技術近幾年飛速發展, 并在種子品質無損快速檢測等領域得以廣泛應用[6-7]。 與此同時, 多光譜以及高光譜技術在提供光譜信息的同時, 還可以提供樣品的空間分布信息[8-9], 從而為種子胚部、 胚乳部的局部光譜數據的采集提供了解決方案。 近年來, 一些學者就多光譜、 高光譜技術檢測種子品質開展了有關研究, 并取得了一定的進展。 Choi等[10]采用高光譜成像研究了羅勒種子溯源, 發現1 449~1 457, 1 242~1 254, 1 380和1 696 nm對產自新加坡、 巴基斯坦、 越南、 印度的羅勒種子產地溯源有重要作用。 張婷婷等[11]采用可見-近紅外高光譜成像結合連續投影算法和遺傳算法測定甜玉米種子電導率, 進而對甜玉米種子活力進行預測; 其中, 全譜數據經多元散射校正預處理, 采用偏最小二乘回歸所建模型, 校正、 預測決定系數分別為0.983和0.974; 采用遺傳算法從全譜853個變量篩選出25個關鍵變量; 采用多元散射校正預處理, 基于遺傳算法篩選關鍵變量所建的偏最小二乘回歸模型的校正、 預測決定系數分別為0.976和0.973。 Nie等[12]采用近紅外高光譜成像結合深度卷積神經網絡算法分別研究了雜交秋葵種子和雜交絲瓜種子的分類; 當類別數量從2個增至6個時, 雜交秋葵種子深度卷積神經網絡模型的校正、 預測準確率不低于98%, 雜交絲瓜種子深度卷積神經網絡模型的校正、 預測準確率不低于95%。 Jayme G. A. Barbedo等[13]采用近紅外高光譜成像研究了3個品種小麥籽粒發芽的檢測, 結果表明, 918和1 411 nm和小麥籽粒發芽損傷具有高度關聯性, 將上述兩個波長數據結合為一個指數即可準確判斷小麥籽粒的發芽情況。 Collins Wakholi等[14]采用近紅外高光譜成像研究了玉米種子活力的快速檢測, 分別采用線性判別分析、 偏最小二乘判別分析和支持向量機建立玉米種子活力判別模型, 結果表明, 支持向量機模型準確率最高, 白色、 紫色和黃色玉米種子活力判別準確率分別為100%, 100%和98%。
糯玉米(waxy corn)又稱黏玉米或蠟質型玉米, 其栽培技術簡單、 周期短, 可用作食材、 牲畜飼料以及工業原料等, 具有較高的經濟價值、 營養價值和加工價值。 然而, 針對糯玉米種子熱損傷粒的無損快速鑒別目前尚未見報道。 中華人民共和國國家標準GB/T 22326—2008 《糯玉米》規定[15], 1, 2和3等級糯玉米中的不完善粒占比不超過6.0%; 中華人民共和國農業行業標準NY/T 524—2002《糯玉米》規定[16], 1, 2和3等級糯玉米中的不完善粒占比不超過5.0%。 為糯玉米種子熱損傷粒的無損快速鑒別、 種子不完善粒無損快速檢測、 種子質量快速篩查等提供具有參考價值的信息。以糯玉米為例, 采用多光譜成像技術研究糯玉米熱損傷粒的無損快速檢測, 分別以胚面向上、 胚面向下方式采集對照組和熱損傷組糯玉米種子多光譜成像數據, 提取胚面向上胚部、 胚乳部單點多光譜數據以及胚面向下胚乳部單點多光譜數據, 并融合胚面向上胚部和胚乳部多光譜數據; 對各數據做基線校正預處理, 計算各光譜數據樣本標準差, 分析熱損傷對糯玉米種子不同部位多光譜數據影響的差異; 建立熱損傷糯玉米種子偏最小二乘判別分析(partial least square-discriminant analysis,PLS-DA)模型, 統計模型校正、 交互驗證數據正確率。 作為對比, 采用近紅外光譜儀配合顆粒樣品采樣附件采集糯玉米種子胚面向上、 胚面向下近紅外光譜數據, 并將糯玉米種子胚面向上及胚面向下近紅外光譜數據融合; 做基線校正預處理后, 計算各數據的各光譜數據樣本標準差, 分析熱損傷對糯玉米種子不同部位近紅外光譜數據影響的差異; 建立熱損傷糯玉米種子PLS-DA模型, 統計模型校正、 交互驗證數據正確率。
京科糯2000玉米種子, 采購于京研益農(北京)種業科技有限公司。 將糯玉米種子分為對照組和熱損傷組(實驗組)各50粒, 對照組置于陰涼干燥處, 熱損傷組樣品放入電熱恒溫鼓風干燥箱, 做高溫干燥處理, 模擬糯玉米種子熱損傷過程。
(1)多光譜成像儀: 丹麥Videometer公司, 型號: VideometerLab4。 采集多光譜圖像面積為90 mm×90 mm, 圖像有效像素2 192×2 192, 圖像空間分辨率41 μm·pixel-1; 采用19個高功率發光二極管作為光源, 按波長順序依次照射樣品, 光譜波長范圍365~970 nm, 光譜變量數19個, 以儀器內部自帶白色陶瓷片作為光譜參比, 積分球收集樣品反射光信息, 電荷耦合元件(charge-coupled device,CCD)檢測器對樣品反射光信號進行檢測。
(2)近紅外光譜儀: 美國VIAVI公司, 型號: NIR1700。 采用鹵鎢燈作為光源, 采用線性漸變分光(linear variable filter,LVF)原理, 波長范圍908~1 676 nm, 光譜中心分辨率10 nm, 光譜變量數125個, 以聚四氟乙烯白塊作為光譜參比, 光譜累加平均50次, 配合顆粒樣品采樣附件, 采用線陣列銦鎵砷檢測器(InGaAs detector)測量樣品漫反射近紅外光譜數據。
(3)電熱恒溫鼓風干燥箱: 上海卉綠科學儀器有限公司, 型號: DGG-9246A, 溫度分辨率0.1 ℃, 恒溫波動度±1.0 ℃。
采用電熱恒溫鼓風干燥箱對糯玉米種子熱損傷組樣品進行高溫干燥處理, 溫度設定80.0 ℃, 干燥8 h。 將糯玉米種子胚面向上放置記為GU, 糯玉米種子胚面向下放置記為GD, 分別采用多光譜成像儀、 近紅外光譜儀采集糯玉米種子胚面和胚乳面多光譜成像數據和近紅外光譜數據。
(1)多光譜成像儀數據處理: 采用Videometer多光譜成像儀采集對照組和熱損傷組糯玉米種子多光譜成像數據。 其中, 糯玉米種子胚面向上放置(GU)時分別采集胚部和胚乳部單點多光譜數據, 胚面向上胚部光譜數據記為GUEm, 胚面向上胚乳部光譜數據記為GUEn; 糯玉米種子胚面向下放置(GD)時采集胚乳部單點多光譜數據, 記為GDEn。 將GUEm和GUEn數據初級融合為GUEm-GUEn數據。 對各組數據做基線校正預處理, 在此基礎上計算各光譜數據樣本標準差; 分別采用GUEm, GUEn, GDEn和GUEm-GUEn數據建立偏最小二乘-判別分析(partial least square-discriminant analysis,PLS-DA)模型, 并討論前3主成分得分分布情況以及各模型判別正確率。 糯玉米種子多光譜采集區域示意圖如圖1所示。

圖1 糯玉米種子多光譜采集區域示意圖(a): 胚面向上胚部GUEm(+)、 胚面向上胚乳部GUEn(×);(b): 胚面向下胚乳部GDEn(○)Fig.1 The diagram of the areas for collectingthe spectra of waxy corn seed
(2)近紅外光譜數據處理: 采用VIAVI近紅外光譜儀采集對照組和熱損傷組單粒糯玉米種子多光譜成像數據。 其中, 糯玉米種子胚面向上放置所采集光譜數據記為GUS, 胚面向下放置所采集光譜數據記為GDS。 對各組數據做基線校正預處理, 在此基礎上計算各光譜數據的樣本標準差; 分別采用GUS, GDS以及GUS-GDS初級融合數據建立PLS-DA模型, 并討論前3主成分得分分布情況以及各模型判別正確率。
圖2是京科糯2000玉米種子對照組(a)和熱損傷組(b)部分樣品。 采用Videometer多光譜成像儀采集樣品的多光譜成像后, 使用儀器自帶圖像處理軟件扣除背景得到圖2。 從圖2可見, 僅用肉眼觀察可見光照片難以將對照樣品和熱損傷樣品加以區分。

圖2 京科糯2000玉米種子對照組(a)和熱損傷組(b)Fig.2 The control group (a) and the heat-damagedgroup (b) of Jingkenuo 2000 corn seeds
京科糯2000玉米種子對照組和熱損傷組樣品的多光譜成像數據如圖3所示, 其中, (a1)為對照組胚面向上胚部光譜(GUEmDZ)、 (a2)為熱損傷組胚面向上胚部光譜(GUEmRSS)、 (b1)為對照 組胚面向上胚乳部光譜(GUEnDZ)、 (b2)為熱損傷組胚面向上胚乳部光譜(GUEnRSS)、 (c1)為對照組胚面向下胚乳部光譜(GDEnDZ)、 (c2)為熱損傷組胚面向下胚乳部光譜(GDEnRSS)。 從圖3可見, 各光譜從365~970 nm的吸光度基本呈上升趨勢, 并普遍存在970 nm處吸光度較高而365 nm處吸光度較低的趨勢。 另一方面, 熱損傷樣品和對照樣品的多光譜數據在365~970 nm范圍內的光譜輪廓未見明顯區別。

圖3 糯玉米種子多光譜(a1): GUEmDZ; (a2): GUEmRSS; (b1): GUEnDZ; (b2): GUEnRSS; (c1): GDEnDZ; (c2): GDEnRSSFig.3 The multi-spectra of waxy corn seeds(a1): GUEmDZ; (a2): GUEmRSS; (b1): GUEnDZ; (b2): GUEnRSS; (c1): GDEnDZ; (c2): GDEnRSS
為研究多光譜數據中各變量所對應吸光度值的變化規律, 對GUEmDZ, GUEmRSS, GUEnDZ, GUEnRSS, GDEnDZ和GDEnRSS數據分別做基線校正預處理以消除光譜平移對數據的影響, 再統計各光譜數據樣本標準差, 如圖4所示。 由于對數據做基線校正預處理, 波長365 nm所對應變量數據的樣本標準差值為0。 在405~780 nm范圍內, GUEmDZ樣本標準差較GUEmRSS樣本標準差大, 在850~970 nm范圍內, GUEmDZ和GUEmRSS樣本標準差規律不明顯; 在405~970 nm范圍內, GUEnDZ樣本標準差普遍較GUEnRSS樣本標準差小; 在405~970 nm范圍內, 除波長690 nm所對應的標準差值較為接近外, 其他波長對應的GDEnDZ樣本標準差較GDEnRSS的樣本標準差小。 以上數據結果說明, 高溫削弱了糯玉米種子胚的差異, 在光譜上表現為熱損傷組糯玉米種子胚的多光譜數據變異相對較小而對照組糯玉米種子胚的多光譜數據變異相對較小; 另一方面, 高溫增強了糯玉米種子胚乳的差異, 在光譜上表現為熱損傷組糯玉米種子胚乳的多光譜數據變異相對較大而對照組糯玉米種子胚乳的多光譜數據變異相對較小。

圖4 糯玉米種子多光譜各變量數據樣本標準差○: GUEmDZ; *: GUEmRSS; △: GUEnDZ;▽: GUEnRSS; +: GDEnDZ; ×: GDEnRSSFig.4 The standard deviation of the multi-spectraof waxy corn seeds○: GUEmDZ; *: GUEmRSS; △: GUEnDZ;▽: GUEnRSS; +: GDEnDZ; ×: GDEnRSS
對造成上述結果的原因分析如下: 種子胚的主要成分是蛋白質, 蛋白質的種類很多, 多以蛋白質高級結構(折疊、 螺旋、 疊加及組合等)的形式存在, 這是蛋白質具有生物學功能的重要原因之一。 高溫可導致蛋白質發生變性, 失去了原有的一些高級結構, 變性后的蛋白質較變性前的蛋白質在化學鍵組成、 分子結構及分子構象等方面的差異相對較小, 因此胚對照組光譜變量數據樣本標準差普遍高于熱損傷組; 而胚乳的主要成分是以淀粉為主的多糖類物質, 本研究的高溫環境導致熱損傷組糯玉米種子胚乳中部分多糖類物質化學鍵斷裂, 形成由多種糖類構成的復雜混合物, 其化學鍵的組成、 分子結構及分子構象較對照組樣品增大, 因此對于胚乳部多光譜數據, 對照組光譜變量數據樣本標準差普遍低于熱損傷組。
對胚面向上胚部光譜(GUEm)PLS-DA模型、 胚面向上胚乳部光譜(GUEn)PLS-DA模型、 胚面向下胚乳部光譜(GDEn)PLS-DA模型、 胚面向上胚部光譜和胚乳部光譜融合數據(GUEm-GUEn)PLS-DA模型計算主成分累積貢獻率, 上述4個模型的前3主成分累積貢獻率分別為97%, 98%, 95%和93%, 亦即各模型潛3主成分累積貢獻率皆超過90%。 將GUEm, GUEn, GDEn, GUEm-GUEn四模型的前三主成分得分繪制3D散點圖, 分別如圖5(a—d)所示, 其中, “○”表示對照組樣品, “△”表示熱損傷組樣品。 從圖5可見, 四種模型的前三主成分得分的3D散點圖中, 對照組和熱損傷組具有一定的分離趨勢。

圖5 糯玉米種子多光譜PLS-DA判別模型前3主成分得分散點圖(a): GUEm; (b): GUEN; (c): GDEn; (d): GUEm-GUEn; ○: 對照組; △: 熱損傷組Fig.5 The scatter plots of the first 3 principal components of PLS-DA models of the multi-spectra of waxy corn seeds(a): GUEm; (b): GUEN; (c): GDEn; (d): GUEm-GUEn; ○: control group; △: heat-damaged group
分別采用胚面向上胚部光譜數據(GUEm)、 胚面向上胚乳部光譜數據(GUEn)、 胚面向下胚乳光譜數據(GDEn)建立京科糯2000玉米種子熱損傷粒的PLS-DA判別模型, 并建立GUEm和GUEn融合數據的熱損傷粒PLS-DA判別模型, 結果如表1所示。 從表1可見, GUEm, GUEn, GDEn和GUEm-GUEn四模型的校正數據正確判別率皆在96%~100%之間, 而交互驗證數據正確判別率皆在92%~100%之間; 四模型中, GUEm-GUEn模型正確率最高。

表1 京科糯2000玉米種子熱損傷粒PLS-DA正確率Table 1 The accuracy of PLS-DA for heat-damagedkernels of Jingkonuo 2000 corn seeds
采用VIAVI近紅外光譜儀采集京科糯2000玉米種子對照組和熱損傷組樣品的近紅外光譜如圖6所示, 其中, a為對照組胚面向上光譜(GUSDZ)、 b為熱損傷組胚面向上光譜(GUSRSS)、 c為對照組胚面向下光譜(GDSDZ)、 d為熱損傷組胚面向下光譜(GDSRSS)。 從圖6可見, 各光譜呈相似的趨勢, 熱損傷樣品和對照樣品在908~1 676 nm范圍內未見明顯區別。

圖6 糯玉米種子近紅外光譜(a): GUSDZ; (b): GUSRSS; (c): GDSDZ; (d): GDSRSSFig.6 The NIR spectra of waxy corn seeds(a): GUSDZ; (b): GUSRSS; (c): GDSDZ; (d): GDSRSS
為研究近紅外光譜數據中各變量所對應吸光度值的變化規律, 對GUSDZ, GUSRSS, GDSDZ和GDSRSS數據分別做基線校正預處理以消除光譜平移對數據的影響, 再統計各光譜數據樣本標準差, 如圖7所示。 由于對數據做基線校正預處理, 波長964 nm所對應樣本標準差值為0。 從圖7可見: 對于胚面向上數據, GUSDZ樣本標準差普遍高于GUSRSS; 而對于胚面向下數據, GDSDZ樣本標準差普遍低于GDSRSS; 該規律在1 400~1 676 nm范圍內更為明顯; 該結果和多光譜樣本標準差的分析結果一致。

圖7 糯玉米種子近紅外光譜數據的樣本標準差○: GUSDZ; *: GUSRSS; △: GDSDZ; ▽: GDSRSSFig.7 The standard deviation of the near-infraredspectral data of waxy corn seeds○: GUSDZ; *: GUSRSS; △: GDSDZ; ▽: GDSRSS
分別對胚面向上(GUS)、 胚面向下(GDS)以及GUS-GDS融合數據建立PLS-DA模型, 并計算模型主成分累積貢獻率。 結果表明, GUS, GDS和GUS-GDS模型的前3主成分累積貢獻率分別為99%, 99%和96%, 亦即各模型前3主成分累積貢獻率皆超過95%。 將GUS, GDS和GUS-GDS模型的前三主成分得分繪制3D散點圖, 分別如圖8(a—c)所示, 其中, “○”表示對照組樣品, “△”表示熱損傷組樣品。 從圖8可見, 三個模型的前三主成分得分的3D散點圖中, 對照組和熱損傷組具有一定的分離趨勢, 其中GUS和GDS模型對照組和熱損傷組的分離趨勢更明顯。

圖8 糯玉米種子近紅外光譜PLS-DA判別模型前3主成分得分散點圖(a): GUS; (b): GDS; (c): GUS-GDS; ○: 對照組; △: 熱損傷組Fig.8 The scatter plots of the first 3 principal components of PLS-DA models of the NIR spectra of waxy corn seeds(a): GUS; (b): GDS; (c): GUS-GDS; ○: control group; △: heat-damaged group
分別采用胚面向上光譜數據(GUS)、 胚面向下光譜數據(GDS)以及GUS-GDS融合數據建立京科糯2000玉米種子熱損傷粒的PLS-DA判別模型, 結果如表2所示。 從表2可見, 各模型正確率皆為100%。

表2 京科糯2000玉米種子熱損傷粒PLS-DA正確率Table 2 The accuracy of PLS-DA for heat-damagedkernels of Jingkonuo 2000 corn seeds
分別采用多光譜成像儀、 近紅外光譜儀針對京科糯2000玉米種子熱損傷組、 對照組分別采集了多光譜成像數據和近紅外光譜數據。 針對多光譜成像數據, 提取了胚面向上胚部、 胚面向上胚乳部單點多光譜數據以及胚面向下胚乳部單點多光譜數據, 并將胚面向上胚部和胚乳部數據融合; 針對近紅外光譜數據, 采集了單粒種子胚面向上、 胚面向下近紅外光譜數據并將單粒種子數據融合。 對各數據做基線校正預處理后, 計算樣本標準差, 并分析熱損傷和對糯玉米種子各部位的影響, 結果表明, 高溫過程對糯玉米種子胚、 胚乳有不同程度的影響, 表現在光譜數據樣本標準差上, 熱損傷組胚部多光譜數據樣本標準差較對照組普遍較小, 熱損傷組胚向上近紅外光譜變量數據樣本標準差較對照組普遍較小, 熱損傷組胚乳部多光譜數據樣本標準差較對照組普遍較大, 熱損傷組胚乳部近紅外光譜數據樣本標準差較對照組普遍較大, 亦即本研究中采用的近紫外-可見-短波近紅外多光譜數據和近紅外光譜數據具有相似的規律。 分別基于多光譜數據、 近紅外光譜數據建立糯玉米熱損傷粒PLS-DA模型, 結果表明, 多光譜數據PLS-DA的校正數據正確率在96%~100%之間, 交互驗證數據正確率在92%~100%之間, 其中, 基于糯玉米種子胚向上胚部和胚乳部融合的多光譜數據所建PLS-DA模型準確率最高, 校正數據正確率為100%, 交互驗證數據正確率在98%~100%之間; 近紅外光譜數據PLS-DA模型的校正數據、 交互驗證數據正確率皆為100%。
本研究表明, 基于近紫外-可見-短波近紅外多光譜數據可以對糯玉米種子熱損傷粒進行無損快速鑒別, 而基于近紅外光譜數據所建糯玉米種子熱損傷粒判別模型具有更高的準確度。 然而, 跨年度樣品、 不同高溫環境導致的熱損傷樣品以及其他品種玉米種子的熱損傷粒無損快速鑒別仍需進一步深入研究。