嚴金欣, 李新奇
(1.海南大學, 海口 570208; 2.三亞市國家耐鹽堿水稻技術創新中心, 海南 三亞 572024;3.湖南雜交水稻研究中心, 長沙 410125)
第三代雜交水稻是指以普通隱性核雄性不育系為雜交母本,以常規品種或品系為雜交父本雜交配制而成的新型雜交水稻[1-2]。第三代雜交水稻克服了第一代雜交水稻和第二代雜交水稻在技術上的局限性。其在水稻生長季節的任何時期均表現出雄性不育的特性,且不會因環境條件的改變而發生育性波動,是作物雜種優勢利用的理想遺傳工具[3-4]。
第三代雜交水稻不育系選育方法為紅色熒光繁殖系的自交繁殖。通過自交后,每個稻穗上會得到結實一半的雄性不育系種子和一半的繁殖系種子[5-6]。在種植栽培時此生產方式操作簡單,只需要按常規水稻種植方法將繁殖系種植收獲即可。
從繁殖系植株上收獲的種子需要進行熒光色選,以便區分出無熒光的普通核雄性不育系種子和有紅色熒光的繁殖系種子[7]。然而在色選環節中,筆者發現,發育不良的水稻種子存在谷殼發黑或紅色熒光較弱等情況,對于以計算機視覺為技術基礎的紅色熒光色選機識別率往往會降低,由于繁殖系和不育系水稻種子組分的化學性質存在顯著差異,尋求可用于精選的其他方案對不育系選育尤為重要。
研究表明,生物體的近紅外光譜是其表面光學特征及內在組分化學性質的本質反映,隨著生物體表面色澤和內在組分或結構的變化,其近紅外光譜特征信息也發生著顯著變化[8-10]。
在近紅外光譜的判別分析中 SIMCA(Soft independent modeling of class analogy)為最常用的建模方法。SIMCA 方法為每個類建立了獨立的主成分分析(Principal component analysis,PCA)模型,然后依據該模型對未知樣品進行分類[11-12]。本研究針對第三代雜交水稻不育系分選方案中的不足和近紅外光譜識別方法的高分辨能力,建立了敏感波段和全波段的近紅外光譜辨別模型,為第三代雜交水稻不育系選育提供新的快速鑒別手段。
2022年5—7月水稻收獲期間,隨機采取湖南雜交水稻研究中心海南基地第三代雜交水稻樣品5 kg。人工分揀去除水稻樣品中秸稈、草籽、石子、土塊等雜質后,放入袋中,置于38 ℃烘箱中,通風干燥24 h,調節樣品中含水量盡量保持一致,使用熒光色選機分選,人工篩選出確定無色不育系種子和紅色熒光繁殖系種子2份,各選取外觀狀態正常的100粒。其中1份樣品用于建模,1份樣品用于驗證。
1.2.1光譜采集
采用廈門奧譜天成公司生產的ATP 8600微纖近紅外光譜儀,使用漫反射方法,掃描樣品的近紅外光譜,分辨率約為3 nm,光譜波長范圍為900~1 700 nm,重復掃描4次求平均光譜并存盤備份。
1.2.2數據處理與分析
采用Unscrambler光譜分析軟件進行主成分分析和SIMCA建模;Origin軟件進行繪圖;Excel軟件進行繪表及數據匯總。
水稻種子的原始光譜中包含較多干擾信息,為了便于得到敏感波段,直接將平均光譜進行比較。從不育系種子和繁殖系種子的平均光譜(圖1)可看出,在1 350~1 450 nm范圍內繁殖系水稻種子的光譜吸收值顯著低于不育系水稻種子。且全波段曲線變化較為相似。因此,選取1 350~1 450 n波段光譜作為敏感波段。

圖1 不育系水稻種子和繁殖系水稻種子的平均光譜Fig.1 Average spectrum of male sterile rice seeds and breeding rice seeds
在進行SIMCA模型建立前,需要對光譜數據進行主成分分析。通過對近紅外光譜的數據特征觀察發現,在光譜數據存在較大差異時,遂使用Unscrambler光譜分析軟件對全波段光譜數據進行數據歸一化,在不影響信息的基礎上使數據在每個維度都服從均值為0、方差1的正態分布。得出全波段及敏感波段各主成分累積貢獻率(表1、表2)。

表1 全波段主成分累積貢獻率Table 1 Total contribution rate of all band principal components

表2 敏感波段主成分累積貢獻率Table 2 Total contribution rate of sensitive band principal components
選取最少主成分數可達到100%識別率為最終構建的SIMCA模型。結果顯示,在全波段SIMCA光譜范圍內無色水稻種子和紅色水稻種子最佳主成分數為5。在敏感波段處最佳主成分數為3(表3)。

表3 全波段及敏感波段不同主成分數所建模型的識別率Table 3 Recognition rate of models with different principal components in full band and sensitive band
為了進一步驗證已建立SIMCA模型的識別率,將未參與建模的100個水稻樣品光譜數據代入上述SIMCA辨別模型,結果表明,該SIMCA模型對2個種類的識別率均為100%。
第三代雜交水稻繁殖系種子與不育系種子近紅外光譜存在顯著差異,且存在明顯的敏感波段。本研究利用SIMCA法建立了辨別模型,并且選取利用主成分數最少的最優模型均達到100%的識別率。證明此方法在敏感波段及全波段都能有效辨別第三代雜交水稻繁殖系與不育系。