謝莉莉,王福民,2,張 垚,2,黃敬峰,胡景輝,王飛龍,姚曉萍
基于多生育期光譜變量的水稻直鏈淀粉含量監測
謝莉莉1,王福民1,2※,張 垚1,2,黃敬峰2,3,胡景輝1,王飛龍4,姚曉萍1
(1. 浙江大學農業遙感與信息技術應用研究所,杭州 310058; 2. 浙江省農業遙感與信息技術重點研究實驗室,杭州 310058; 3. 環境修復與生態健康教育部重點實驗室,浙江大學環境與資源學院,杭州 310058;4. 浙江大學水文與水資源工程研究所,杭州 310058)
直鏈淀粉含量是評價稻米品質的重要指標之一,其累積生長過程是多生育期、多因素綜合作用的結果。為了探究多生育期信息引入對水稻籽粒直鏈淀粉含量監測模型的影響,實現水稻品質信息的大規模準確監測。該研究選取水稻孕穗期、抽穗期、灌漿期和成熟期這4個有關水稻籽粒形成發育的生育期的冠層光譜,分析原光譜、植被指數、高光譜特征參數,及其變換形式與水稻籽粒直鏈淀粉含量的相關性,篩選得到相關性較好的光譜變量,并利用逐步回歸的方法進行建模,建立基于多生育期光譜變量的直鏈淀粉含量預測模型。結果表明:一階導數、差值植被指數(Difference Vegetation Index, DVI)、比值植被指數(Ratio Vegetation Index, RVI)及成熟期特征參數表現出較高敏感性,最適用于直鏈淀粉含量預測的生育期為成熟期,而多生育期信息的綜合利用能顯著提高模型預測精度,最佳多生育期預測模型為孕穗-抽穗-成熟期組合模型,建模決定系數(Coefficient of Determination,2)為0.708,均方根誤差(Root Mean Square Error, RMSE)為0.711%,平均絕對百分比誤差(Mean Absolute Percent Error, MAPE)為3.22%,驗證2為0.631,RMSE為0.768%,MAPE為3.99%,證明該模型能較為精確地預測籽粒直鏈淀粉含量,為稻米品質指標大尺度統計監測提供一定的技術支撐和應用基礎。
遙感;模型;多生育期;直鏈淀粉含量;高光譜
水稻自古就是中國主要糧食作物之一,具有悠久的種植歷史和食用傳統,中國有超過60%的人口以其為主食,因而水稻生產管理工作一直是中國保證糧食安全工作的重要組成部分。中國的水稻研究工作長久以來都聚焦于作物產量方面,力圖以高產來解決人民的溫飽問題,然而,隨著經濟的發展和人民生活水平的提高,人們對水稻的品質問題也提出了更高的要求[1]。水稻品質的大規模快速監測對衡量稻米商品價值、調節糧食作物生產具有重要的意義。
稻米品質是指谷物從種植生產、加工處理乃至市場流通的整個生產銷售流程中,其作為糧食或商品所具備的各種特性,涵蓋了多項指標,主要可分為碾米、外觀、蒸煮、食味、營養五大方面[2]。淀粉含量是稻米品質評價的一項重要參數,可分為直鏈淀粉和支鏈淀粉兩類,兩者的含量、比例等情況會直接影響蒸煮過程中稻米的水分吸收率和膨脹性,以及米飯的黏性與其質地的柔軟度,即直鏈淀粉含量與稻米蒸煮食味品質密切相關[3-4]。因而,可通過監測水稻籽粒直鏈淀粉含量,對稻米品質進行評價研究。
前人研究發現農作物中的不同生化組分具有其特征吸收波段[5],這些吸收特征使學者們通過光學遙感數據監測作物品質參數成為可能。目前,對作物品質遙感監測預報的研究還處于起步階段,但相關研究者已在植被指數選用、模型建立等方面取得了一定成果,利用反射光譜來預測谷類籽粒的粗蛋白和直鏈淀粉含量的可行性得到了初步驗證[6-13],如劉蕓等[13]比較了直鏈淀粉、粗淀粉、粗蛋白三者光譜間的差異性,并分析其高光譜特征,分別建立了相關預測模型(2>0.7);賀佳等[6]通過融合冬小麥不同生育期的植被指數和植株氮含量,建立了籽粒蛋白質含量預測模型;Huang等[11]基于氮反射指數、開花期葉片氮素濃度及蛋白質含量三者間的關系,建立了粗蛋白預測模型。但就現有研究而言,一方面,作物蛋白質及氮素含量研究較為成熟,而淀粉含量方面研究較少且所建模型精度較差;另一方面,淀粉相關的研究大多選用室內光譜,以糙米或米粉為研究對象進行預測,而冠層級別的研究大多僅關注單一生育期模型,尤以成熟期光譜居多[14-18],而多生育期組合的監測預測研究則不多見。事實上,籽粒直鏈淀粉的累積是一個漫長而復雜的過程。水稻開花受精后,莖葉等“源”器官合成存儲的碳水化合物即被運輸至籽粒(“庫”器官)中,并在一些酶的作用下形成淀粉粒,孕穗、抽穗乃至灌漿期的莖葉長勢都會影響水稻“源”器官的物質供應總量和效率,而抽穗、灌漿期的穗的生長情況決定其“庫”的數目與活性,對淀粉粒累積的速率和多少都有所制約。因而,相關研究發現直鏈淀粉的累積會受到水分、光照、氮素等許多因素的綜合影響[19-21],這些影響首先會表現在不同作物生育期長勢變化上,進而轉化為對品質的影響,即作物生長過程中不同生育期的實際生長情況也包含了大量籽粒品質信息,因此水稻大田籽粒直鏈淀粉的遙感監測除了使用成熟期的冠層光譜,還應考慮成熟前各生育期的冠層光譜,通過對不同生育期冠層光譜的綜合分析,有望進一步提高水稻籽粒淀粉含量監測精度。
因而,本文選取孕穗期、抽穗期、灌漿期、成熟期這4個與水稻籽粒生長發育直接相關的生育期進行研究,探究籽粒直鏈淀粉預測能力在籽粒生長發育的各個生育期間的變化,及多生育期信息組合對預測模型的影響情況。
試驗區位于浙江省德清縣新安鎮下舍村的浙江省糧食生產功能區內,該地區處于杭嘉湖平原西部,屬亞熱帶濕潤季風區,溫暖濕潤,四季分明,年平均氣溫為13~16 ℃,無霜期220~236 d,多年平均降水量為1 379 mm。
田間試驗是2016、2017年2 a的連續試驗,主要設置有5個氮素水平(N0、N1、N2、N3和N4)和2個試驗品種(S1、S2)。設置的氮素水平中,N0為不施用氮肥,N2為當地農戶正常氮肥使用量(基肥1次+追肥2次,總計約225 kg/hm2),N1、N3、N4分別為N2的50%、150%和200%。水稻品種的選取,隨當年當地農民水稻種植情況有所變更,2016年選擇嘉58(S1)和秀優378(S2)2個品種;2017年選擇嘉58(S1)和浙粳99(S2)2個品種。
1.2.1 冠層光譜測量
測量采用的光譜儀為美國ASD(Analytical Spectral Device)公司的ASD Field Spec Pro FRTM光譜儀,其測量范圍為350~2 500 nm。試驗選擇水稻的孕穗期、抽穗期、灌漿期和成熟期等多個生育期階段內、晴朗少云微風的天氣進行冠層光譜測量,測量時間多在上午10:00—14:00間,測量時,傳感器探頭垂直向下,距離冠層1 m以上,每次測量均選取小區內任意位置(非邊際效應區域),分別以4穴植株中間位置和單株植株為測量點進行測量,每個測量點均記錄10條光譜,以其均值為該小區的反射率光譜,每次測量前均需進行白板校正。
1.2.2 直鏈淀粉含量測定
將成熟期收獲的稻谷樣品脫殼,并碾磨成粉狀后混勻,使用分光光度計法進行測量,以獲得各小區直鏈淀粉含量實測值。
本文選擇冠層原光譜、一階導數光譜、植被指數變量(DVI、EVI2、NDVI、RVI),用于參數篩選和模型建立。此外,參考現有研究[22-25],發現除以上常規參數外,其他類型的參數,如顏色、粒長、紅邊參數等也越來越多地被品質監測領域的相關研究所使用,故結合實測數據情況,選取了綠峰、紅谷參數,紅邊、藍邊、黃邊“三邊”參數等高光譜特征參數。各類光譜變量定義具體如表1。

表1 光譜變量及其定義
注:R為350~2 500 nm范圍內波長為處所對應的反射率值,,IR為760~2 500 nm波長范圍內的任一反射率,RED為620~700 nm紅光波長范圍內的任一反射率。
Note:Ris the reflectivity value at the wavelength ofin the range of 350-2 500 nm,, IR is any reflectivity in the wavelength range of 760-2 500 nm, REDis any reflectivity in the wavelength range of 620-700 nm.
試驗獲取了2016、2017年試驗田水稻孕穗期、抽穗期、灌漿期和成熟期這4個時期的光譜,由于2 a所選用的水稻品種有所差異,其直鏈淀粉含量范圍也不盡相同,2016年樣品的直鏈淀粉質量分數為15.21%~19.57%,而2017年樣品為12.67%~16.88%,2 a樣品直鏈淀粉含量范圍差異性較大,故以1 a為訓練集、另1 a為驗證集的方法建立模型的方法并不適用。因而,本文將2 a數據混合,嘗試建立新的訓練與驗證集合:將2 a樣品(=40)以直鏈淀粉質量分數為依據由高到低排列后重新均勻劃分為3組,取其中2/3為訓練集(=27),1/3為驗證集(=13),使得兩者的質量分數范圍為12.67%~19.57%和12.96%~17.15%,以保證驗證集合和建模集合相互完全獨立,且前者的直鏈淀粉質量分數分布范圍能被后者所包含,在此基礎上嘗試建立較為可靠的預測模型。
本研究將采用相關分析法確定最佳光譜參數類型及其最佳波段組合,并采用逐步回歸法建立直鏈淀粉監測模型。
多元逐步回歸法是將備選變量逐一引入模型中,建立與因變量相關性最高的一元回歸模型,而后在保留該變量的前提下,再逐一將剩余變量引入模型中,嘗試建立與因變量相關性最高的二元回歸模型。以此類推,在建立模型的同時,對引入的變量進行顯著性檢驗,且在每一個新變量引入時對之前所選的所有變量都逐一進行檢驗,以保證所建立模型中每一個變量的顯著性,當沒有新變量能通過顯著性檢驗而被引進時,該建模過程即完成,最終模型顯示為多元線性方程,即:

式中為因變量,12、x為引入模型的個自變量,012N為模型的常數項及對應各變量的參數項,為誤差項。
檢驗所選用的指標為決定系數(2),均方根誤差(RMSE),平均絕對百分比誤差(MAPE)。




2反映了模型的擬合程度,其值越高,模型對因變量的解釋程度越高;RMSE和MAPE則反映了模型預測值與真實值之間的離散和偏離程度,其值越低,說明模型對于因變量的預測效果越好。
水稻直鏈淀粉含量受多種因素影響,田間試驗設置了施氮量、水稻品種、氣候年型3個影響因子,分析三者對水稻直鏈淀粉含量的影響情況,結果如圖1。圖1a以S1(嘉58)品種為例,分析了同一品種在不同施氮水平和不同氣候年型下的稻米直鏈淀粉含量差異性,可知2017年直鏈淀粉含量整體明顯(<0.01)低于2016年,故氣候年型對稻米直鏈淀粉含量影響明顯;而不同施氮水平間,稻米直鏈淀粉含量有所波動,但隨著氮素水平的上升并未出現有規律的上升或下降趨勢,且重復處理的田塊樣品間差異也較為明顯,即該差異性可能來自試驗的隨機性而非氮素變化,故施氮水平不是該試驗中影響稻米直鏈淀粉含量的主要因素。圖1b以2016年稻米樣品為例,分析了在同一氣候年型不同稻米品種和氮素水平對直鏈淀粉含量的影響情況,可知S2品種直鏈淀粉含量在各氮素水平下均低于S1品種,差異并不顯著(>0.05)但較為穩定。

注:圖a以S1(嘉58)為例,圖b以2016年稻米樣品為例,N0~N4為試驗設置的5個氮素水平。
2.2.1 原光譜及一階導數
研究選取2016、2017年共計40個田塊的孕穗期、抽穗期、灌漿期、成熟期的冠層光譜,刪除由于水吸收、儀器敏感性等因素而出現非正常波動的無效波段,得到有效的水稻冠層反射光譜用于進一步處理。結合圖2和圖3a分析不同生育期冠層光譜可知,在350~760 nm的可見光區段中,抽穗期光譜的相關系數明顯高于其他生育期,而在760~1 350nm波段的紅外區域,冠層光譜的相關性隨著生育期的變化呈現先增后減的趨勢,并在抽穗-灌漿期間達到最大值。

圖2 各生育期冠層光譜相關性分析
利用以上得到的光譜計算各波段反射率及其一階導數變換值與籽粒直鏈淀粉含量的相關性,分析其敏感波段分布規律。由圖3a可知,除灌漿期外其他3個生育期的原光譜敏感波段集中在可見光區域,即350~750 nm波段,而灌漿期的敏感波段除了350~450 nm的紫光波段外,還較為集中出現在1 400~1 500 nm的紅外波段。

圖3 各生育期直鏈淀粉含量相關敏感波段分布情況
結合圖3b與表2可知,4個生育期原光譜相關性分析的最佳參數都出現在可見光區域,相關性整體較低,相關系數最大值范圍為0.45~0.49;光譜經一階導數變換后相關性較原光譜有了明顯的提升,相關系數最大值范圍上升至0.52~0.59,且篩選得到的敏感波段范圍也有了很大的擴展,雖然波段大部分依然集中于350~750 nm的可見光波段,但在750~1 800 nm的紅外區域也出現了部分敏感波段。
分析以上相關分析結果,得到各生育期原光譜及一階導數光譜的最佳參數結果如表2。

表2 原始光譜與一階導數光譜的最佳波段
2.2.2 植被指數
用所有可能的波段組合計算不同生育期的DVI、EVI2、NDVI、RVI 4種光譜指數,分析它們與水稻籽粒直鏈淀粉含量的相關性,得到結果如圖4。由圖4可知,4個光譜指數與籽粒直鏈淀粉的相關性都隨著生育期變化先增后減,分別在抽穗期和成熟期的達到2個峰值,即抽穗期和成熟期的植被指數較其他生育期更適用于水稻籽粒直鏈淀粉含量監測。

注:由上至下各行分別為孕穗期、抽穗期、灌漿期和成熟期,從左至右各列分別為DVI、EVI2、NDVI、RVI。
分析以上相關分析結果,得到4種植被指數在不同生育期的最佳參數結果如表3。

表3 植被指數最佳參數匯總
2.2.3 高光譜特征參數
計算表1中選擇的高光譜特征參數,并對其進行差值、歸一化處理,分析它們與水稻籽粒直鏈淀粉含量的相關性,得到結果如表4。
水稻籽粒直鏈淀粉含量是多生育期累積的結果,與多個生育期的光譜變量相關,開展基于不同生育期組合的籽粒直鏈淀粉含量預測,采用多元線性回歸方法構建預測模型,以確定最優生育期組合。基于多生育期組合的直鏈淀粉含量預測模型建模結果如表5。由表5可知,對于單一生育期直鏈淀粉預測模型而言,成熟期的模型精度明顯大于其他3個生育期,各生育期預測能力表現排序為成熟期、抽穗期、孕穗期、灌漿期。觀察4個生育期的模型可知,冠層光譜的一階導數變換值對模型的貢獻最大,孕穗期和抽穗期模型的主要參數都是導數形式的,而在灌漿期植被指數的RVI形式表現出了較高的敏感度,而冠層光譜的藍邊位置參數在成熟期模型中也表現出了較高的貢獻值。比較各模型精度,可得各生育期組合最佳模型分別為成熟期模型、抽穗-成熟期模型、孕穗-抽穗-成熟期模型及孕穗-抽穗-灌漿-成熟期模型(具體公式見表5)。
對上文得到的不同生育期組合的最佳預測模型進行評價,并采用完全獨立的驗證集合樣本數據對這些模型進行驗證,結果如表6。

表4 不同生育期光譜位置變量相關性分析
注:R為綠峰,R為紅谷,λ、λ為綠峰和紅谷的位置,λ、D、SDb為藍邊位置、幅值及面積,λ、D、SDy為黃邊位置、幅值及面積,λ、D、SDr為紅邊位置、幅值及面積。
Note:Ris green peak,Ris red valley, λ,λare the positions of green peak and red valley; λis blue edge position,Dis blue edge slope, SDbis blue edge area; λis yellow edge position,Dis yellow edge slope, SDyis yellow edge area ;λis red edge position , Dis red edge slope ,SDris red edge area.

表5 基于多生育期組合的直鏈淀粉含量預測模型
注:為水稻預測籽粒直鏈淀粉含量,′為波長為nm處的冠層光譜一階導數變換值,λ為藍邊位置。
Note:is the prediction of amylose content in rice grain,′is the first derivative transformation value of the canopy spectrum at the wavelength ofnm,λis the position of blue edge.

表6 模型評價與驗證
綜合上表可得,四生育期模型的建模2=0.709和驗證2=0.641,與三生育期最佳模型相比較,全生育期模型引入的灌漿期參數對模型建模精度和驗證精度的提升效果均不大,因而,選擇三生育期最佳模型為水稻籽粒直鏈淀粉含量預測的最佳模型,最佳生育期組合為孕穗期、抽穗期和成熟期。
參考光譜相關性分析結果可知冠層原光譜的敏感波段范圍主要集中于可見光區域和1 500~1 700 nm的紅外區域,而經一階導數變換等參數形式變換后這一范圍有所拉伸。各類型光譜參數中,原光譜的一階導數形式、植被指數中的DVI和RVI,在所選的4個生育期內始終表現出較高的相關性,其絕對值在0.52~0.67范圍內波動,尤以成熟期最佳。現有的直鏈淀粉監測模型所選參數也通常表現為這幾個形式,如仲曉春等[26]發現以RVI(783,634)為最佳參數可以較好地預測籽粒直鏈淀粉含量,其相關系數高達0.85;Yan等[1]以DVI(1 200,550)為最佳預測參數,且發現導數光譜在1 900 nm附近表現出極高敏感性,相關系數高達0.661。雖然由于不同研究所選擇的光譜層次(衛星、冠層、室內光譜等)和研究對象(稻谷、糙米、米粉等)存在差異,以及不同淀粉含量范圍的水稻種間差異等多重因素,導致了最終所選擇的最佳參數的波段組合和形式有所差異,但總體而言,現有模型還是主要以以上形式的參數為主,且波段選擇范圍一般都在近紅外及中遠紅外范圍內,極少出現以可見光區域參數為最佳參數的預測模型,近年來較為熱門的以PLS等算法建立得到的統計模型所選波段也基本都是近紅外模型[15,27-32]。由此可知,紅外光譜(尤其是近紅外光譜)較可見光而言,對直鏈淀粉含量預測具有更高的意義。
此外,分析特征參數的相關性,可知其各項指數在不同生育期中表現出不同的敏感性,但成熟期的相關性普遍高于其他生育期,且藍邊位置及黃邊相關各類參數均表現出了較高的敏感性。相關研究表明黃邊參數是植被葉綠素A與葉綠素B含量變動的一個敏感指標,葉綠素A和葉綠素B在各個生育期的含量與比例有所變化,且在成熟期兩者的消褪速度具有明顯區別,成熟期黃邊參數預測能力的增強可能與此相關[33];藍邊目前被認為與植被葉綠素含量相關,如易秋香等[34]發現玉米藍邊對葉綠素敏感度高,楊巧明等發現橡膠樹葉綠素的敏感波段主要在藍邊區域[35]。由特征參數部分分析可見,適用于水稻直鏈淀粉含量預測的參數大都也對葉綠素含量敏感,可能是葉綠素含量及其成分比例的變化與籽粒直鏈淀粉含量的累積可能存在某種關聯,或現有的通過高光譜參數監測直鏈淀粉含量的模型并非直接預測淀粉含量,而是在指示植株葉綠素變化情況,特別是谷穗葉綠素變化情況,來間接估測籽粒淀粉累積情況。
生育期選擇方面,本研究發現成熟期光譜是最適用于淀粉含量預測的時期,其次是抽穗期,各生育期對直鏈淀粉含量的預測能力并不是隨著淀粉累積和作物生長而增加的,而是呈現出先增后降再增的波浪形趨勢,分析其中緣由,可能是因為在抽穗期水稻莖葉生長已經由盛而衰,而稻穗從莖中抽出并迅速生長,完成了一個從無到有并快速累積的過程,稻穗的發育正是導致這一時期冠層光譜變化的主要因素之一,因而,筆者能夠通過抽穗期光譜較好地反演出稻穗生長情況,從而預測籽粒直鏈淀粉含量;而其前后的孕穗期及灌漿期,前者營養積累尚未完成,光譜變化主要受莖葉生長影響;后者在籽粒營養成分逐漸累積的同時,莖、葉逐漸變黃且質量減輕,葉綠素含量的降低與營養成分含量的快速變化,共同影響了冠層光譜,使得該時期光譜所包含的干擾信息增多,而使單純的籽粒淀粉累積信息難以表達;及至成熟期,莖、葉、穗質量與顏色的變化趨于穩定,植株莖葉枯黃,對光譜的影響降到最低,而成熟籽粒對光譜的貢獻達到最大,使得這一時期光譜能更為直接地反映出水稻籽粒生長狀況,因而成熟期光譜也較好地反映了籽粒淀粉含量信息,有助于模型建立。現有的直鏈淀粉相關研究,針對的多是糙米或是米粉的室內光譜,或多采用成熟期光譜,但也有部分對于其他生育期的探索,如謝曉金等[12]針對水稻開花期、灌漿期、蠟熟期建立了有關DVI(810,450)的直鏈淀粉預測模型,以探索最優生育期,發現在構建單因子回歸模型的情況下,開花期冠層冠層光譜優于灌漿期和蠟熟期,建模R為0.754,但對多生育期信息的利用并未過多探究。本文在此基礎上對多生育期信息進行綜合利用,并引入高光譜特征參數等更多參數,驗證并進一步探究各生育期光譜對構建直鏈淀粉預測模型的意義與作用。
多生育期組合所建立的預測模型無論是建模還是驗證,其精度都遠高于單生育期預測模型,可見多生育期信息的補充可提高預測模型精度,最佳生育期組合為三生育期,即孕穗期、抽穗期、成熟期。
該最優模型包含3個生育期,每個生育期保留一個參數,其中包含2個一階導數參數和一個特征參數,可見一階導數對籽粒直鏈淀粉含量的預測能力要強于原光譜和植被指數,是可用于直鏈淀粉預測的有效變量類型;相關研究表明1 200、1 540、1 580、1 690 nm均是淀粉吸收特征波段[5],而本文參數所選波長正處于淀粉吸收特征集中出現的區域,即1 649 nm(孕穗期)和1 610 nm(抽穗期),從一定程度上驗證了所選參數的可靠性;此外,二者出現的波長范圍極為接近,分析其自相關性,僅為?0.054 2,從而可排除自相關性的影響,由此可推測1 600~1 700 nm可能是水稻直鏈淀粉預測的敏感波段。特征參數在本文成熟期的相關模型中表現出了很強的解釋能力,特別是藍邊位置λ,但這一變量在其他相關研究的預測模型中卻少有出現,其在成熟期模型中具有較強預測能力的原理及穩定性還需進一步研究驗證。
目前,稻米品質的相關研究還面臨著一些困境,亟需更多的探索。首先,雖然高光譜預測模型的研究甚至應用都已有一定基礎,但其機理性探究還十分不足,由于淀粉、蛋白質等成分被包裹于谷粒之中且相互混雜,其光譜特性很難直接或較為明顯地反映于光譜之中,故而相關模型的建立大多源自經驗模型,而其機理方面的研究還較為匱乏,隨著理論和檢測技術的進一步發展,機理模型的探究必然成為未來谷物品質研究發展的重要環節。其次,大數據時代的來臨,為品質監測研究帶來了新的動力。近年來,結合大數據工具對傳統農學試驗數據進行數據挖掘的研究日益增多,合適的計算手段能顯著提高監測模型精度,對其實用性的提高有很大幫助。此外,衛星、無人機等多平臺監測的興起與蓬勃發展,給相關研究注入了新的活力,各個平臺都具有其難以替代的獨特優勢,未來的研究中,多源數據融合和多層次對照印證等研究手段也將對品質監測的發展起到不可忽視的推動作用。
本研究基于水稻孕穗期、抽穗期、灌漿期、成熟期的冠層光譜,建立了有關籽粒直鏈淀粉含量的多元回歸預測方程,并確定了適用于水稻直鏈淀粉含量監測的最佳時期,以及多生育期信息組合對預測方程精度和可靠性的影響,結果如下:
1)水稻籽粒直鏈淀粉含量與其冠層光譜的某些高光譜變量間存在較高相關性,參考用于預測模型的各類型參數,可知一階導數及DVI、RVI的估測效果較好,而高光譜特征參數在成熟期光譜中表現出了較強的預測能力。
2)可用于預測的最佳生育期為成熟期,各生育期預測能力表現排序為成熟期、抽穗期、孕穗期、灌漿期。
3)多生育期信息的組合對提高估測模型的精度和可靠性均有一定幫助,多生育期多元回歸模型優于單生育期預測模型。
4)以孕穗期、抽穗期、成熟期為生育期組合的三生育期模型是研究所得的最佳預測模型,建模決定系數(coefficient of determination,2)為0.708,均方根誤差(Root Mean Square Error,RMSE)為0.711%,平均絕對百分比誤差(Mean Absolute Percent Error, MAPE)為3.22%,驗證決定系數2為0.631,RMSE為0.768%,MAPE為3.99%。
[1] Yan Shibo, Wang Xiuzhen, Huang Jingfeng, et al. Study on the method and model of rice quality monitoring based on hyperspectral data[C]//Tianjin: 2016 5thInternational Conference on Agro-geoinformatics (Agro-geoinformatics). IEEE, 2016.
[2] 王炎欽. mRNA水平水稻品質相關基因的大規模鑒定及應用初探[D]. 杭州:浙江大學,2006.
Wang Yanqin. Primary Investigation in Rice Quality-related Genes Identification and Their Application in mRNA Level[D]. Hangzhou: Zhejiang University, 2006. (in Chinese with English abstract)
[3] 王惠貞,吳瑞芬,李丹. 稻米品質形成和調控機理概述[J].中國稻米,2016(1):10-13.
Wang Huizhen, Wu Ruifen, Li Dan. Review on rice quality formation and its regulation mechanism[J]. China Rice, 2016(1):10-13. (in Chinese with English abstract)
[4] Lu Lin, Zhu Zhiwei. Prediction model for eating property of Indica rice[J]. Journal of Food Quality, 2014, 37(4): 274-280.
[5] Curran P J. Remote sensing of foliar chemistry[J]. Remote Sensing of Environment,1989, 30(3): 271-278.
[6] 賀佳,劉冰峰,黎世民,等. 不同生育時期冬小麥籽粒蛋白質含量的高光譜遙感監測模型[J]. 中國生態農業學報,2017,25(6):865-875.
He Jia, Liu Bingfeng, Li Shimin, et al. Winter wheat grain protein content monitoring model driven by hyperspectral remote sensing images at different growth stages[J]. Chinese Journal of Eco-Agriculture, 2017, 25(6): 865-875. (in Chinese with English abstract)
[7] 王人潮,陳銘臻,蔣亨顯. 水稻遙感估產的農學機理研究:Ⅰ.不同氮素水平的水稻光譜特征及其敏感波段的選擇[J].浙江農業大學學報,1993(Supp.1):7-14.
Wang Renchao, Chen Minzhen, Jiang Hengxian. Studies on agronomic mechanism of the rice yield estimation by remote sensing: Ⅰ. The rice reflectance characteristics of different nitrogen levels and the selection of their sensitive bands[J]. Journal of Zhejiang Agricultural Universiry, 1993(Supp.1): 7-14 (in Chinese with English abstract)
[8] 程乾,黃敬峰,王人潮,等. MODIS植被指數與水稻葉面積指數及葉片葉綠素含量相關性研究[J]. 應用生態學報,2004,15(8):1363-1367.
Cheng Qian, Huang Jingfeng, Wang Renchao, et al. Correlation analysis of simulated MODIS vegetation indices and rice leaf area index and leaf chlorophyll content[J]. The Journal of Applied Ecology, 2004, 15(8): 1363-1367. (in Chinese with English abstract)
[9] 唐延林. 水稻高光譜特征及其生物理化參數模擬與估測模型研究[D]. 杭州:浙江大學,2004.
Tang Yanlin. Study on the Hyperspectral Characteristics and Simulating and Estimating Models about Biophysical and Biochemical Parameters of Rice[D]. Hangzhou: Zhejiang University, 2004. (in Chinese with English abstract)
[10] 劉芬,屈成,肖楠,等. 水稻高光譜變化特征與葉綠素含量監測研究[J]. 激光生物學報,2017,26(4):326-333.
Liu Fen, Qu Cheng, Xiao Nan, et al. A study on spectral characteristics and chlorophyll content in rice [J]. Acta Laser Biology Sinica, 2017, 26(4): 326-333. (in Chinese with English abstract)
[11] Huang Wenjiang, Song Xiaoyu, Lamb D W, et al. Estimation of winter wheat grain crude protein content from in situ reflectance and advanced spaceborne thermal emission and reflection radiometer image[J]. Journal of Applied Remote Sensing, 2008, 2(13): 1220-1230.
[12] 謝曉金,李秉柏,朱紅霞. 利用高光譜數據估測不同溫度脅迫下的水稻籽粒中粗蛋白和直鏈淀粉含量[J]. 農業現代化研究,2012,33(4):481-484.
Xie Xiaojin, Li Bingbai, Zhu Hongxia. Estimating contents of crude protein and amylose content in rice grain by hyper-spectral under different high temperature stress[J]. Research of Agricultural Modernization, 2012, 33(4): 481-484. (in Chinese with English abstract)
[13] 劉蕓,唐延林,黃敬峰,等. 利用高光譜數據估測水稻米粉中粗蛋白粗淀粉和直鏈淀粉含量[J]. 中國農業科學,2008,41(9):2617-2623.
Liu Yun, Tang Yanlin, Huang Jingfeng, et al . Contents of crude protein, crude starch and amylase in rice flour by hyperspectral data[J]. Scientia Agricultura Sinica, 2008, 41(9): 2617-2623. (in Chinese with English abstract)
[14] 李映雪. 基于冠層反射光譜的小麥氮素營養與籽粒品質監測[D]. 南京:南京農業大學,2005.
Li Yingxue. Monitoring Nitrogen Status Grain Quality with Canopy Reflectance Spectra in Wheat[D]. Nanjing: Nanjing Agricultural University, 2005. (in Chinese with English abstract)
[15] Sampaio P S, Soares A, Castanho A, et al. Optimization of rice amylose determination by NIR-spectroscopy using PLS chemometrics algorithms.[J]. Food Chemistry, 2018, 242(1): 196-204.
[16] 孫小香,王芳東,趙小敏,等. 基于冠層光譜和BP神經網絡的水稻葉片氮素濃度估算模型[J]. 中國農業資源與區劃,2019,40(3):35-44.
Sun Xiaoxiang, Wang Fangdong, Zhao Xiaomin, et al. The estimation models of rice leaf nitrogen concentration based on canopy spectrum and BP neural network[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2019, 40(3): 35-44. (in Chinese with English abstract)
[17] 王樹文,牛羽新,馬昕宇,等. 基于高光譜的抽穗期寒地水稻葉片氮素預測模型[J]. 農機化研究,2019,41(3):158-164.
Wang Shuwen, Niu Yuxin, Ma Xinyu, et al. Prediction model for nitrogen content of rice leaves during heading stage in cold region based on hyperspectrum[J]. Journal of Agricultural Mechanization Research, 2019, 41(3): 158-164. (in Chinese with English abstract)
[18] 王君嬋,譚昌偉,朱新開,等. 農作物品質遙感反演研究進展[J]. 遙感技術與應用,2012,27(1):15-22.
Wang Junchan, Tan Changwei, Zhu Xinkai, et al. Research progress of remote sensing inversing crop quality[J]. Remote Sensing Technology and Application , 2012, 27(1): 15-22. (in Chinese with English abstract)
[19] 馬廷臣,夏加發,王元壘,等. 抽穗揚花期高溫脅迫對水稻主要品質指標的影響[J]. 生物技術進展,2015,5(5):351-358.
Ma Tingchen, Xia Jiafa, Wang Yuanlei , et al. High temperature stress effect on main quality characters of rice in heading and flowering period[J]. Current Biotechnology, 2015, 5(5): 351-358. (in Chinese with English abstract)
[20] 彭波,龐瑞華,孫艷芳,等. 水稻種子淀粉合成及其調控研究進展[J]. 江西農業學報,2016,28(6):15-21.
Peng Bo, Pang Ruihua, Sun Yanfang, et al. Research progress in starch synthesis and its regulation in rice seeds[J]. Acta Agriculturae Jiangxi, 2016, 28(6): 15-21. (in Chinese with English abstract)
[21] 褚春燕,王錦冬,程遠,等. 孕穗-灌漿期低溫對三江平原主栽水稻品種品質的影響[J]. 中國農業氣象,2018,39(11):751-761.
Chu Chunyan, Wang Jindong, Cheng Yuan, et al. Effect of low temperature treatment in booting and filling stage on yield components and quality of main rice cultivars in Sanjiang plain[J]. Chinese Journal of Agrometeorology, 2018, 39(11): 751-761. (in Chinese with English abstract)
[22] Olivares Díaz E, Kawamura S, Matsuo M, et al. Combined analysis of near-infrared spectra, colour, and physicochemical information of brown rice to develop accurate calibration models for determining amylose content[J]. Food Chemistry, 2019, 286: 297-306.
[23] Lamb D W, Steyn-Ross M, Schaare P, et al. Estimating leaf nitrogen concentration in ryegrass () pasture using the chlorophyll red-edge: Theoretical modelling and experimental observations[J]. International Journal of Remote Sensing, 2002, 23(18): 3619-3648.
[24] 劉煒,常慶瑞,郭曼,等. 基于改進紅邊面積的夏玉米葉片氮素含量導數光譜監測[J]. 西北農林科技大學學報:自然科學版,2010,38(4):91-98.
Liu Wei, Chang Qingrui , Guo Man, et al. Monitoring of leaf nitrogen content in summer corn with first derivative of spectrum based on modified red edge[J]. Journal of Northwest A & F University: Natural Science Edition, 2010, 38(4): 91-98. (in Chinese with English abstract)
[25] 秦占飛,常慶瑞,申健,等. 引黃灌區水稻紅邊特征及SPAD高光譜預測模型[J]. 武漢大學學報:信息科學版,2016,41(9):1168-1175.
Qin Zhanfei, Chang Qingrui, Shen Jian, et al. Red edge characteristics and SPAD estimation model using hyperspectral data for rice in Ningxia irrigation zone[J]. Geomatics and Information Science of Wuhan University, 2016, 41(9): 1168-1175. (in Chinese with English abstract)
[26] 仲曉春,何理,陳瑩瑩,等. 基于高光譜的稻米品質估測模型的構建[J]. 揚州大學學報:農業與生命科學版,2012,33(2):34-38.
Zhong Xiaochun, He Li, Chen Yingying, et al. Constructing estimation models for rice quality on the basis of hyperspectra[J]. Journal of Yangzhou University: Agricultural and Life Science Edition, 2012, 33(2): 34-38. (in Chinese with English abstract)
[27] Bagchi T B, Sharma S, Chattopadhyay K. Development of NIRS models to predict protein and amylose content of brown rice and proximate compositions of rice bran[J]. Food Chemistry, 2016, 191: 21-27.
[28] 馮光,楊亞春,宋豐順,等. 近紅外反射技術建立合肥地區精米直鏈淀粉含量測定模型[J]. 核農學報,2012,26(6):942-946.
Feng Guang, Yang Yachun, Song Fengshun, et al. Establishment of near infrared reflectance spectroscopy model for amylose content of milled rice in Hefei[J]. Journal of Nuclear Agricultural Sciences, 2012, 26(6): 942-946. (in Chinese with English abstract)
[29] 吳晗,張力,韓笑,等. 玉米直鏈淀粉近紅外模型的建立[J]. 分子植物育種,2017,15(6):2286-2290.
Wu Han, Zhang Li, Han Xiao, et al. Establishment of near-infrared model of maize amylose starch[J]. Molecular Plant Breeding, 2017, 15(6): 2286-2290. (in Chinese with English abstract)
[30] Xie Lihong, Tang Shaoqing, Chen Neng, et al. Optimisation of near-infrared reflectance model in measuring protein and amylose content of rice flour[J]. Food Chemistry, 2014, 142: 92-100.
[31] Wu Jiaguan, Shi Chunhai. Prediction of grain weight, brown rice weight and amylose content in single rice grains using near-infrared reflectance spectroscopy[J]. Field Crops Research, 2003, 87(1): 13-21.
[32] Ibrahim S, Rahim H A. Prediction model for amylose content of Malaysian rice grains via visible-shortwave NIR spectroscopy[C]// Bandar Sunway: Systems, Process & Control. IEEE, 2015.
[33] 張垚. 基于PROSPECT-PLUS模型植物葉片多種色素高光譜定量遙感反演模型與機理研究[D]. 杭州:浙江大學,2015.
Zhang Yao. Hyperspectral Quantitative Remote Sensing Inversion Model and Regieme of Multiple Pigments at Leaf Scale Based on PROSPECT-PLUS Model[D]. Hangzhou: Zhejiang University, 2015. (in Chinese with English abstract)
[34] 易秋香,黃敬峰,王秀珍,等. 玉米葉綠素高光譜遙感估算模型研究[J]. 科技通報,2007,23(1):83-87,105.
Yi Qiuxiang, Huang Jingfeng, Wang Xiuzhen, et al. Hyperspectral remote sensing estimation models for chlorophyll concentration in corn[J]. Bulletin of Science and Technology, 2007, 23(1): 85-89, 105. (in Chinese with English abstract)
[35] 楊巧明,謝貴水. 基于高光譜的橡膠單葉葉綠素含量研究[J]. 熱帶農業工程,2011,35(2):9-14.
Yang Qiaoming, Xie Guishui. Correlation analysis between hyperspectral data and CHL.C of rubber leaves[J]. Tropical Agricultural Engineering, 2011, 35(2): 9-14. (in Chinese with English abstract)
Monitoring of amylose content in rice based on spectral variables at the multiple growth stages
Xie Lili1, Wang Fumin1,2※, Zhang Yao1,2, Huang Jingfeng2,3, Hu Jinghui1, Wang Feilong4, Yao Xiaoping1
(1.310058,;2.310058;3.310058; 4.310058,
Amylose content is one of the important indexes for evaluating rice quality. Large-scale and rapid monitoring of rice quality is of great significance for measuring rice commodity value and regulating food crop production. Because amylose is wrapped in rice grains and cannot be directly expressed in the canopy spectrum, the accuracy of its canopy prediction model is often low. Considering that the accumulation and growth of rice starch granules are the result of multiple growth stages and multiple factors, this study attempts to introduce multiple growth stages information to improve the model, while most existing studies only use single growth stage information. The research area was located in Deqing County, Zhejiang Province, China The experiment spanned two rice growing seasons from 2016 to 2017, with five nitrogen levels and three rice varieties. Correlation relationships between the original spectra and first derivative spectra of rice canopy at booting stage, heading stage, milking stage and maturity stage and the grain amylose content were analyzed, then four types of vegetation indices and 23 hyperspectral features for further correlation analysis were computed. According to results of correlation analysis, the suitable spectral variables with high correlation coefficient were selected for amylose content modeling by stepwise regression method. The prediction models were established for different single growth stages to obtain the best growth stage of amylose prediction. Then, by combining the information of different growth stages, the amylose content prediction models based on the combination of different growth stages were established, and the effect of comprehensive application of multiple growth stage information on the amylose content prediction model was analyzed to get the best prediction model and its growth stages combination. The results showed that the first derivative, Difference Vegetation Index (DVI), Ratio Vegetation Index (RVI ) and the hyperspectral features at maturity stage were highly sensitive to amylose content. The derivative of 1 649 nm and 1 610 nm showed a good explanation for amylose content, 1 600-1 700 nm might be the sensitive sepctral bands of rice amylose prediction. In addition, the characteristic parameters of maturity-stage spectrum showed a strong explanatory ability in the maturity-stage model of this study, especially the blue edge position (λ), but this variable rarely appeared in other related research prediction models, and its principle and stability with strong prediction ability in maturity-stage model need further study and verification. The results of single growth stage modeling showed that the accuracy of the maturity and heading stages models was significantly higher than that of booting and milking stages,the most suitable growth stage for predicting amylose content was maturity stage, with the modelingcoefficient of determination (2)=0.558, Root Mean Square Error (RMSE)=0.896%, Mean Absolute Percent Error (MAPE)=4.49%, and validation2=0.629, RMSE=0.864%, MAPE=4.59%. The comprehensive utilization of multi-growth stage information could significantly improve the prediction accuracy of the model, and the best multi-growth stage prediction model was the combination model of booting-heading-maturity stage, with the modeling2=0.708, RMSE=0.711%, MAPE=3.22%, and validation2=0.631, RMSE=0.768%, MAPE=3.99%, which proved that the model could accurately predict amylose content in grains.
remote sensing; models; multiple growth stages; amylose content; hyperspectral
謝莉莉,王福民,張垚,等. 基于多生育期光譜變量的水稻直鏈淀粉含量監測[J]. 農業工程學報,2020,36(8):165-173.doi:10.11975/j.issn.1002-6819.2020.08.020 http://www.tcsae.org
Xie Lili, Wang Fumin, Zhang Yao, et al. Monitoring of amylose content in rice based on spectral variables at the multiple growth stages[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(8): 165-173. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.08.020 http://www.tcsae.org
2020-01-10
2020-04-07
國家重點研發計劃(2016YFD0300601);國家自然科學基金(41871328)
謝莉莉,浙江寧波人。主要從事農業遙感模型方面的研究。Email:3130102999@zju.edu.cn
王福民,山東省高密人,副教授。主要從事無人機遙感、資源環境遙感模型方面的研究。Email:wfm@zju.edu.cn
10.11975/j.issn.1002-6819.2020.08.020
S511
A
1002-6819(2020)-08-0165-09