趙占輝,張叢志,張佳寶,吳運金,張宏敏,魯春陽
(1河南城建學院測繪與城市空間信息學院,河南平頂山 467036;2封丘農田生態系統國家試驗站/土壤與農業可持續發展國家重點實驗室/中國科學院南京土壤研究所,南京 210008;3生態環境部南京環境科學研究所,南京 210042)
葉綠素是高等植物和其他所有能進行光合作用的生物體含有的一類綠色色素,其含量高低能夠反映植物光合速率的強弱、氮利用效率、生理脅迫和生長狀況等信息[1-2]。當前農作物葉綠素含量測定主要采用分光光度法、活體葉綠素儀法和光譜法[3]。分光光度法通過化學方法提取葉片中的葉綠素,以此測定葉片葉綠素含量,測定結果穩定可靠,但提取速度較慢、易損壞植株葉面,容易影響農作物生長。根據工作原理不同,活體葉綠素儀法可分為透射型活體葉綠素儀法和反射型活體葉綠素儀法,通過測定紅光(650 nm)與紅外光(940 nm)被葉片吸收比率,測量植物的葉綠素相對含量,該方法是一種速測法,測定結果穩定可靠,不會對植被葉片造成破壞[4]。光譜法主要光譜信息技術進行建模分析,建立植物葉片葉綠素含量化學值與光譜數據之間的定量關系,間接獲取植物葉片葉綠素含量信息。
由于傳統的化學提取方法具有非常大的機械破壞性且不可恢復,其工作量巨大,無法進行大規模實時監測,活體葉綠素儀法雖能大大提高測量工作效率,但依舊受樣本數量限制,無法進行大面積的植物葉綠素含量變化實時監測。相反,隨著遙感技術快速發展,基于遙感數據的光譜分析法依靠少量樣本就能夠快速、無損的獲取大面積農作物葉綠素含量,對快速監測作物光合作用強弱、生長發育狀況等具有重要意義,關于農作物葉綠素含量與光譜關系的研究也已經成為近年來農業領域研究的熱點。
無人機搭載的高光譜儀具有光譜分辨率高、波段多、波段連續性強等優點,且能夠快速獲取納米級的光譜信息,利用該技術能直接對植被冠層微弱光譜進行定量分析,在農作物長勢監測方面表現出強大的優勢[2,5-6]。因此,根據作物冠層的光譜反射率與葉綠素含量建立反演模型,快速獲取空間尺度作物葉綠素含量分布特征,對評估作物光合作用強弱、生長發育狀況具有重要意義。早在20世紀Hinzman等[7]學者就已經提出利用作物冠層反射光譜監測作物葉綠素含量具有可行性,隨后,國內外學者[8-10]先后在實驗室利用高光譜數據對植物葉片葉綠素含量進行了估算,基本實現了作物葉片無損監測與葉綠素分布可視化。梁爽等[5]、鄭濤等[9]也通過篩選敏感波段,建立了葉綠素診斷模型,驗證了作物葉片葉綠素含量與光譜特征具有密切關系。肖武等[11]研究還發現玉米冠層葉綠素含量對紅邊波段的響應同樣敏感,以此為基礎建立葉綠素含量遙感反演模型,并應用于土地損毀監測與評價,估測精度達到了83.4%。
目前,由于所獲取的影像數據波段數量較少、光譜信息有限,而且光譜診斷波段及參數的范圍較窄,導致作物葉綠素含量高光譜反演模型估測精度普遍低于85%,難以滿足當前數字農業的需求,有待進一步深入研究更高精度的作物冠層高光譜估測模型。為此,本研究以中國科學院封丘農業生態實驗站長期定位氮肥梯度試驗田為研究對象,研究了玉米冠層光譜反射率與作物葉綠素含量之間的關系,建立了基于高光譜反射率的玉米冠層葉綠素含量反演模型,并對模型精度、可靠性進行了驗證分析,以期為推進高光譜遙感技術在農業中的應用提供數據支撐。
試驗區位于河南省封丘縣(35°01'N,114°24'E),在中國科學院封丘農田生態系統國家試驗站內進行,該試驗站地處黃淮海平原,屬于半干旱半濕潤季風氣候,多年平均降雨量為615 mm,且60%~90%分布在6—10月,年平均氣溫為13.9℃。定位試驗自2008 年一直延續至今,夏玉米品種為‘鄭單958’,共設7個氮肥水平:0、30、70、110、150、190、240 kg(N)hm2/a,磷肥按氮肥施入量的40%施入,不施鉀肥,玉米季磷肥作為基肥一次施入,氮肥肥分別在苗期、灌漿期各施入40%、60%。每個處理設置3次重復,共計21個小區,每個小區面積約28 m2,試驗當天在每個小區采集3 個樣本,共計63個樣本,其中前2次重復小區中42個樣本數據設為數據集Ⅰ,用于模型校正,第3次重復小區中21個樣本數據設為數據集Ⅱ,用于模型驗證(如圖1)。

圖1 基于高光譜數據合成的實驗區真彩色影像圖
無人機搭載的傳感器為Resonon PIKA L 高光譜成像儀,PIKA L 采用非凝視成像原理,拍攝方式為線掃式,光譜范圍為400~1000 nm,波段數200,光譜分辨率3 nm。無人機飛行高80 m,設定航速1 m/s。傳感器鏡頭焦距17 mm,視場角17.6°,鏡頭垂直向下,地面分辨率5 cm,航拍面積0.25 km2覆蓋整個研究區。
本研究以小型系統性試驗田為研究靶區,獲取的高光譜影像的預處理流程如下:(1)由于原始影像數據為信號DN值,無單位,需要通過輻射定標文件將原始影像轉換為輻射率圖像,本研究利用Spectronon Pro軟件將高光譜影像輻射亮度轉換成反射率數據;(2)在Spectronon Pro軟件中根據飛行高度、視場角等參數信息對高光譜影像進行粗校正;(3)基于差分GPS(Trimble GeoXH,美國天寶公司)獲得的地面靶標點坐標數據,利用ArcGIS 10.3軟件對高光譜影像進行手動精幾何校正;(4)最后,在Spectronon Pro軟件中對獲得的影像進行拼接,利用ENVI 5.1軟件裁切生成研究區高光譜影像。
根據葉綠素地面測量對應的樣點位置構建感興趣區域(region of interest,ROI),采集該樣點玉米葉片的光譜反射率,得到各樣點的反射率光譜數據。
為同步、快速、無損獲得玉米葉片葉綠素含量,采用JN-4N型葉綠素測定儀,測得葉片SPAD值。JN-4N型手持葉綠素儀2 個LED 光源發射2 種光,一種是紅光(峰波長650 nm),一種是紅外線(940 nm),2 種光穿透葉片,打到接收器上,光信號轉換成模擬信號,模擬信號被放大器放大,由模擬/數字轉換器轉換成數字信號,數字信號被微處理器處理后計算出SPAD 值。本研究在每個小區選取3個樣點,63個樣點,同步測得玉米葉片SPAD值。每個樣點的玉米選擇3片葉子測量,每片葉子不同部位測3個SPAD值,取平均值作為該片葉子的SPAD值,并記錄樣點位置。
過去研究發現,反射光譜在可見光及中遠紅外區域是診斷作物葉片葉綠素含量的敏感波段,葉綠素作物葉片的重要賦色成分,其含量高低對反射光譜產生一定影響[9,12-13],研究區不同葉綠素含量的光譜反射曲線形態特征基本一致(圖2)。在可見光波段400~650 nm 范圍內光譜曲線呈先上升后下降趨勢,650~760 nm范圍呈先下降后快速上升趨勢,具有明顯的反射峰和吸收谷;在近紅波段(760~900 nm)范圍趨于上升趨勢,且不同葉綠素含量的光譜反射率較為容易區分。由于原始光譜數據是離散的數據,本研究采用如下公式對光譜儀采集原始光譜數據進行一階微分計算[14]。選取夏玉米葉片光譜“三邊”特征的參數、反射峰與吸收帶位置、植被光譜指數等17個前人構建的高光譜特征參數(表1);以光譜特征參數為自變量利用回歸法建立葉綠素含量的估算模型[12,15]。將試驗獲得的數據集Ⅰ用于模型校正,數據集Ⅱ用于模型驗證。通過對比各模型的建模決定系數R2、極值(Max、Min)、極差(Range)、變異系數(Coefficient of Variation)、平均絕對誤差率(Mean Absolute Percentage Error,MAPE)和殘差均方根(Root Mean Squared Residual,RMSR)篩選出最優模型用以研究區春小麥的葉綠素含量的反演。R2用以估測模型的穩定程度,越接近于1 說明模型的穩定性越好,最大值(Max)、最小值(Min)、極差(Range)和變異系數(Coefficient of Variation,C.V.)能反映不同診斷模型對空間變異性的表達能力,平均絕對誤差率(Mean Absolute Percentage Error,MAPE)和殘差均方根(Root Mean Squared Residual)則從另一角度表征診斷模型的估測結果與“真值”的擬合程度,其計算公式如式(1)~(2)所示。

表1 反射光譜特征參數

式中,xi為采樣調查法土壤有機碳密度測定值,xi為土壤有機碳密度估測值,n為樣本數量。
本研究利用ENVI 5.1 軟件進行光譜數據讀取與波段運算,在SPSS 22.0 軟件中進行模型構建與檢驗,采用ArcGIS 10.3軟件制圖。
從高光譜影像中提取SPAD測樣點位置的平均反射光譜特征曲線,得到玉米葉片反射光譜對7 種不同SPAD 值水平的響應,并在玉米地臨近地塊獲取裸地的平均反射光譜特征曲線(圖2)。總體上,不同施氮水平下葉片光譜曲線形狀相似,可見光區域(400~700 nm)植物冠層的光譜反射率均較低,其光譜曲線存在一個反射峰和一個吸收谷,即550 nm左右區域的綠光與690 nm左右區域的紅光,該波長范圍內玉米葉片SPAD高值區的光譜反射率低于SPAD低值區。與可見光區域相比,近紅外區域光譜反射率大幅上升,特別是在690~750 nm之間的光譜反射率急劇上升,形成植被光譜的最重要特征——紅邊。不同SPAD值的玉米冠層葉片在750~900 nm之間的光譜反射率差異顯著,高量施氮處理冠層葉片光譜反射率顯著高于低量施氮處理。裸地光譜曲線隨波長增加均勻增加,符合該地物的典型特征,說明本文獲取的高光譜數據具有一定的可靠性。

圖2 玉米與裸地光譜特征曲線
本研究分別將數據集Ⅰ中42個訓練樣本SPAD(R)值進行了Log(R)、Log(1/R)、1/R、SQRT(R)、SQRT(1/R)5種數學變換,將17個光譜參數根據其特性劃分為4組,分別為反射曲線“三邊”斜率及其位置、葉綠素的反射峰與吸收帶位置、反射曲線“三邊”面積、光譜指數與葉綠素含量相關的植被指數。為了簡化模型參數,在建模前對各參數進行篩選,篩選出與SPAD值或其變換值關系緊密的的光譜參數作為診斷模型備選參數,具體為:根據相關系數大小,篩選出各組參數中與SPAD值變換前后相關性最大且達到顯著水平的備選參數,分別為λr、Rg、SDb和NDVI。備選光譜參數λr、Rg、SDb、NDVI與SPAD變換前后值相關系數變化范圍分別為:-0.89~0.79、-0.91~0.90、-0.84~0.84、-0.88~0.89,由Pearson相關矩陣圖(圖3)可以看出,變換前后的SPAD值變換后與備選光譜參數相關性系數均大于同組其他參數。因此,本研究中將變換前后的APAD 值作為因變量、備選光譜參數作為自變量,做進一步診斷模型建模分析。

圖3 玉米冠層SPAD值變換前后與光譜參數Pearson相關性分析矩陣圖
將變換前后的SPAD值與光譜參數回歸分析結果顯示(表2),備選光譜參數與變換前后的SPAD值擬合程度均達到了顯著性水平,視為該分析結果具有參考價值。Rg與變換前后的SPAD值回歸方程的R2最大,變化范圍為0.79~0.83,光譜參數SDb與NDVI的回歸方程次之,變化范圍分別為0.69~0.71、0.74~0.80,λr的R2最小,變化范圍為0.15~0.19。分析結果還顯示,與SPAD值相比,數學變換后的SPAD值與光譜參數回歸分析的R2值呈下降趨勢,MAPE值呈顯著上升趨勢,RMSR值無明顯變化。由此可見,通過一元回歸分析所建立的診斷模型預測能力隨參數變化而呈現顯著差異,最高可解釋因變量83%,最低不足20%,對SPAD進行數學變換并不能提升診斷模型預測能力,反而增加了預測結果誤差。因此,未進行數學變換的SPAD值與備選光譜參數所建立的一元回歸方程可認為是本研究中的精度較高的一類預測模型,本文將該預測模型統稱為“一元診斷模型”。

表2 玉米冠層SPAD值變換前后與光譜參數單變量線性回歸分析
為了進一步提升診斷模型預測能力,基于上述分析結果,本文將SPAD值作為因變量、4 個備選光譜參數作為自變量,采用逐步回歸方法做多變量回歸分析,以回歸分析方程的R2值最接近1 為原則,最終得出基于多變量的SPAD值最優預測模型,結果如表3 所示,診斷模型的R2值為0.93,MAPE、RMSR值分別為0.13、0.26。可見,與“一元診斷模型”相比,該模型的預測精度得到顯著提升,預測結果誤差也未出現明顯增加。因此,本文將基于光譜參數λr、Rg、SDb、NDVI的多元回歸方程作為最優預測模型,并將該預測模型定義為“多元診斷模型”。
為了檢驗診斷模型預測能力,本文利用數據集Ⅱ中的21個樣本數據驗證“一元診斷模型”和“多元診斷模型”的精度。基于“一元診斷模型”SPAD預測值與實測值的回歸分析結果如圖4 所示,擬合方程R2分別為0.6183、0.7345、0.2867、0.8945。盡管基于光譜參數NDVI的“一元診斷模型”的預測值與實測值達到較高的決定系數,但存在偏離1:1 等值線問題,從此說明“一元診斷模型”存在預測結果整體偏移現象,其預測極值能力依舊較弱。同理,圖5 為基于“多元診斷模型”預測結果與SPAD實測值的回歸分析結果,由此可以看出,該模型所預測的結果與實測值決定系數較高,R2為0.9285,擬合直線接近于1:1 等值線,由此證明該診斷模型對極值的預測能力較強。因此,基于光譜參數λr、Rg、SDb、NDVI的“多元診斷模型”為本研究所獲取的最優SPAD值預測模型,估測結果準確性較高。

圖4 基于“一元診斷模型”SPAD預測值與實測值的關系

圖5 基于“多元診斷模型”SPAD預測值與實測值的關系

表3“多元診斷模型”精度分析
綜合上述分析結果,利用ENVI+IDL 軟件平臺,使用“多元診斷模型”(表3)對試驗區高光譜影像進行填圖(圖6)。結果顯示,不同施肥處理SPAD值差異十分顯著,能清晰反映不同地塊SPAD值差異,影像上高值區呈條帶狀分布。這是由于玉米正值拔節期,部分地塊玉米葉片不能完全覆蓋地面,從而導致玉米行間存在裸露土壤,診斷模型僅對玉米冠層葉片SPAD值估測有效,玉米間空隙區域因而SPAD估測值較低,故而玉米行間顏色多為紅、黃色圖斑,表示該區域SPAD較低。在高量施氮處理(F7)地塊,由于氮肥充足,玉米枝葉比較繁茂,完全覆蓋行間土壤,因而影像中條帶狀特征圖斑消失。玉米試驗田臨近裸地區域多為紅、黃色圖斑,僅存在少量藍色圖斑,這是由于裸地區域存在少量雜草,其葉片中的葉綠素引起預測模型響應,該結果也間接證明了該多元診斷模型對植物葉片葉綠素具有一定的敏感性。

圖6 基于多元診斷模型玉米冠層葉片SPAD值反演圖
本研究以中國科學院封丘農業生態實驗站長期定位試驗的夏玉米為研究靶區,利用42 個玉米冠層SPAD值為訓練樣本,采用回歸分析方法,對高光譜反射率數據進行反演分析。得出以下結論。
(1)對選定的17 個光譜參數涵蓋了400~900 nm波段范圍內光譜反射率曲線特征、曲線面積及植被指數等信息,采用相關性分析方法,從同一類型光譜參數中遴選與數學變換前后SPAD值關系最緊密的參數作為建模參數。光譜參數λr、Rg、SDb、NDVI分別與SPAD原始值具有較高的決定系數,分別為0.19、0.83、0.71、0.80,所構建的“多元診斷模型”在預測精度、結果穩定性等方面均得到明顯提升,在高光譜或多光譜遙感監測方面具有一定的應用潛力。
(2)本文采用的參數篩選與回歸分析建模方法獲取了精度較高的玉米冠層葉綠素含量高光譜預測模型,并通過獨立樣本對預測模型精度進行驗證分析,其預測精度與可靠性較前人研究具有一定的提升。本研究論證了回歸分析建模方法在高光譜遙感在作物冠層葉綠素含量估測分析的可行性,“多元診斷模型”的決定系數高達0.93,同時揭示了光譜參數λr、Rg、SDb、NDVI能夠較全面的反演作物冠層葉綠素空間分布特征。
玉米拔節期是整個生育期的關鍵時期,該時期植株莖葉生長快速快,光合作用強度大,葉綠素作為重要光合色素,其含量高低可直接決定植株光合效率并進一步影響光合產量[16]。過去學者研究認為,通過監測植株葉綠素含量變化能診斷出該時期作物生長健康狀況,已經成為制定農田管理措施的重要參考依據[17]。研究還表明,葉綠素含量高低對可見光波段的光譜反射率具有重要影響,其顯著差異主要表現在500~600 nm波段上,葉綠素能吸收大部分的紅光和紫光但反射綠光[18]。基于葉綠素對特定波長光譜吸收和反射等特性的認識,國內外已經開展了大量關于作物葉綠素光譜學診斷研究,如Coste 等[19]利用650 nm 和940 nm 處的透射光的相對比值來計算葉綠素含量指標。湯旭光等[20]基于可見、近紅外反射光譜反射率估算了作物葉片葉綠素含量,并建立了反演模型。本研究借助長期定位梯度施肥試驗平臺,構建出夏玉米冠層葉片SPAD值梯度變化特征,玉米拔節期冠層光譜反射率變化表現為:在可見光區域呈現先增加后降低,最后快速上升,在400~725 nm 波段范圍內SPAD值越高對光譜吸收能力越強,呈低反射率特征,相反,725~900 nm近紅外波段SPAD值越高光譜反射率越高。這些光譜特征與植物葉片葉綠素的特征密切相關,葉綠素是一種能吸收光能含脂的色素物質,將吸收的紅光和藍紫光能量轉換成化學能,而不能吸收綠光光能,因而SPAD值越高光譜反射率越低,在550 nm 左右波段呈現反射峰[21]。由于色素和纖維素在近紅外波段的吸收較低,光線在葉片細胞結構經過多次散射致使接近50%的光線被反射,當植株營養狀況較好時葉片內葉綠素含量高、細胞層較多、葉肉與細胞間空隙較厚能進一步增加光譜反射率,最終表現為SPAD值越高,725~900 nm波段光譜反射率越高[22]。根據上述光譜特征能清晰區分不同SPAD值對應光譜特征曲線(圖2),為進一步構建玉米冠層葉片SPAD值診斷模型提供了可靠的數據基礎。
以光譜特征曲線為依據,本研究將“三邊”特征參數與植被指數作為構建診斷模型的候選參數,采用微分光譜的方法,對原始光譜做一階微分,用來表征“三邊”極值、位置、面積等特征信息。微分光譜具有與SPAD值相關性高、獨立于土壤背景及減弱或消除測量誤差干擾等優點,如茹克亞·薩吾提等[23]對原始光譜的數據進行微分預處理后,通過0.01水平顯著性檢驗的波段數量明顯增加,并且指數微分處理能夠增加葉綠素估算精度。袁杰等[24]研究也認為一階微分光譜數值可以較好的反演作物生長信息和葉綠素密度等信息。本研究以長期定位試驗田為研究靶區,為簡化模型參數,有效消除同類型參數同時參數模型構建所帶來的數據冗余,將獲取的微分光譜數值和植被指數等17個光譜參數根據其特性劃分為四類。采用相關性分析方法,根據光譜參數與葉綠素值相關系數大小遴選的4個構建診斷模型的光譜參數,首先將單個光譜參數與數學變換前后的SPAD值構建一元回歸預測方程,與已有研究結果不同[23],本研究發現數學變換后的SPAD值與光譜參數間的擬合度并未得到明顯提高。因此,將SPAD原始數值與λr、Rg、SDb、NDVI的回歸方程作為優選的“一元診斷模型”,并進一步構建“多元診斷模型”。通過對比決定系數R2大小,“一元診斷模型”預測能力低于“多元診斷模型”,驗證樣本對這兩種模型驗證結果更進一步印證了“多元診斷模型”的可靠性,其預測結果與實測結果決定系數R2達到0.9285,擬合直線斜率為1.0132。與前人研究結果相比,本研究中構建的“多元診斷模型”預測精度得到明顯提升,因此,本研究推薦基于光譜參數λr、Rg、SDb、NDVI的“多元診斷模型”為SPAD值最優高光譜診斷模型。
本研究利用高光譜400~900 nm 波段診斷玉米冠層SPAD值變化,其結果與前人研究具有一致性,但該診斷模型決定系數有一定提高,光譜參數數量更少,模型結構更加簡單[12-13]。“多元診斷模型”包含的光譜參數綜合考慮了光譜反射曲線特征、曲線面積及植被指數等信息,能夠完整反映整個光譜波段范圍(400~900 nm)內高光譜信息,并有效規避了因同類型光譜參數攜帶類似信息所造成的數據冗余,提高模型診斷能力的同時簡化了模型參數,在高光譜或多光譜遙感監測中具有一定的應用潛力。然而,由于驗證樣品數量有限,本研究所建立的SPAD高光譜診斷模型可靠性及普適性仍需進一步驗證。