王海峰,張智韜※,Arnon Karnieli,陳俊英,韓文霆
?
基于灰度關聯-嶺回歸的荒漠土壤有機質含量高光譜估算
王海峰1,2,張智韜1,2※,Arnon Karnieli3,陳俊英1,2,韓文霆2
(1. 西北農林科技大學水利與建筑工程學院,旱區農業水土工程教育部重點實驗室,楊凌 712100;2. 西北農林科技大學 中國旱區節水農業研究院,楊凌 712100;3. 本古里安大學Blaustein沙漠研究所,思德博克 84990)
為改善高光譜技術對荒漠土壤有機質的估測效果,該文采集了以色列Seder Boker地區的荒漠土壤,經預處理、理化分析后將土樣分為砂質土和黏壤土2類,再通過光譜采集、處理得到6種光譜指標:反射率(reflectivity, REF)、倒數之對數變換(inverse-log reflectance,LR)、去包絡線處理(continuum removal,CR)、標準正態變量變換(standard normal variable reflectance,SNV)、一階微分變換(first order differential reflectance,FDR)和二階微分變換(second order differential reflectance,SDR)。通過灰度關聯(gray correlation,GC)法確定SNV、FDR、SDR為敏感光譜指標,采用偏最小二乘回歸(partial least squares regression,PLSR)法和嶺回歸(ridge regression,RR)法,構建基于敏感光譜指標的土壤有機質高光譜反演模型,并對模型精度進行比較。結果表明:砂質土有機質含量的反演效果要優于黏壤土;基于SNV指標建立的模型決定系數2和相對分析誤差RPD均為最高、均方根誤差RMSE最低,所以SNV是土壤有機質的最佳光譜反演指標;對SNV-PLSR模型和SNV-RR模型綜合比較得出,SNV-RR模型僅用全譜4%左右的波段建模,實現了更為理想的反演效果:其中,對砂質土有機質的預測能力極強(R2為0.866,RMSE為0.610 g/kg、RPD為2.72),對黏壤土有機質的預測能力很好(R2為0.863,RMSE為0.898 g/kg、RPD為2.37)。荒漠土壤有機質GC-SNV-RR反演模型的建立為高光譜模型的優化、土壤有機質的快速測定提供了一種新的途徑。
遙感;模型;有機質;荒漠土壤;高光譜;灰度關聯;嶺回歸
土壤有機質含量是評估土壤肥力,檢驗土壤退化程度的重要指標之一[1]。土壤荒漠化進程易造成土壤生產力的嚴重衰退,實現有機質含量的準確估測對研究土壤荒漠化進程具有重要的現實意義。近年來,具有分辨率高、信息量大等特點的高光譜技術,已逐漸成為獲取土壤有機質含量的一種重要手段[2-4]。
國內外學者在利用高光譜技術反演土壤有機質含量方面已開展了大量的工作:Hummel等[5]利用近紅外光譜建立了美國玉米種植帶土壤有機質的逐步回歸模型,預測標準誤差為0.62%;Rinnan等[6]利用近紅外和熒光光譜技術,結合偏最小二乘回歸(partial least squares regression,PLSR)法對北極土壤有機質做了有效的分析預測;Ji等[7]基于中國土壤光譜庫,利用局部加權回歸較好地預測了225個獨立于光譜庫的土樣有機質含量;Xiao等[8]基于歸一化差異植被指數(normalized difference vegetation index,NDVI)建立的西北鹽堿土有機質反演模型效果最佳(相關系數為0.67),且敏感波長分布于352~1 144 nm;朱登勝等[9]對光譜吸光度進行一階微分變化后,建立有機質含量偏最小二乘回歸(partial least squares regression,PLSR)模型,預測相關系數達0.82;張娟娟等[10]對北方潮土和水稻土的一階微分光譜建立了多元逐步回歸模型,預測決定系數R2均在0.79以上;何東健等[11]用連續投影算法篩選出塿土近紅外區間(900~1 700 nm)1.75%的波段建模,發現神經網絡模型對有機質含量的預測效果最佳;葉勤等[12]對不同的光譜變換指標與有機質含量作相關性分析和主成分分析后建立不同的反演模型,比較后發現主成分分析結合BP神經網絡建立的模型反演效果最佳。但是這些研究大都以有機質含量較高或很高的土壤為研究對象,并未考慮有機質含量水平較低時的光譜反演效果,不能完全應用于干旱地區的荒漠土壤。
已有的研究表明,當土壤肥力較低(有機質含量低于2%)時,土壤水分、鹽分、礦物組份等因素對吸收光譜的影響作用較強[13-15],在反演有機質過程中,存在光譜響應較弱,模型精度較低等問題,這也對低有機質含量土壤敏感波段的確定造成了一定的困難。目前該方面的研究很少,侯艷軍等[16]以新疆準噶爾盆地東部荒漠化土壤為研究對象(最高有機質含量為16.09 g/kg),研究得出一階微分光譜PLSR模型的決定系數2可達0.78,說明高光譜技術對荒漠土壤有機質的反演具有一定的可行性。因此,很有必要進一步探索提高模型精度的方法。
灰度關聯(gray correlation, GC)法是通過關聯度的計算與比較來辨別系統中各因素間的主次關系[17],應用于光譜分析中可以較好地識別敏感光譜指標[18]、篩選敏感波段[19]、優化反演模型[20-21]。嶺回歸(ridge regression, RR)法作為一種改進的最小二乘法,在病態數據處理[22]及特征信息提取[23]方面有較好的效果,也是一種新的光譜定量分析方法[24],可簡化模型、提高模型的魯棒性[25]。雖然目前國內外單獨應用GC法或RR法在光譜分析領域已取得一定的成果,但2種方法的聯合使用效果如何還未見報道,尤其是在荒漠土壤有機質高光譜估測方面,缺乏GC-RR高光譜反演模型的探討。
本文對荒漠土壤進行化驗分析和室內光譜測量,在考慮土壤質地對模型精度影響的基礎上將試驗土樣分成砂質土和黏壤土2類,并對原始光譜作預處理及不同數學變換。嘗試利用灰度關聯法結合嶺回歸法來分析變換光譜與有機質含量的關系,確定土壤在低有機質含量條件下的最佳光譜反演指標及光譜敏感區,建立針對荒漠土壤有機質含量的GC-RR估測模型,以期為荒漠土壤有機質含量的定量遙感估算提供支撐。
研究區位于以色列南部的Seder Boker地區(34°47¢E,30°52¢N,海拔640 m),該地區為亞熱帶半干旱氣候,夏季炎熱干旱,冬季溫暖濕潤,年降水量介于100~200 mm之間,年均蒸發量達2 500 mm。土壤類型主要有砂質土和黏壤土2類,大部分為荒漠土壤且有機質含量較低(介于0.5~18 g/kg之間)[26]。以色列與中國西北地區均面臨著嚴重的土地荒漠化問題,但以色列擁有世界最發達的精準農業技術水平[27]:通過一系列相關措施,不僅提高了干旱土地的自然生產能力,而且在未損害土壤生產能力的基礎上,阻止了土地荒漠化,其發達的精準農業技術值得中國借鑒學習。
采用十字法取樣,采集以色列Seder Boker地區耕層(0~20 cm)土樣134份。樣點的分布充分考慮了研究區的不同土壤類型和荒漠化程度,同時也考慮了樣點分布的均勻性。在實驗室經風干、磨細、過篩(2 mm)處理后,每個樣品分為2份,一份用于光譜測試,另一份用于理化性質分析。
使用激光粒度儀測得土樣機械組成,計算不同土壤顆粒占總體體積的百分比,根據國際土壤顆粒分類標準[28]將134個土樣劃分為78個砂質土樣本、56個黏壤土樣本。采用重鉻酸鉀—外加熱法測定各土壤樣本的有機質含量[28]。選用Kennard-Stone(K-S)算法[29]對各土壤樣本有機質含量間歐式距離進行計算并分集:砂質土建模集樣本52個、驗證集樣本26個;黏壤土建模集樣本37個、驗證集樣本19個。各樣本的特征描述見表1,砂質土樣本有機質含量水平較低,其有機質含量水平低于黏壤土,而2種土壤不同樣本分集的有機質含量變異系數CV均介于10%~100%之間,表現為中等強度變異。

表1 土壤有機質含量描述性統計特征
將用于光譜測試的土樣置于直徑10 cm、深度2 cm的黑色盛樣皿中,裝滿后用直尺將土壤表面刮平。用ASD FieldSpec 3地物光譜儀采集每個土壤樣品的高光譜反射率數據,波譜范圍為350~2 500 nm,采樣間隔為1.4 nm(350~1 000 nm)和2 nm(1 000~2 500 nm),重采樣間隔為1 nm。為減少外界因素的干擾,光譜測量在暗室中進行:光源為50 W的鹵素燈,光纖探頭視場角為5°,光源到土壤表面的距離、光源入射角度和探頭距土壤表面高度,設置為洪永勝等[30]研究得出的室內土壤高光譜測試最佳幾何參數組合(50 cm、30°、15 cm),來獲取“信噪比”更高的光譜信息。每次測定光譜前均已完成暗電流去除和白板定標等過程,每個土樣進行4個方向上(轉動3次,每次90°)的測量,每個方向保存5條光譜曲線,共20條,在ViewSpec Pro V6.0.11軟件中作算術平均處理后作為實際光譜反射值,并使用Splice Correction功能修正光譜曲線在1 000 nm和1 800 nm處的階躍[8]。
為盡可能消除土壤光譜測試過程中,由于外界環境、儀器自身、雜散光等因素干擾所引起的曲線“毛刺”現象,在Unscrambler X10.4軟件中,使用Savitzky-Golay濾波法(多項式階數為2)進行平滑處理[31],并剔除每個土樣光譜噪聲較大的邊緣波段350~399 nm和2 401~2 500 nm。在去除高光譜冗余信息,兼顧光譜曲線平滑與特征[16]的基礎上,對400~2 400 nm光譜數據作10 nm間隔的重采樣處理后獲得由200個波段數組成的光譜曲線。由于土壤反射光譜在1 400 nm、1 900 nm和2 200 nm附近存在3個水分吸收谷,光譜波動較大且對試驗研究有一定影響。為盡可能減弱土壤水分對有機質反演的影響,作水汽吸收帶的剔除處理[8]。
為提高光譜的靈敏度,更有效地分析土壤光譜與有機質含量之間的關系,在土壤光譜反射率(reflectivity,REF)的基礎上,計算其標準正態變量變換(standard normal variable reflectance,SNV)光譜[8]、倒數之對數變換(inverse-log reflectance,LR)光譜[13]、一階微分變換(first order differential reflectance,FDR)光譜[12]、二階微分變換(second order differential reflectance,SDR)光譜[16]和去包絡線處理(continuum removal,CR)光譜[24],對這6種光譜指標作后續的分析建模處理。


其中,
由于灰色關聯度的大小會受到樣本數量的影響[17],而本研究中2種試驗土樣的數量不同(砂質土為78個,黏壤土為56個),故從樣本數較多的砂質土樣中隨機抽取56個樣本來計算灰色關聯度,使2種土壤有機質與光譜指標計算出的灰色關聯度有可比性。同時,采用灰度關聯分析中常用的“均值化”數據預處理方法,來消減光譜數據與有機質含量間因量綱不一致而造成的分析誤差。
嶺回歸法是[32]針對復共線性數據分析而提出的有偏估計方法,以損失最小二乘回歸方程的部分精度為代價,獲得對病態數據具有較強耐受性的回歸方程,可較好解決高光譜數據的共線性問題[33]。在嶺回歸方程建立的過程中,對嶺參數值的選擇和根據嶺跡圖進行變量的篩選非常重要。
選擇嶺參數值的原則[24]:1)各回歸系數的嶺估計基本穩定;2)由嶺回歸法計算得到的各自變量符號更有實際意義;3)回歸系數沒有不合乎經濟意義的絕對值;4)殘差平方和增加不太多。嶺回歸法篩選自變量原則:1)剔除掉標準化嶺回歸系數比較穩定且絕對值很小的自變量;2)剔除標準化嶺回歸系數不穩定,但隨著的增加振動趨于零的自變量;3)剔除標準化嶺回歸系數很不穩定的自變量;4)根據去掉波長后重新進行嶺回歸分析的結果,去掉一個或若干個回歸系數不穩定的自變量。
本文采用了2種回歸方法:PLSR法和RR法來建立高光譜對土壤有機質含量的診斷模型。其中,PLSR法在高光譜模型中得到了廣泛的研究與應用[34-36],可較好地解決自變量之間存在的共線性問題。RR法作為一種專門用于共線性數據分析的有偏估計方法,實際上是一種改良的最小二乘法,通過放棄最小二乘的無偏性和部分精度來獲得效果稍差但穩定性更好的回歸模型,兼具“抗共線性”和自變量篩選的作用[37-38]。
通過建模決定系數R2、驗證決定系數R2、均方根誤差(root mean squared error,RMSE)和相對分析誤差(relative percent deviation,RPD)來綜合評價模型的效果[24]。其中,當0.66≤2≤0.80時,模型擬合效果較好,當0.81≤2≤0.90時,模型擬合結果很好,當2≥0.90時,模型擬合效果極好。而RMSE越接近于0,表征模型的預測精度越高,預測能力越強。當RPD在2.5以上時,表明模型具有極強的預測能力;當RPD在2.0~2.5之間時,表明模型具有很好的定量預測能力;當RPD在1.8~2.0之間時,表明模型具有定量預測能力;當RPD在1.4~1.8之間時,表明模型具有一般的定量預測能力;當RPD在1.0~1.4之間時,表明模型只有區別高值和低值的能力;當RPD小于1.0時,表明模型不具備預測能力[39]。PLSR模型和RR模型的建立與預測在Matlab R2016b軟件中完成。
圖1是砂質土和黏壤土在有機質含量3.3 g/kg和7.2 g/kg條件下的光譜曲線,可以看出:黏壤土光譜曲線整體表現較為“平緩”、砂質土光譜曲線較為“陡峭”;在相同土壤類型的情況下,較高有機質含量的土壤光譜反射率低于較低有機質含量的土壤;在相同土壤有機質含量的情況下,砂質土反射率明顯高于黏壤土。

圖1 具有相同有機質含量的2種類型土壤反射率
圖2a、2b分別是基于砂質土與黏壤土的原始光譜,在經過預處理等步驟提取的REF、SNV、LR、FDR、SDR和CR 6種光譜指標與有機質含量的灰色關聯度統計。可以看出,2種土壤有機質含量與不同光譜指標的灰度關聯圖形態相似,且砂質土灰色關聯度總體較高。為實現波段篩選,設敏感波段的GCD閾值為0.90。其中REF、LR、CR 3種光譜指標與有機質含量的灰色關聯度較低,在全光譜波段范圍內介于0.25~0.50之間(小于0.90),所以這3種指標不是敏感光譜指標,在后續分析中不作考慮。SNV與有機質含量的灰色關聯度變化較為平緩,且總體呈現出“平緩增大、急劇下降、急劇上升、平穩過渡”的變化規律。砂質土壤SNV指標下的GCD在400~1 000 nm和1 130 nm~2 400 nm的波段區間內均大于0.90,故該區間為敏感波段區間。黏壤土SNV指標下的GCD在400~870 nm、1 100~1 840 nm、1 970~2 280 nm、2 320~2 330 nm這幾個波段區間大于0.90,敏感波段的數量要少于砂質土壤的敏感波段數。SNV處理在一定程度上消除了土壤固體顆粒大小、表面散射及光程變化對光譜的影響[39],提高了光譜與有機質含量間的GCD。2種土壤FDR、SDR指標下的灰色關聯度較高(大部分在0.90以上),且呈現出波動較大的現象,表明光譜微分處理可在一定程度上消除背景噪聲的影響,提高分辨率和靈敏度,豐富圖譜信息。

注:REF為光譜反射率;LR為倒數之對數變換反射率;CR為去包絡線處理反射率;SNV為標準正態變量變換反射率;FDR為一階微分變換反射率;SDR為二階微分變換反射率。下同。
為進一步辨識基于灰度關聯分析的土壤敏感波段情況,作土壤各光譜指標與有機質含量的灰色關聯度統計表(見表2)。其中砂質土SNV、FDR、SDR 3種光譜指標下的敏感波段數均大于黏壤土的敏感波段數。砂質土SNV指標下的最大GCD為0.958,略大于黏壤土SNV指標下的GCD(0.957)。而2種土壤FDR、SDR指標下的敏感波段數量均接近或大于150,且最大GCD均在0.97以上,表明對土壤原始光譜進行微分處理后可以較大提高光譜與有機質含量間的GCD。

表2 土壤各光譜指標與有機質含量的灰色關聯度統計
將經過灰色關聯度閾值篩選后得到的SNV、FDR和SDR 3種光譜指標作為PLSR分析的自變量,以土壤有機質含量為因變量建立PLSR模型,建模及驗證結果如表3所示。

表3 土壤有機質含量的PLSR模型
注:R2為建模決定系數;R2為驗證決定系數;RMSE為均方根誤差;RPD為相對分析誤差。下同。
Note:R2is determination coefficient of calibration sets;R2is determination coefficient of validation sets; RMSE is root mean squared error; RPD is relative percent deviation. The same below.
結果顯示,基于3種土壤光譜指標建立的有機質含量PLSR模型中,除黏壤土SDR-PLSR模型外,建模集的R2均在0.85以上,驗證集的R2均在0.83以上,表明模型在擬合和預測方面均具有很好的效果。同時,R2/R2接近于100%也說明模型具有較強的“魯棒性”。其中,基于SNV指標建立的PLSR模型,對2種土壤有機質含量的反演效果均為最佳:砂質土的R2和R2分別為0.974和0.880,RMSE為0.692 g/kg,RPD為2.79(在2.5以上),表征模型具有極強的預測能力;黏壤土的R2和R2分別為0.865和0.874,RMSE為0.882 g/kg,RPD為2.29(介于2.0~2.5之間),表征模型具有很好的預測能力。對2種土壤PLSR模型的估測結果比較得出,在相同光譜指標構建模型的條件下,砂質土有機質含量的反演精度要高于黏壤土。
將SNV、FDR、SDR 3種光譜指標作為自變量,土壤有機質含量為因變量,根據值選擇原則和波長選擇原則[23],確定嶺參數和最優建模波段區間,建立SNV-RR、FDR-RR、SDR-RR 3種嶺回歸模型(見表4)并比較分析。

表4 土壤有機質含量的嶺回歸模型
從表4來看,基于不同光譜指標(SNV、FDR、SDR)所建立的RR模型中,嶺參數的取值范圍浮動很大(=0.000 02~0.4),而篩選出的2種土壤最優建模波段區間數近似相同(分別為7和8)。通過對幾種模型的建模和驗證效果進行比較后發現,基于2種土壤光譜指標SNV所建立的RR模型R2、R2、RPD均為最高,RMSE均為最低,所以標準正態變量變換SNV指標在RR模型中為最優光譜指標。在根據嶺跡圖篩選敏感波段區間方面,基于SNV指標的敏感區間最為集中,FDR次之、SDR最為分散。總體來看,砂質土有機質的響應波段集中于820~860 nm和940~970 nm 2個近紅外區間附近,而黏壤土集中于730~790 nm和800~820 nm區間附近。敏感波段區間的不同,說明不同土壤粒徑會對有機質敏感波段區間的位置產生一定的影響,這與土壤顆粒結構和黏粒化學特性對光譜吸收、反射等過程的影響有關[39]:表觀上看,呈現出黏粒含量越高,土壤持水能力越強,反射率降低的現象。而較小的黏粒又會使得彼此結合更緊密,土壤表面也會越光滑,反射率也會越高,所以土壤質地會對光譜反射率產生較復雜的影響作用。在本研究中,2種荒漠土壤質地的不同也在一定程度上造成了有機質敏感波段區間的一些差異。
將基于SNV指標的RR模型與PLSR模型進行比較:SNV-RR模型用到的自變量波段區間僅7~8個,約為全波段區間數(200個)的4%,實現了波段的優選。在模型效果方面,砂質土有機質SNV-RR模型的建模決定系數R2為0.887,驗證決定系數R2為0.866,介于0.81~0.90之間,具有很好的模型擬合效果。而在預測方面,SNV-RR模型具有更高的精度(RMSE為0.610,小于SNV-PLSR的0.692),RPD為2.72(大于2.5,具有極強的預測能力);黏壤土有機質SNV-RR模型的建模決定系數R2為0.889,驗證決定系數R2為0.863、RMSE為0.898,與SNV-PLSR模型的RMSE近似相等。但RPD為2.37,高于SNV-PLSR模型的2.29,表征模型具有很好的定量預測能力。由SNV指標建立的SNV-RR模型中,砂質土和黏壤土的R2/R2分別為0.976 2和0.970 6,均接近于1,所以模型具有較強的“魯棒性”;在SNV-PLSR模型中,R2/R2分別為0.903 0和1.009 9,模型呈現出“魯棒性”較差和“欠擬合”的效果。總體分析得出,在建模波段較少的基礎上,RR模型不僅保證了較高的建模精度,同時在“魯棒性”和預測效果方面比PLSR模型效果更優。因此,RR模型在實際應用方面具有更好的適用性。
土壤反射光譜是土壤所含有機質、水分、礦物、粒徑等理化性質的綜合響應,這意味著一條光譜曲線中包含有土壤多種成分的信息[40]。當某一成分的含量越低時,光譜響應能力越弱,越容易受到其他組分的影響,尤其是水分含量的變化對土壤光譜有很強的作用[41]。本文對土樣做了風干及剔除土壤水分吸收帶的處理,以盡可能消除水分對有機質光譜表征的影響[42]。在土壤有機質敏感波段的研究方面,紀文君等[43]在比較分析7個不同地區不同土壤樣品后發現,不同類型土壤有機質的敏感波段集中在600~800 nm區間;Wang等[36]在使用分數階微分變換光譜反演新疆艾比湖流域的土壤有機質時,發現600~900 nm處的光譜響應能力最強;尚璇等[42]在研究土壤水與有機質對光譜交互作用規律中發現,在土壤含水量低于10%時,600~1 800 nm區間的光譜可較好地反演土壤有機質含量;在專門研究荒漠土壤有機質特征波段中,高志海等[44]與侯艷軍等[16]的研究成果較為一致(分別為500~900 nm和640~790 nm)。綜合來看,本文研究結論與上述研究成果基本一致,光譜敏感區的具體位置略有變化,根據土壤機械組成的不同而總結如下:砂質土為820~860 nm和940~970 nm,黏壤土為730~790 nm和800~820 nm。
采用灰度關聯法來分析6種光譜指標與土壤有機質含量間的關系,發現2種微分處理(FDR和SDR)可極大提高光譜與有機質含量間的GCD。但后期建模結果顯示,基于2種微分處理光譜指標建立的模型精度較低。推測造成此現象有2方面的原因:1)微分處理后的光譜數據,在量綱上與土壤有機質有較大差距,灰度關聯分析中常用的“均值化”數據預處理法并未很好的解決這一問題,從而造成了2種微分變換光譜指標GCD“虛高”的現象;2)GCD的高低與建模效果的好壞并不一定具有非常高的相關性,這類似于顯著性波段數量的多少并非是模型精度的決定因素。如于雷等[34]在研究中對土壤有機質與R、LR、FDR、CR的相關系數作顯著性檢驗(=0.01),通過檢驗的顯著性波段數量從多到少為LR>R>CR>FDR,但最后基于4種指標建立的PLSR模型精度從高到低依次是CR-PLSR>FDR-PLSR>LR-PLSR> R-PLSR,顯著性最好的光譜指標LR與R的建模效果反而不甚理想。所以,灰度關聯法和相關性分析法對于光譜敏感波段篩選的結果,可作為波段尋優等研究的一種參考,而與模型反演結果之間的關系,需要做更嚴謹的數學推理工作。
研究不同顆粒級配條件下的荒漠土壤有機質光譜估算模型,對提高荒漠土壤肥力的估測精度具有現實意義,但模型的適用性有待作進一步的驗證,同時還可嘗試更多的光譜變換,尋找更優的有機質含量反演指標。研究荒漠土壤其余組分對光譜的影響,是建立精度更高、適用性更強的有機質反演模型的前提,仍需要做更多的相關研究工作。本文將GC法和RR法結合使用,得到了反演效果較好的荒漠土有機質模型及最佳光譜指標、敏感區間等,今后可嘗試2種方法對土壤其余組分的反演預測。
本文將灰度關聯法和嶺回歸法相結合,在考慮荒漠土壤質地對光譜影響的基礎上,建立砂質土和黏壤土的灰度關聯-嶺回歸GC-RR(gray correlation-ridge regression)有機質模型,并與偏最小二乘回歸PLSR(partial least squares regression)模型對比分析后得出以下結論:
1)土壤質地對荒漠土有機質模型的反演精度具有一定的影響作用,表現在當建模方法相同時,砂質土有機質反演模型的效果均優于黏壤土,同時不同土質條件下的有機質光譜響應區間不同:砂質土為820~860 nm和940~970 nm,黏壤土為730~790 nm和800~820 nm。
2)土壤光譜經SNV(standard normal variable reflectance)、FDR(first order differential reflectance)和SDR(second order differential reflectance)變換后,在一定程度上消除了噪聲,改善了系統中光譜與有機質含量間的關聯性,使大部分光譜波段通過了灰度關聯分析的閾值檢驗,所以這三種光譜變換為荒漠土壤有機質灰度關聯分析敏感光譜指標。
3)基于標準正態變量變換SNV光譜建立的模型效果最為理想,而RR模型在保證精度的前提下,比PLSR模型具有更好的穩健性與簡化度。所以,建立GC-SNV- RR高光譜模型用于估算荒漠土壤有機質是個可行、有效的方法。
[1] Kweon G, Lund E, Maxton C. Soil organic matter and cation-exchange capacity sensing with on-the-go electrical conductivity and optical sensors[J]. Geoderma, 2013, 199: 80-89.
[2] Chang Chengwen, Laird D A. Near-infrared reflectance spectroscopic analysis of soil C and N[J]. Soil Science, 2002, 167(2): 110-116.
[3] Wang Yubing, Huang Tianyu, Liu Jing, et al. Soil pH value, organic matter and macronutrients contents prediction using optical diffuse reflectance spectroscopy[J]. Computers and Electronics in Agriculture, 2015, 111: 69-77.
[4] 于雷,洪永勝,周勇,等. 連續小波變換高光譜數據的土壤有機質含量反演模型構建[J]. 光譜學與光譜分析,2016,36(5):1428-1433. Yu Lei, Hong Yongsheng, Zhou Yong, et al. Inversion of soil organic matter content using hyperspectral data based on continuous wavelet transformation[J]. Spectroscopy and Spectral Analysis, 2016, 36(5): 1428-1433. (in Chinese with English abstract)
[5] Hummel J W, Sudduth K A, Hollinger S E. Soil moisture and organic matter prediction of surface and subsurface soils using an NIR soil sensor[J]. Computers and Electronics in Agriculture, 2001, 32(2): 149-165.
[6] Rinnan R, Rinnan ?. Application of near infrared reflectance (NIR) and fluorescence spectroscopy to analysis of microbiological and chemical properties of arctic soil[J]. Soil Biology & Biochemistry, 2007, 39(7): 1664-1673.
[7] Ji Wenjun, Li Shuo, Chen Songchao, et al. Prediction of soil attributes using the Chinese soil spectral library and standardized spectra recorded at field conditions[J]. Soil & Tillage Research, 2016, 155: 492-500.
[8] Xiao Zhenzhen, Li Yi, Feng Hao. Hyperspectral models and forcasting of physico-chemical properties for salinized soils in northwest China[J]. Spectroscopy and Spectral Analysis, 2016, 36(5): 1615-1622.
[9] 朱登勝,吳迪,宋海燕,等. 應用近紅外光譜法測定土壤的有機質和pH值[J]. 農業工程學報,2008,24(6):196-199. Zhu Dengsheng, Wu Di, Song Haiyan, et al. Determination of organic matter contents and pH values of soil using near infrared spectroscopy[J].Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2008, 24(6): 196-199. (in Chinese with English abstract)
[10] 張娟娟,余華,喬紅波,等. 基于高光譜特征的土壤有機質含量估測研究[J]. 中國生態農業學報,2012,20(5):566-572. Zhang Juanjuan, Yu Hua, Qiao Hongbo, et al. Soil organic matter content estimation based on hyperspectral properties[J]. Chinese Journal of Eco-Agriculture, 2012, 20(5): 566-572. (in Chinese with English abstract)
[11] 何東健,陳煦. 土壤有機質含量田間實時測定方法[J]. 農業機械學報,2015,46(1):127-132. He Dongjian, Chen Xu. Real-time measurement of soil organic matter content in field[J]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(1): 127-132. (in Chinese with English abstract)
[12] 葉勤,姜雪芹,李西燦,等. 基于高光譜數據的土壤有機質含量反演模型比較[J]. 農業機械學報,2017,48(3):164-172. Ye Qin, Jiang Xueqin, Li Xican, et al. Comparison on inversion model of soil organic matter content based on hyperspectral data[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(3): 164-172. (in Chinese with English abstract)
[13] Minasny B, McBratney A B, Bellon-Maurel V, et al. Removing the effect of soil moisture from NIR diffuse reflectance spectra for the prediction of soil organic carbon[J]. Geoderma, 2011, 167-168: 118-124.
[14] Kuang Boyan, Mouazen A M. Non-biased prediction of soil organic carbon and total nitrogen with vis–NIR spectroscopy, as affected by soil moisture content and texture[J]. Biosystems Engineering, 2013, 114(3): 249-258.
[15] 周倩倩,丁建麗,唐夢迎,等. 干旱區典型綠洲土壤有機質的反演及影響因素研究[J]. 土壤學報,2018,55(2):313-324. Zhou Qianqian, Ding Jianli, Tang Mengying, et al. Inversion of soil organic matter content in oasis typical of arid area and its influencing factors[J]. Acta Pedologica Sinica, 2018, 55(2): 313-324. (in Chinese with English abstract)
[16] 侯艷軍,塔西甫拉提·特依拜,買買提·沙吾提,等. 荒漠土壤有機質含量高光譜估算模型[J]. 農業工程學報,2014,30(16):113-120. Hou Yanjun, Tashpolat Tiyip, Mamat Sawut, et al. Estimation model of desert soil organic matter content using hyperspectral data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(16): 113-120. (in Chinese with English abstract)
[17] 劉思峰,楊英杰,吳利豐. 灰色系統理論及其應用[M]. 第7版. 北京: 科學出版社,2015.
[18] 金秀良,徐新剛,王紀華,等. 基于灰度關聯分析的冬小麥葉片含水量高光譜估測[J]. 光譜學與光譜分析,2012,32(11):3103-3106. Jin Xiuliang, Xu Xingang, Wang Jihua, et al. Hyperspectral estimation of leaf water content for winter wheat based on grey relational analysis(GRA)[J]. Spectroscopy and Spectral Analysis, 2012, 32(11): 3103-3106. (in Chinese with English abstract)
[19] 周鵬,楊瑋,李民贊,等. 基于灰度關聯-極限學習機的土壤全氮預測[J]. 農業機械學報,2017,48(增刊1):271-276. Zhou Peng, Yang Wei, Li Minzan, et al. Soil total nitrogen content prediction based on gray correlation-extreme learning machine[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(Supp1): 271-276. (in Chinese with English abstract)
[20] Li Xican, Yuan Zheng, Zhang Guangbo. Soil organic matter content GM(0, N) estimation model based on hyper-spectral technique[J]. Grey Systems: Theory and Application, 2013, 3(2): 112-120.
[21] Li Mingliang, Li Xican, Tian Ye, et al. Grey relation estimating pattern of soil organic matter with residual modification based on hyper-spectral data[J]. The Journal of Grey System, 2016, 28(4): 27-39.
[22] Imani M, Ghassemian H. Ridge regression-based feature extraction for hyperspectral data[J]. International Journal of Remote Sensing, 2015, 36(6): 1728-1742.
[23] 張曼,劉旭華,何雄奎,等. 嶺回歸在近紅外光譜定量分析及最優波長選擇中的應用研究[J]. 光譜學與光譜分析,2010,30(5):1214-1217. Zhang Man, Liu Xuhua, He Xiongkui, et al. Study on the application of ridge regression to near-infrared spectroscopy quantitative analysis and optimum wavelength selection[J]. Spectroscopy and Spectral Analysis, 2010, 30(5): 1214-1217. (in Chinese with English abstract)
[24] 張智韜,王海峰,Karnieli A,等. 基于嶺回歸的土壤含水率高光譜反演研究[J]. 農業機械學報,2018,49(5):240-248. Zhang Zhitao, Wang Haifeng, Karnieli A, et al. Inversion of soil moisture content from hyperspectra based on ridge regression[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(5): 240-248. (in Chinese with English abstract)
[25] 丁永軍,李民贊,安登奎,等. 基于光譜特征參數的溫室番茄葉片葉綠素含量預測[J]. 農業工程學報,2011,27(5):244-247. Ding Yongjun, Li Minzan, An Dengkui, et al. Prediction of chlorophyll content using spectral response characteristics of greenhouse tomato[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2011, 27(5): 244-247. (in Chinese with English abstract)
[26] Pen-Mouratov S, Myblat T, Shamir I, et al. Soil biota in the arava valley of Negev desert, Israel[J]. Pedosphere, 2010, 20(3): 273-284.
[27] 趙春江精準農業研究與實踐[M]. 第1版. 北京:科學出版社,2000.
[28] 鮑士旦. 土壤農化分析[M]. 第3版. 北京:中國農業出版社,2000.
[29] Kennard R W, Stone L A. Computer aided design of experiments[J]. Technometrics, 1969, 11(1): 137-148.
[30] 洪永勝,于雷,耿雷,等. 應用DS算法消除室內幾何測試條件對土壤高光譜數據波動性的影響[J]. 華中師范大學學報:自然科學版,2016,50(2):303-308. Hong Yongsheng, Yu Lei, Geng Lei, et al. Using direct standardization algorithm to eliminate the effect of laboratory geometric parameters on soil hyperspectral data fluctuate characteristic[J]. Journal of central China normal University: Natural Science, 2016, 50(2): 303-308. (in Chinese with English abstract)
[31] Savitzky A, Golay M J E. Smoothing and differentiation of data by simplified least squares procedures[J]. Analytical Chemistry, 1964, 36(8): 1627-1639.
[32] Hoerl A E, Kennard R W. Ridge regression: Applications to nonorthogonal problems[J]. Technometrics, 1970, 12(1): 69-82.
[33] 陸婉珍. 現代近紅外光譜分析技術[M]. 第2版. 北京:中國石化出版社,2006.
[34] 于雷,洪永勝,耿雷,等. 基于偏最小二乘回歸的土壤有機質含量高光譜估算[J]. 農業工程學報,2015,31(14):103-109. Yu Lei, Hong Yongsheng, Geng Lei, et al. Hyperspectral estimation of soil organic matter content based on partial least squares regression[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(14): 103-109. (in Chinese with English abstract)
[35] Zheng Guanghui, Ryu D, Jiao Caixia, et al. Estimation of organic matter content in coastal soil using reflectance spectroscopy[J]. Pedosphere, 2016, 26(1): 130-136.
[36] Wang Jingzhe, Tiyip Tashpolat, Ding Jianli, et al. Quantitative estimation of organic matter content in arid soil using Vis-NIR spectroscopy preprocessed by fractional derivative[J]. Journal of Spectroscopy, 2017(1/2): 1-9.
[37] 楊楠. 嶺回歸分析在解決多重共線性問題中的獨特作用[J]. 統計與決策,2004(3):14-15.
[38] 何曉群,劉文卿. 應用回歸分析[M]. 第4版. 北京:中國人民大學出版社,2015.
[39] 張秋霞,張合兵,劉文鍇,等. 高標準基本農田建設區域土壤重金屬含量的高光譜反演[J]. 農業工程學報,2017,33(12):230-239. Zhang Qiuxia, Zhang Hebing, Liu Wenkai, et al. Inversion of heavy metals content with hyperspectral reflectance in soil of well-facilitied capital farmland construction areas[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(12): 230-239. (in Chinese with English abstract)
[40] 史舟. 土壤地面高光譜遙感原理與方法[M]. 北京:科學出版社,2014.
[41] Ji Wenjun, Viscarra Rossel R A, Shi Zhou. Improved estimates of organic carbon using proximally sensed vis-NIR spectra corrected by piecewise direct standardization[J]. European Journal of Soil Science, 2015, 66(4): 670-678.
[42] 尚璇,李西燦,徐郵郵,等. 土壤水與有機質對高光譜的作用及交互作用規律[J]. 中國農業科學, 2017, 50(8): 1465-1475.
Shang Xuan, Li Xican, Xu Youyou, et al. The role and interaction of soil water and organic matter on hyper-spectral reflectance[J]. Scientia Agricultura Sinica, 2017, 50(8): 1465-1475. (in Chinese with English abstract)
[43] 紀文君,史舟,周清,等. 幾種不同類型土壤的VIS-NIR光譜特性及有機質響應波段[J]. 紅外與毫米波學報, 2012, 31(3): 277-282.
Ji Wenjun, Shi Zhou, Zhou Qing, et al. VIS-NIR reflectance spectroscopy of the organic matter in several types of soils[J]. Journal of Infrared and Millimeter Waves, 2012, 31(3): 277-282. (in Chinese with English abstract)
[44] 高志海,白黎娜,王琫瑜,等. 荒漠化土地土壤有機質含量的實測光譜估測[J]. 林業科學, 2011, 47(6): 9-16.
Gao Zhihai, Bai Lina, Wang Bengyu, et al. Estimation of soil organic matter content in desertified lands using measured soil spectral data[J]. Scientia Silvae Sinicae, 2011, 47(6): 9-16. (in Chinese with English abstract)
Hyperspectral estimation of desert soil organic matter content based on gray correlation-ridge regression model
Wang Haifeng1,2, Zhang Zhitao1,2※, Arnon Karnieli3, Chen Junying1,2, Han Wenting2
(1.712100,; 2.712100,; 3.84990,)
Organic matter content in soil is one of the most significant indicators evaluating the soil fertility, and its dynamic monitoring is good for further development of accurate agriculture. In recent years, obtaining Vis-NIR (visible - near infrared) continuous spectrum data of soil through hyperspectral technique and realizing accurate inversion prediction according to organic matter spectrum reflection characteristics have become a hot topic in current remote sensing field. However, in the hyperspectral inversion process of desert soil organic matter, there exists the problem of “low organic matter content, weak spectrum response and low model precision”. The research collected different soil samples in Seder Boker region, south of Israel, divided the experimental soil samples into sandy soil and clay loam after particle size analysis in the lab, and applied potassium dichromate external heating method to measure the organic matter content in the soil. The raw hyperspectral reflectance of soil samples was measured by the ASD FieldSpec 3 instrument. After data preprocessing and different mathematical manipulation, 6 spectral indicators were obtained, i.e. reflectivity (REF), inverse-log reflectance (LR), continuum removal reflectance (CR), standard normal variable reflectance (SNV), first-order differential reflectance (FDR) and second-order differential reflectance (SDR). Then, gray correlation degree (GCD) between different spectral indicators and organic matter content was calculated, and SNV, FDR and SDR through gray correlation (GC) test (GCD>0.90) were chosen as the sensitive spectral indicators. Moreover, hyperspectral inversion model of soil organic matter was built based on sensitive spectral indicator using partial least squares regression (PLSR) method and ridge regression (RR) method, and the precision of inversion result was verified and compared. And then, the performances of these models were evaluated by the determination coefficient for calibration set (R2), determination coefficient for prediction set (R2), root mean squared error (RMSE) and relative percent deviation (RPD). The results indicated that: Soil particle size has a certain impact on the spectral response of organic matter, and the inversion effect of hyperspectral model on the organic matter content in sandy soil is superior to clay loam; after comparing and analyzing the models built according to different spectral indicators,R2,R2and RPD of SNV-PLSR soil model and SNV-RR soil model built according to SNV are the highest and RMSE is the lowest, so SNV is the optimal spectral inversion indicator of soil organic matter; SNV-RR model has the most ideal inversion effect on organic matter content of these 2 kinds of soil: For sandy soil,R2is 0.887,R2is 0.866, RMSE is 0.610 g/kg and RPD is 2.72; for clay loam,R2is 0.889,R2is 0.863, RMSE is 0.898g/kg and RPD is 2.37. After analysis, it is known that SNV-RR model has extremely strong forecast ability for organic matter of sandy soil, and very good quantitative forecast ability for organic matter of clay loam. In addition, compared with PLSR model, R2andR2of RR model decline slightly. However, on the premise of ensuring precision, the number of band section used in modeling only accounts for about 4% of total spectrum. Not only does it simplify the model greatly, but also realizes “dimensionality reduction” and “optimization” of hyperspectral data. Through band selection function effect of RR method, the significant band section of soil organic matter is analyzed: The sensitive band of organic matter of sandy soil is mainly concentrated at 820-860 and 940-970 nm, but the sensitive band of organic matter of clay loam is concentrated at 730-790 and 800-820 nm. The united application of gray correlation analysis and RR method in the modeling analysis of soil organic matter provides a new approach to optimize the hyperspectral model and quickly measure the organic matter content in soil. GC-SNV-RR organic matter inversion model of 2 kinds of soil is simple and has good prediction. It provides support for remote sensing analysis on desert soil organic matter, which realizes the speedability and accuracy in monitoring the desert soil organic matter.
remote sensing; models; organic matter; desert soil; hyperspectral; gray correlation; ridge regression
10.11975/j.issn.1002-6819.2018.14.016
S127;S153.6+21
A
1002-6819(2018)-14-0124-08
2018-03-04
2018-06-25
國家重點研發計劃項目(2017YFC0403302、2016YFD0200700);楊凌示范區科技計劃項目(2016NY-26)
王海峰,男,河北張家口人,主要從事農業遙感及水資源的高效利用研究。Email:wanghf2016@nwafu.edu.cn
張智韜,男,陜西周至人,博士,副教授,主要從事遙感技術在節水灌溉及水資源中的應用研究。Email:zhitaozhang@126.com
王海峰,張智韜,Arnon Karnieli,陳俊英,韓文霆.基于灰度關聯-嶺回歸的荒漠土壤有機質含量高光譜估算[J]. 農業工程學報,2018,34(14):124-131. doi:10.11975/j.issn.1002-6819.2018.14.016 http://www.tcsae.org
Wang Haifeng, Zhang Zhitao, Arnon Karnieli, Chen Junying, Han Wenting. Hyperspectral estimation of desert soil organic matter content based on gray correlation-ridge regression model[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(14): 124-131. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2018.14.016 http://www.tcsae.org