尚天浩,賈萍萍,孫 媛,張俊華
(1.寧夏大學 資源環境學院,寧夏 銀川 750021;2.寧夏大學 環境工程研究院,寧夏 銀川 750021)
土壤水分指位于地表以下,潛水面以上區域土層中的水,作為自然圈土壤系統中能量交換和物質循環的載體,是農業、生態和環境的重要評價指標[1]。土壤中所含水分的多少直接影響植物的生長發育狀況。與傳統土壤含水量(SMC)測量方法如負壓計法、土壤濕度計法、中子水分儀探測法、時域反射法等單點局部測量方法相比[2],高光譜技術能夠獲取連續不斷的高分辨率土壤光譜信息,在監測SMC的細微差異變化方面具有顯著優勢[3],為SMC的準確擬合提供了可能。
土壤光譜反射率與光譜特征曲線都會隨著土壤水分的影響而發生變化。很多學者指出SMC敏感波段與水分特征曲線在吸收谷的位置基本吻合,位于1 400,1 900和2 200 nm附近,但具體敏感波段的位置因土壤類型不同存在一定差異[4-5]。一般認為,SMC小于田間持水量時,土壤反射率與SMC的呈負相關;當SMC大于田間持水量時,土壤反射率與SMC呈正相關[6]。為提高SMC擬合精度,對R光譜進行倒數對數(logarithm of reciprocal reflectance,LR)、一階微分(first order differential reflectance,FDR)、倒數一階微分(first derivative of reciprocal reflectance,FRR)和對數倒數一階微分(first derivative of logarithmic reciprocal reflectance,FRLR)等常規數學變換,張飛等[7]、史舟等[8]等認為FDR處理變換模型擬合效果更佳。由于高光譜數據具有一定冗雜性,故一般通過相關系數法、逐步回歸(SR)和灰色關聯法(GCD)進行敏感波段篩選,其中GCD分析不受樣本數量多少和樣本間有無規律作用影響[9],在高光譜分析篩選光譜敏感波段中優勢顯著。在建模方法中,Hummel等[10]利用原狀土表層土壤光譜采用MLR建立亞表層SMC擬合模型;張銳等[11]認為相對反射率建立的水稻土PLSR模型,擬合效果較好;Khedri等[12]將機載孔徑雷達的C,L和P波段結合,建立SVM模型成功實現了地表SMC擬合;熊靜齡等[13]利用多元散射校正與FLR結合進行SVM模型建立,擬合精度為0.811;Ahmad等[14]通過研究美國科拉羅多下游流域的SMC,分別建立SVM、人工神經網絡和MLR模型,指出SVM模型擬合效果最佳,擬合精度為0.57;張智韜等[15]對比多元逐步回歸、PLSR和嶺回歸3種模型,認為基于LR指標建立的嶺回歸模型為荒漠土SMC最佳擬合模型,擬合精度高達0.979。以上研究表明,SMC與土壤光譜反射率間并非單一線性關系,SVM作為一種機器學習算法在處理非線性問題時具有一定優勢。但以往研究多以原狀水稻土、荒漠土、夯土和潮土等非鹽漬土為研究對象,并未考慮鹽漬化土壤的SMC研究,故不能完全應用于鹽漬化地區的SMC研究。
干旱地區土壤光譜主要受水分和鹽分的影響[16]。Farifteh等[17]研究表明土壤鹽分含量的高低會影響SMC的光譜反射率在可見光—近紅外波段的變化;彭翔等[18]指出SMC大于25%,土壤反射率主要受水分影響,SMC低于25%,土壤反射率受鹽分影響較大,故準確獲取土壤水分和鹽分信息成為干旱半干旱地區鹽堿地改良利用的重要前提。目前,對于鹽漬化地區SMC的高光譜擬合研究相對較少,Zeng等[19]運用高斯修正和人工神經網絡模型成功實現鹽漬化地表SMC擬合;吳士文等[3]采用LS-SVM模型建立了蘇北鹽漬化SMC剖面的擬合模型,擬合精度為0.88。但由于鹽漬化土壤水鹽運移的復雜性和鹽分類型的多樣性,這些水分擬合模型很難具有普適性。寧夏銀北地區分布有大面積的龜裂堿土,土壤pH值和電導率普遍較高,在全球干旱區土壤鹽堿化研究中非常典型。該區域下墊面均一,數據獲取質量較高,具有遙感監測的地理優勢。因此,本文以寧夏回族自治區北部平羅縣重度鹽漬化土壤為研究對象,運用SR與GCD分別進行敏感波段優選,然后利用MLR,PLSR和SVM建立SMC擬合模型。以期為當地及同類地區土壤水分的快速獲取提供科學依據。
供試土壤取自寧夏銀北地區平羅縣(106°17′—106°36′E,38°42′—38°64′N),該地區屬干旱—半干旱地區大陸性氣候,年均降水量為176 mm,年均蒸發量為1 755 mm以上。研究區內土地利用方式以基本農田、中低產田和撂荒地為主,土壤多為黏質壤土,肥力低下。該區域地勢低洼,排水性能較差且由于農業種植灌溉不合理,進一步加劇了水分、鹽分匯集的現象,經多年積累形成大面積鹽堿化土壤。供試土壤基本理化性質詳見表1。

表1 供測土壤基本化學性質 g/kg
采集研究區重度鹽漬化表層土壤(0—20 cm),帶回實驗室除去落葉、根莖和礫石等雜質后自然風干。研磨后過2 mm篩,裝滿直徑為12 cm深度為2 cm的器皿(光學上無限厚土樣深度為1.5 cm),表面作刮平處理。分別間隔0,2,4,6,8,10,12,14和16 h后從容器邊緣一次性緩緩注入蒸餾水約30 ml,每個間隔重復5次,待最后一組注水結束靜置1 h后測定每個樣品的光譜反射率與土壤含水率。烘干法測定土壤含水率。
采用美國Spectral Evolution公司的SR-3500地物光譜儀測定土壤光譜數據。光譜儀探測波段為350~2 500 nm,其中在350~1 000 nm分辨率為3.5 nm,在1 000~1 500 nm分辨率為10 nm,在1 500~2 100 nm分辨率為7 nm。光譜測定時間為2018年12月1日10:00—14:00,天氣狀況良好,晴朗無云無風。在室外開闊陽光充足的平臺上鋪上黑布,將盛放土樣的金屬盒放置于黑布之上,測定時光譜儀探頭設置在垂直距離土表上方15 cm處,每個土樣重復測定5次,取算數平均值作為該土樣光譜數據。測定過程中進行標準白板校正。
首先剔除土壤樣本中,受噪聲影響嚴重的異常光譜反射率波段(主要集中在350~354 nm,1 871~1 943 nm和2 429~2 500 nm)。運用九點加權法[20]對土壤光譜反射率進行平滑去噪處理,盡可能的減弱由于儀器噪聲和外部環境對于土壤光譜的影響。本文對土壤R光譜數據進行5種數學變換:RR,LR,FR,FLR和FRLR變換。
1.5.1 灰色關聯度分析法(GCD) GCD作為灰色系統理論中一種系統分析方法,在數學計算的基礎之上,通過計算輸入變量因素間關聯度的大小,按照重要性的高低依次進行排序,其中數值越大,關聯度越高,該變量因素在系統中影響作用就越大[9,15,21]。運用DPS軟件中的灰色關聯板塊,計算不同數學變換之后的光譜反射率與SMC間的相關性。
1.5.2 逐步回歸分析法(SR) SR作為一種線性自變量的選擇方法,將所有變量依次輸入回歸模型,通過每一次新變量代入,檢驗之前輸入變量的顯著性,依次類推直到最后一個變量輸入完成,通過比較各變量的顯著性大小,有選擇的留下顯著性較高的變量作為入選變量[15]。運用SPSS 25分析—回歸板塊進行顯著性檢驗分析,此時回歸模型篩選留下的變量,作為SMC的敏感波段。
利用篩選出的敏感波段分別采用MLR,PLSR和SVM這3種方法建立基于不同光譜反射率轉換下SMC擬合模型。①MLR模型在可控條件下可靠性高,所建模型直觀易懂,廣泛應用于高光譜分析之中[1]。②PLSR模型是一種數學優化技術,妥善解決了波長數量大于樣本數量和多變量線性相關的問題[3]。③SVM是一種基于小樣本統計學習的統計理論,將有限的樣本非線性空間映射進高維線性特征空間,采用最小化原理對結構中的風險進行處理[22]。基于SVM模型選擇高斯定向基核函數,對懲罰因子c和參數g將初始篩選范圍統一設定在10-10~1010,經多次訓練確定c和g的最小值進行建模。
土壤光譜特征是土壤理化屬性的重要反映。對土壤進行除雜、風干、過篩(2 mm)、刮平等預處理,基本消除了由于土壤粒徑、土壤粗糙度等因素對光譜反射率的影響,可以更好地分析光譜反射率與SMC間的變化關系。在350~2 500 nm波段范圍內,不同SMC的光譜曲線走勢基本一致(見圖1),可見光波段的土壤光譜反射率變化幅度整體小于近紅外波段,在1 460和1 950 nm附近出現兩個明顯水分吸收帶,在2 220 nm附近出現一個較弱水分吸收帶。SMC從7.53%到20.56%范圍內,隨SMC的升高光譜反射率呈遞減趨勢;而SMC增加到26.34%后,隨著SMC的升高光譜反射率呈現下降趨勢。在整個波段范圍內,水分含量為7.53%的土壤反射率最高,比水分含量為26.34%和30.97%的土壤反射率在可見光波段分別平均高出6.55%和4.21%,在近紅外波段分別平均高出15.60%和11.29%,其中在1 868 nm附近差異最大。水分含量為20.56%和26.34%的土壤特征曲線在997 nm前后出現各自交替領先的態勢。為更好地對比不同SMC光譜特征曲線在吸收和反射特征處的差異變化,將上述6條原始土壤光譜反射率進行CR處理,發現各水分處理土壤CR曲線在1 460與1 950 nm附近存在明顯水分吸收帶(見圖1),隨SMC的增加,1 460 nm附近的水分吸收谷的波段位置有紅移現象,其中SMC從7.53%到26.34%紅移10 nm;在420與485 nm附近存在較弱水分帶,隨SMC的增加水分吸收谷的波段位置有藍移現象,SMC從26.34%到30.97%藍移1和2 nm。與7.53%SMC的土壤反射率相比,14.52%,19.77%和20.56%土壤反射率在1 460 nm處分別下降2.43%,8.43%和13.79%,1 950 nm處分別下降2.62%,9.38%和10.52%。與水分含量為26.34%的土壤反射率相比,30.97%的土壤反射率在450,485,1 460 nm和1 950 nm處分別上升1.69%,1.85%,5.99%和3.46%。

圖1 不同含水率(SMC)時的原始與連續統去除(CR)光譜反射率曲線
2.2.1 逐步回歸分析法(SR) 為篩選與水分相關性較強的波段,采用SR對光譜數據進行“降維”處理,有選擇性的保留對于因變量影響作用顯著的自變量,從而得到SMC的敏感波段。本研究以原始反射率R和5種轉換后的反射率(RR,LR,FR,FLR和FRLR)作為自變量,不同SMC作為因變量進行敏感波段的篩選。將變量的入選顯著水平設定為0.05,剔除顯著水平設定為0.10進行輸入,在輸出結果中選擇調整R2最大值處作為入選最優敏感波段組合,所選敏感波段的調整R2均大于0.900,表明模型擬合效果很好,同時所有模型的顯著性均小于0.001(低于顯著性水平0.01),表明不同反射率轉換的SR模型均具有極顯著意義。通過對比SR得到6種轉換方式下的敏感波段發現(見表2),經FDR轉換可以在一定程度上保留更多光譜信息,其R篩選出的波段數最多(8個),RR和LR篩選出的波段數最少。

表2 不同反射率轉換方式的逐步回歸分析
2.2.2 灰色關聯度分析法(GCD) 為篩選光譜反射率與SMC相關性較高的波段,將GCD閥值設定為0.51。在整個光譜波段范圍內,R和LR與SMC的相關性均介于0.20~0.40,未超過GCD閥值0.51,所以這2種光譜反射率轉換無法作為光譜敏感波段,在后續建模分析中不作考量。而RR,FRR,FLR和FRLR與SMC的相關性存在高于設定GCD閥值0.52的值,且敏感波段主要集中于1 900~2 500 nm,其中FLR和FRLR 篩選到敏感波段數量最多(5個),RR篩選的敏感波段數量最少(3個),分別是2 412,2 413和2 414 nm。這是由于該波段范圍對SMC的高低比較敏感且1 900~2 500 nm波段范圍的光譜反射率與SMC的灰色關聯度普遍高于其他波段范圍。
將SR與GCD篩選出的敏感波段為自變量,分別利用MLR,PLSR和SVM這3種數學模型建立SMC擬合模型。


表3 不同土地含水率SMC的MLR,PLSR和SVM模型

高光譜遙感與多光譜遙感獲得的光譜數據相比,能夠提供更加細致、全面、可靠的光譜信息,為地表SMC的快速獲取提供了更為可靠的數據基礎。研究區SMC在7.53%~20.53%范圍內,隨SMC的增加土壤反射率逐漸降低,這可能是由于重度鹽漬化區有白色結晶鹽分析出,主要成分以Na2SO4,NaCl和MgCl2等為主,當SMC逐漸增加,地表物質開始發生溶解,人射光在射入晶體顆粒表面和從晶體顆粒表面反射而出時,受到晶體顆粒表面附著水的吸收作用影響,導致反射率降低;當SMC高于20.64%時,地表鹽分已基本完全溶解,地表濕度過大土壤中的水分主要以自由水形式存在,并在地表開始形成一定的鏡面反射,土壤反射率隨含水率增大而增大,這與張俊華等[20]和吳代暉等[23]的研究結果一致。本研究發現供試土壤的敏感波段主要集中在1 460,1 950和2 200 nm附近。姚艷敏等[24]指出吉林黑土含水量敏感波段在400~410 nm,1 400~1 850 nm,2 050~2 200 nm的范圍內;張銳等[11]發現1 450,1 950和2 220 nm為原狀水稻土水分最優建模波段;于雷等[25]認為443~449 nm,1 408~1 456 nm,1 916~1 943 nm,2 209~2 253 nm為浙江潮土的最優敏感波段,這與本文水分敏感波段基本一致。
選取適當的敏感波段篩選方式和建模方法是提高SMC擬合精度的有效途徑。為準確監測SMC狀況,利用SR和GCD篩選SMC敏感波段建模,發現FDR處理在GCD分析效果較好,這是由于FDR在處理高光譜土壤數據時對光譜具有一定增強作用,可降低光譜數據中低頻噪聲的干擾,增進圖譜信息,提高圖譜靈敏度[21]。同時發現基于SR分析篩選敏感波段所建模型穩定性和擬合能力整體效果最優,這與李明亮等[26]認為GCD分析篩選敏感波段建模優于線性相關性分析篩選建模結論不同。可能是由于前者研究對象為山東泰安非鹽漬化棕壤,與本文寧夏銀北重度鹽漬化粘壤土在土壤鹽分、粗糙度和質地等方面都存在一定差異造成。對比MIR,PLSR和SVM 3種模型的建模效果,發現基于SVM模型的擬合精度整體優于MLR和PLSR模型,表明機器算法比傳統建模方法在表層SMC擬合中的可靠性更高[27],這與陳文倩等[28]在對新疆渭庫綠洲SMC反演中,SVM模型精度遠高于MLR和PLSR模型的結論一致。在SVM模型中,發現基于SR篩選的敏感波段數量最多為8個,最少為2個,所建模型的穩定性和建模精度相差不大,說明采用SR-SVM方法建模,入選敏感波段數量的多少與精度無直接關系;但基于GCD篩選的敏感波段數從多到少依次FLR=FRLR>FRR>RR,所得SVM模型的精度從高到低依次為:FLR-SVM>FRLR-SVM>FRR-SVM>RR-SVM,說明GCD-SVM建模入選敏感波段數越多所建模型精度和擬合能力越高。
本研究是針對重度鹽漬化土壤,其水分含量在7.44%~32.29%的范圍內,其最優擬合模型能否應用于其他程度鹽漬化土壤的水分擬合還需進一步驗證。
(1) 土壤水分含量較低時,隨水分含量增加土壤反射率逐漸下降,當水分含量超過26.34%后,土壤反射率隨水分的增加而增大,原始光譜反射率在近紅外波段變化幅度整體大于可見光波段;經CR處理水分光譜特征曲線在420和485 nm處出現較弱水分吸收帶,吸收谷位置發生藍移現象。
(2) 在研究區SMC擬合建模方法中,MLR和PLSR模型的擬合效果普遍較差,SVM模型的整體具有良好的擬合能力。因此,SVM模型在進行干旱—半干旱地區的重度鹽漬化SMC擬合方面具有一定優勢。