田安紅,楊麗華,崔麗梅,付承彪,趙俊三,熊黑鋼,于 龍
(1. 曲靖師范學院 信息工程學院,云南 曲靖 655011;2. 昆明理工大學 國土資源工程學院,云南 昆明 650093;3. 北京聯合大學 應用文理學院,北京 100083;4. 曲靖師范學院 城市學院,云南 曲靖 655011)
土壤中硝態氮含量的準確估測是合理施用氮肥、確保農作物生長的關鍵[1]。高光譜遙感技術因具有快速、無損、實時、精度高等優點[2-3],被廣泛用來估測土壤中的養分信息。例如,單海斌等[4]以新疆農田灰漠土為研究對象,在暗室內測量土壤的高光譜,并對其進行倒數、對數和一階微分變換,采用多元逐步方法預測有機質含量,結果顯示,對數一階微分后的反演模型精度最高,決定系數為 0.82。劉凡等[5]研究新疆干旱區灰漠土中全氮的高光譜特性,一階微分后的土壤高光譜與全氮的相關性明顯優越原始高光譜與全氮的相關性,一階微分后建立的估測模型在驗證集的決定系數達0.8,總體上預測模型的精度較高。張佳佳等[6]研究江西省贛州市稻田土壤的高光譜特性,并建立反演全磷和有效磷的預測模型,表明全磷的特征波段位于534 nm和1 090 nm,而有效磷的特征波段位于365 nm、1 631 nm和2 223 nm,通過SPSS軟件建立的全磷和有效磷的多項式回歸模型的相關分析誤差分別為1.43和1.54。尤承增等[7]采集橫山縣的84個土壤樣本,測量其在 350~2 500 nm波段的高光譜反射率曲線,并對原始高光譜進行一階微分變換,根據極大相關性原則來篩選敏感波段,通過模糊識別理論來建立全鉀的預測模型。以上的研究表明,利用高光譜遙感技術檢測土壤中的養分是可行的,但主要涉及的養分為有機質、全氮、全磷、全鉀等。而硝態氮的含量普遍在土壤中較低[1],準確檢測硝態氮的含量存在一定的困難。目前,針對土壤中硝態氮含量的高光譜反演研究報道非常少。
另外,現有文獻針對土壤養分的反演主要是以被人類干擾過的土壤為研究區域,很少對比分析沒有受到人類干擾的土壤和受到人類干擾的土壤。因此,本研究以新疆不同人類干擾區域的土壤為研究對象,采用非線性的 BP神經網絡建立精確反演硝態氮含量的模型,為研究不同區域的土壤硝態氮反演提供了可靠的依據。
研究區域為新疆阜康的土壤,地理坐標如圖1所示。2個不同研究區域主要是以不同人類干擾情況來劃分。圖1的右邊定義為沒有人類干擾的區域(A區),圖1的左邊定義為有人類干擾的區域(B區)。因為在A區和B區中間有一條長約15 km左右的大水渠,水渠基本隔斷了人類在A區的日常活動,A區的土壤表層生長著如紅柳、梭梭等耐鹽性的植物。B區的土壤被當地居民犁地開發為人工林地等。

圖1 研究區域
土壤樣品的采集時間為2017年5月中旬,利用五點取樣方法來采集表層土壤0~20 cm,A區和B區分別為25個和30個土壤樣本。野外采集的樣本密封保存后帶回實驗室,通過自然風干、去除殘渣、研磨等處理后[8],由中科院新疆生態與地理研究所的專業人員測量土壤中硝態氮含量。
土壤的高光譜反射率采用 ASD FieldSpec3來測量[9],該光譜儀的全波段范圍從350 nm到2 500 nm。野外高光譜的測量要選擇晴朗無云無風的天氣進行,時間選擇在當地14:00左右進行。每次進行高光譜測量之前都需要白板校正操作,每個土壤樣本點重復測量 10次,取其平均值代表該樣本點的最終高光譜反射率。
為了減少測量過程中的噪聲干擾,需要利用Savitzky-Golay平滑方法對測量的高光譜進行濾波處理。同時刪除信噪比低的邊緣波段范圍的高光譜,即350~390 nm和2 401~2 500 nm。又因野外高光譜的測量還受到大氣中水分的影響,因此還需要刪除1 400 nm和1 900 nm附近的波段,即1 355~1 410 nm和1 820~1 942 nm。高光譜預處理后的曲線如圖2所示。
本研究的建模方法采用線性的逐步多元回歸模型(stepwise multiple linear regression,SMLR)和非線性的BP(back propagation)神經網絡模型來實現。SMLR的主要思路是:考慮所有變量的方差貢獻值[10-11],按照其值大小的重要性進行篩選,逐步依次地選則進入回歸方程中。基于誤差反向傳播算法的BP神經網絡具有強大的非線性映射能力[12-13],其主要由輸入層、隱藏層和輸出層組成。本研究在Matlab2019a中編程實現,設置的最大迭代次數設為 1 000,期望誤差設為le-6,學習速率設為0.001,訓練函數選擇設為trainscg,隱藏層節點個數設置為 300。同時,SMLR和BP模型的訓練土壤樣本選擇60%,測試土壤樣本選擇40%。

圖2 土壤的高光譜反射率曲線
本研究采用3個參數來評價預測模型的精度,即決定系數(R2),均方根誤差(RMSE)和相對分析誤差(RPD)[14-15]。當R2的值越接近1,RMSE的值越接近于0時,說明所建立的模型的預測精度越高[16]。并且當RPD值大于2.5時,說明所建立的模型的預測能力極強;當RPD值在2.0~2.5之間時,說明所建立的模型的預測能力很好;當RPD值在1.8~2.0之間時,說明所建立的模型的預測能力好;當 RPD值在 1.4~1.8之間時,說明所建立的模型的預測能力一般;當RPD值在 1.0~1.4之間時,說明所建立的模型的預測能力很差;當RPD值小于1.0時,說明所建立的模型不具有預測能力。
因土壤的原始高光譜與硝態氮含量的最大相關系數,在A區為0.322 361,在B區為0.439 667,總體來說,A區和B區的最大相關系數值較低,難以選擇出敏感波段。因此,進一步將土壤的原始高光譜進行一階導數和二階導數變換(見圖3),發現變換后的高光譜與硝態氮的相關系數被明顯地增大,A區一階導數與硝態氮的最大相關系數絕對值為0.695 314,對應波段為142 8 nm,A區二階導數與硝態氮的最大相關系數絕對值為0.718 687,對應波段為681 nm;B區一階導數與硝態氮的最大相關系數絕對值為0.696 547,對應波段為1 526 nm,B區二階導數與硝態氮的最大相關系數絕對值為0.638 911,對應波段為2 252 nm。在圖3中,僅有部分波段通過了0.01檢驗(見表1),可選取通過0.01檢驗的波段作為后續反演模型的敏感波段。由表2可知,A區一階導數和二階導數通過0.01檢驗的波段分別為61和33個;B區一階導數和二階導數通過0.01檢驗的波段分別為95和33個。
將表1中通過0.01檢驗的波段對應的高光譜反射率作為自變量,將土壤的硝態氮含量作為因變量,建立 BP神經網絡模型和逐步多元線性回歸模型估算硝態氮含量(見表2)。SMLR一階導數模型的相對分析誤差RPD很低,在A區的RPD值為1.132,在B區的RPD值為1.146;SMLR二階導數模型的相對分析誤差RPD也很低,在A區的RPD值為1.183,在B區的RPD值為1.014,說明SMLR一階導數和二階導數模型都無法預測土壤硝態氮含量。
一階導數后的BP神經網絡模型在A區的RPD值為2.884,R2為0.874,RMSE為18.980,因RPD值大于2.5,說明該模型對硝態氮含量的預測能力很強。二階導數后的 BP神經網絡模型在 A區的 RPD值為2.317,R2為 0.807,RMSE為 24.142,因 RPD 值在2.0~2.5之間,說明該模型對硝態氮含量的預測能力好。一階導數后的BP神經網絡模型在B區的RPD值為2.226,R2為0.929,RMSE為26.959,因RPD值在2.0~2.5之間,說明該模型對硝態氮含量的預測能力好。二階導數后的 BP神經網絡模型在 B區的RPD值為1.956,R2為0.887,RMSE為29.922,因RPD值在1.8與2.0之間,說明該模型對硝態氮含量的預測能力較好。

圖3 土壤高光譜與硝態氮的相關系數

表1 通過0.01檢驗的波段

表2 BP和SMLR的建模精度比較
利用驗證集的檢驗樣本對SMLR和BP模型進行檢驗,SMLR和BP對硝態氮含量的真實值與預測值的比較如圖4所示。SMLR一階導數和二階導數的樣本值比較分散,擬合線偏離 1∶1線的程度較大。BP一階導數和二階導數的樣本值基本集中分布在 1∶1線附近。BP一階導數在A區的擬合方程為y=0.931 62x+0.672 57,在B區的擬合方程為y=0.781 97x+5.646 8。BP二階導數在 A區的擬合方程為 y=0.888 86x+6.699 8,在B區的擬合方程為y=0.699 68x+26.735 4。圖5為BP神經網絡的訓練結果。BP模型的隱藏層節點數都設置為300個,輸出層1個變量。輸入變量在A區一階導數、B區一階導數、A區二階導數、B區二階導數中,分別對應61個、95個、33個、33個波段的高光譜反射率。并且A區一階導數、B區一階導數、A區二階導數、B區二階導數分別進行迭代13次、12次、40次、8次滿足精度要求。

圖4 SMLR和BP對硝態氮含量的真實值與預測值的比較

圖5 BP神經網絡訓練
原始高光譜的一階導數和二階導數通過0.01檢驗的波段數量,在A區分別61個和95個,在B區均為33個。一階導數變換后的BP神經網絡模型的預測精度最高,在A區的RPD為2.884,R2為0.874,RMSE為18.980,該模型對硝態氮含量的預測能力很強;在B區的RPD為2.226,R2為0.929,RMSE為26.959,該模型對硝態氮含量的預測能力好。二階導數變換后的BP神經網絡模型在A區的RPD值為2.317,R2為0.807,RMSE為24.142,該模型對硝態氮含量的預測能力好。二階導數變換后的BP神經網絡模型在B區的RPD值為1.956,R2為0.887,RMSE為29.922,該模型對硝態氮含量的預測能力較好。一階導數和二階導數變換后的SMLR模型的RPD值很低,基本在1.1左右,說明其對2種土壤中的硝態氮含量的預測能力非常差。