張全旺,郭 輝
(安徽理工大學空間信息與測繪工程學院,安徽 淮南 232001)
隨著地下煤炭開采工作的向前推進,煤層采空區(qū)面積持續(xù)擴大,破壞了原有覆巖的應力平衡,導致地表下沉和拉張裂隙的產生[1]。拉張裂隙對土壤的水分和養(yǎng)分循環(huán)產生一定影響,對原有的土壤結構造成破壞。大面積的地表沉陷與拉張裂隙導致礦區(qū)耕地土壤養(yǎng)分發(fā)生空間變異,造成土壤質量降低進而影響糧食產量。目前,針對拉張裂隙影響土壤營養(yǎng)成分的研究主要集中在以氮、磷、鉀、有機質為代表的養(yǎng)分特性。文獻[2]發(fā)現土壤有機質質量分數的下降程度隨著拉張裂隙寬度的增大和水平距離的減小而增大。文獻[3]認為拉張裂隙導致土壤水分與氮的流失,與拉張裂隙距離越近,土壤含水量和有效氮質量分數越低。為進一步了解土壤有機質含量分布,國內外學者也探索了多種模型反演土壤有機質[4-13],但對采煤拉張裂隙區(qū)土壤營養(yǎng)成分進行監(jiān)測的相關研究還較少。精確恢復裂隙區(qū)土壤質量及改善農業(yè)產量的迫切需求,使探究裂隙區(qū)土壤營養(yǎng)成分的空間分布特征成為熱點。
本文首先分析裂隙區(qū)有機質含量的空間分布特征,然后探討研究區(qū)不同深度土壤有機質含量的反演工作,以期試驗結果為后續(xù)高光譜遙感反演提供理論支撐,為采煤拉張裂隙區(qū)土壤有機質含量監(jiān)測提供技術支持。
研究區(qū)位于安徽省淮北市朱莊煤礦3522工作面地表沉陷區(qū)(如圖1所示),受采煤活動影響,在沉陷區(qū)平行于3522工作面風巷形成了部分拉張裂隙。研究區(qū)年平均降水量為823.4 mm,年最大降水量為1 441.4 mm。土壤類型主要是半水成土綱的潮土與砂姜黑土。

圖1 研究區(qū)位置
以朱莊煤礦3522工作面沉陷區(qū)的C1裂隙為研究對象,采樣時間為2019年。以C1裂隙南北兩端等間距50 cm設置采樣點,使用土鉆分層方式采集土壤樣本,裂隙以北每點采樣深度為1 m,每層土壤間隔10 cm,裂隙以南每點采樣深度為1 m,每層間隔20 cm,布設圖如圖1所示,總計采集土壤樣本90個。所有土樣帶回實驗室攤平并自然風干,直至土壤樣本質量大小無明顯變化。清除枯枝等雜物后,將所獲土壤樣本單獨充分研磨,篩選的土壤顆粒大小為20目。 有機質含量測定在安徽理工大學實驗室進行,采用重鉻酸鉀外加熱法測定有機質含量。
采集土壤光譜反射率使用美國ASD公司FieldSpec4地物光譜儀,波段范圍為350~2500 nm,采樣間隔為1 nm。選用50 W的鹵素燈為光源,光源天頂角為45°,距樣本表面30 cm。將光纖探頭置于土樣垂直正上方5 cm處,采集 20 條光譜曲線,利用ASDviewSpecpro軟件進行預處理,剔除異常曲線,取平均值作為樣本最終光譜反射率。
1.3.1 光譜變換
光譜數據采集過程中受隨機誤差的影響,原始光譜反射率難以直接顯示特征波段的特征點。因此微分變換是常見的光譜數據處理方法,它能在某種程度上消除、削弱光譜數據中的噪聲,放大光譜信息,改善多重共線性[14]。本文對土壤原始光譜分別進行了一系列光譜變換。一階微分變換(FD)能去除部分線性噪聲,增強局部位置的光譜響應差[15];二階微分變換(SD)能消除基線漂移和一些儀器背景的影響[15];倒數和對數變換(LR)是常用的處理方法,可以增強相似光譜間差異,減少光照條件、地形、環(huán)境變化等因素的影響,增強可見光區(qū)域的光譜差異[16]。
1.3.2 建模方法
使用偏最小二乘回歸、BP神經網絡對朱莊礦裂隙區(qū)土壤有機質含量進行建模估算。偏最小二乘回歸是對多元線性回歸建模的一種改進,解決了自變量之間多重相關的問題,可以實現多對多的建模[16]。偏最小二乘回歸模型可包含更多的光譜信息,從而具有較高的反演精度[17]。經光譜變換后,根據相關系數大小、圖中波峰和波谷篩選特征波段,選取原始光譜及其變換光譜的反射率值為反演模型的自變量,有機質含量為因變量,所測樣本按2∶1隨機選擇建模集和預測集,估測土壤有機質含量。實際參與試驗樣本88組,其中建模集65組,驗證集23組,在Unscrambler10.3軟件中使用PLSR模塊構建PLSR模型。BP神經網絡算法流程等同于非線性映射,算法結果實現了一個多層反饋模型用于學習有用知識,對算法進行訓練,熟悉訓練集的模式后,按照已經學習得出的模式對數據進行預測,同時為了提高模型精度適時調整算法參數[18]。BP模型的建立同樣使用原始光譜反射率及其變換光譜作為反演模型的自變量,有機質含量作為因變量,在Matlab 2016a軟件中神經網絡工具箱模塊生成相關模型。
1.3.3 建模精度評價
采用決定系數R2、均方根系數RMSE對模型的精度及預測能力進行評價。R2越接近1,表明模型的預測值與實測值越接近;RMSE越小,預測效果越好。具體公式如下
(1)
(2)

本文有機質含量變異系數大于0.1,屬于中等變異性。變異系數越大,越利于模型構建。根據裂隙區(qū)不同深度有機質含量的統(tǒng)計結果(如圖2(a)所示),0~50 cm土壤有機質含量的平均值、最大值及最小值總體呈逐層遞減趨勢,50~100 cm土層處有機質含量保持不變;根據裂隙區(qū)不同點位有機質含量的統(tǒng)計結果(如圖2(b)所示),C1S—C6S是在拉張裂隙南側布設的采樣點,C1N—C6N是在裂隙北側布設的6個采樣點。由圖2可知,C1N—C6N各點有機質含量平均值逐漸減少,C6S—C1S點有機質含量平均值逐漸增加。

圖2 不同深度和不同點位土壤有機質含量分布
為提取原始光譜中不易發(fā)現的光譜信息,對原始光譜曲線進行一階微分變換(FD)、二階微分變換(SD)、倒數和對數變換(LR)。根據相關系數大小與特征峰谷選取特征波段。經過LR變換后,有機質與光譜數據之間的相關系數從負相關轉變?yōu)檎嚓P,特征波段變化不大;原始光譜經過FD和SD處理后,吸收谷和反射峰密集,即微分處理能增大光譜響應差異。
分析土壤有機質含量與4種光譜數據之間的相關關系。圖3(a)為原始光譜反射率與有機質含量相關系數圖,圖3(b)—(d)分別為FD、SD、 LR變換后的相關系數圖。由圖3(a)可知,土壤原始反射率光譜與有機質呈負相關,在350~1750 nm波段均表現出較好的相關性,在529 nm處達到相關系數的最大值,篩選出波段529、1366、1504、1734 nm。經FD變換后,在350~2500 nm波段能夠找到較多特征點,如在350~1750波段發(fā)現更多拐點,399、503、1399、1893、2065、2196 nm的光譜波段十分顯著。原始光譜經SD變換后,在350~1350 nm段相關系數的大小變化不大,1390、1407、1906 nm波段達到極值點。經LR變換后,與原始光譜與有機質的相關系數變化趨勢基本一致,在極值點529 nm處達到極大值后便不斷下降,據曲線走勢的特征點和相關系數大小篩選出535、1072、1303、1502、1702、2109 nm等波段。將所篩選的特征波段作為建立模型的反射波段,見表1。

表1 波段篩選

圖3 有機質與原始光譜及其變換光譜的相關系數
反演模型的精度統(tǒng)計見表2。分析可知,經光譜微分變換后,與原始光譜和最小二乘模型(R-PLSR)相比,一階微分模型(FD-PLSR)反演精度有所提高;二階微分模型(SD-PLSR)和倒數對數模型(LR-PLSR)略低于原始光譜模型,但驗證精度基本接近。比較建模結果,FD-PLSR模型相比于其他3種PLSR模型,估算效果較優(yōu)。FD-PLSR模型建模集的R2比R-PLSR模型高0.12,比SD-PLSR模型高0.21,比LR-PLSR模型高0.21。所建PLSR模型驗證集的R2基本接近,可能受限樣本數量限制,整體PLSR模型的驗證集精度約為0.75,反演結果較理想。此外,FD-PLSR模型的RMSE皆小于其他PLSR模型。

表2 反演模型精度統(tǒng)計
BP神經網絡模型的模擬精度與PLSR模型略有所不同。二階微分與神經網絡模型(SD-BP)明顯優(yōu)于其他組合。其中,建模集的R2比原始光譜模型(R-BP)高0.04,比一階微分模型(FD-BP)高0.08,比倒數對數模型(LR-BP)高0.02。R-BP模型與SD-BP模型驗證集的R2基本接近,比FD-BP模型高0.09,比R-BP模型高0.1。SD-BP模型的RMSE皆小于其他BP模型。
基于65份建模集的土壤有機質含量值與篩選后的特征波段建立PLSR反演模型。4種數據擬合精度排序為:FD>R>SD>LR,二階微分和倒數對數模型略低原始光譜,但與原始光譜建模后估測效果基本接近。預測效果最佳為一階微分變換(R2=0.845 9,RMSE=0.680 6)。BP模型的土壤有機質模擬精度相對較高,但其整體精度略低于PLSR模型。基于BP神經網絡方法,SD變換預測效果更好(R2=0.811 1,RMSE=0.813 7)。可見FD-PLSR模型組合更適用于研究區(qū)反演工作。
圖4、圖5分別為PLSR、BP模型驗證集的實測值-預測值散點圖。比較所有預測模型,FD-PLSR模型效果最為理想。反演公式為

圖4 土壤有機質PLSR模型驗證集的實測值-預測值散點圖

圖5 土壤有機質BP模型驗證集的實測值-預測值散點圖
Y=-1 607.56X399+447.618X503+6 844.013X1399-
1 281.47X1893+2 146.371X2065+
5 337.024X2196+9.07
(3)
本文建模過程中同時分析了不同采樣深度處和不同采樣點位處土樣的有機質含量變化情況,拉張裂隙的形成影響了土壤有機質含量的空間分布。沿研究區(qū)拉張裂隙水平方向兩側,拉張裂隙近端至遠端(C1N—C6N和C1S—C6S)有機質含量呈減小趨勢,在裂隙近端有機質含量較高;沿拉張裂隙垂直方向0~50 cm土壤有機質含量逐層遞減,50~100 cm土壤有機質含量趨于不變。
基于光譜變換、偏最小二乘、BP神經網絡構建了拉張裂隙區(qū)土壤有機質高光譜反演模型。FD-PLSR模型在所建PLSR模型中精度最高,而SD-BP模型在BP模型精度最高。其中,FD-PLSR模型建模集和驗證集的R2分別為0.876 1、0.845 9,RMSE分別為0.497 2、0.680 6。SD-BP模型建模集和驗證集的R2分別為0.784 2、0.811 1,RMSE分別為0.695 5、0.813 7。BP模型預測效果較好,但FD-PLSR模型更適合該研究區(qū)的反演工作。
拉張裂隙對研究區(qū)的有機質空間分布造成了一定影響,裂隙沿裂垂直方向不同土壤深度處(0~50 cm)土壤有機質含量的平均值表現為逐層遞減,50~100 cm土層有機質含量趨于不變。C1N—C6N各點有機質含量平均值逐漸減少,C6S—C1S點有機質含量平均值逐漸增加。研究區(qū)所在的C1裂隙處于坡地,具有一定坡度(2°~3°),地勢北高南低,拉張裂隙橫腰中斷坡地。經重力沉降和雨水沖刷,在裂隙南面(即地勢較低處)形成一定程度的有機質含量聚集,即C1S—C6S有機質含量逐漸增加;受拉張裂隙影響,在裂隙北部近端形成一定程度的聚集,即C1N—C6N有機質含量逐漸減少。
建立PLSR反演模型,發(fā)現4種模型擬合精度排序為:FD-PLSR>R-PLSR>SD-PLSR>LR-PLSR,SD-PLSR模型和LR-PLSR模型略低于R-PLSR模型,但估測效果基本接近。該研究內容與前人相比略有出入,但整體反演較理想。BP模型的土壤有機質模擬精度相對較高,整體精度略低于PLSR模型,對神經網絡模型進一步改進、優(yōu)化算法[19]可能效果更好。神經網絡結合高階微分變換的反演效果是否更佳,后續(xù)研究工作會繼續(xù)展開探討。本文與前人土壤反演研究相比,主要是針對采煤拉張裂隙區(qū)土壤有機質的反演與監(jiān)測工作,而不是基于某一塌陷區(qū)域[20]或某一區(qū)域土地反演[21]。比較建模精度,FD-PLSR模型效果最為理想。