姚志華,陳俊英※,張智韜,譚丞軒,魏廣飛,王新濤
(1.西北農林科技大學水利與建筑工程學院,旱區農業水土工程教育部重點實驗室,楊凌712100;2.西北農林科技大學中國旱區節水農業研究院,楊凌712100)
快速準確地獲取鹽漬土的鹽分信息,對于土壤鹽漬化的監測和防治,實現中國農業的可持續發展具有重要的意義[1]。遙感技術具有響應速度快、成本低以及覆蓋面積大等優勢,已逐漸成為土壤鹽漬化監測領域的一種有效手段[2-5]。早期的研究發現,在電磁波譜的可見光和近紅外區,鹽堿土比普通土反射更多的入射能,具有明顯的光譜特征[6]。Farifteh 等[7]通過建立土壤性質與土壤光譜之間的關系,發現不同鹽度等級的土壤樣品的光譜反射率存在著顯著的差異。Srivastava等[8]則利用印度恒河平原地區的衛星高光譜數據,探究了適宜監測該區域土壤鹽分類型的光譜反射率的波段范圍。盧霞[9]以典型濱海鹽土為研究對象,分析了鹽土的光譜特征和鹽分含量的分布特點。張曉光等[10]則通過建立土壤反射光譜與土壤鹽分含量之間的偏最小二乘回歸模型,探討了利用反射光譜預測土壤鹽分含量的可行性。Allbed 等[11]針對沙特阿拉伯東部地區的土壤鹽化問題,利用IKONOS 遙感影像提取了包含植被指數和土壤鹽度指數的13 個光譜指數,探究了這些指標對于土壤鹽度的預測能力。姚遠等[12]通過光譜變換和波段篩選,最終構建了5 種鹽分指數并以此建立了區域土壤鹽漬化監測模型,達到了良好的監測效果。郭鵬等[13]以山東省墾利縣為研究區,通過構建任意波段的光譜指數進而篩選出敏感光譜指數的方法,構建了土壤鹽分監測的隨機森林(random forest,RF)模型,以實現對該區域土壤鹽分的定量光譜估測。
雖然上述研究已經取得了許多成果,但這些研究大部分是以衛星遙感數據為基礎,衛星遙感技術也是目前為止大區域土壤鹽漬化監測的一種常用手段。由于農田覆膜技術可以改變土壤的水、氣、熱、鹽狀況,促進作物的生長,在河套灌區農業生產中有著廣泛的應用[14]。此外,各種遙感儀器所接收的地表目標反射、發射的電磁輻射能與地表目標的表面溫度、濕度以及粗糙度等性質有著很大的聯系[15],而地膜覆蓋的土壤表面與裸土區域有著不同的光譜特性,因此覆膜會對大區域土壤鹽漬化的準確監測造成一定影響,是一個不可忽略的因素。由于衛星遙感的分辨率相對較低,無法剔除土壤表層覆膜的影響,因此會降低遙感監測的精度。而無人機遙感的時空分辨率相對較高,在剔除覆膜影響方面有一定的可操作性,但關于這方面的研究還未見報道。
鑒于此,本文利用無人機遙感獲取多光譜數據反演農田土壤鹽分含量,同時對遙感影像進行去膜處理并結合機器學習算法構建去膜前后的土壤含鹽量估算模型,通過對不同模型精度作對比分析,探究覆膜對無人機多光譜遙感反演農田土壤含鹽量精度的影響,為利用無人機遙感實施覆膜農田的土壤鹽漬化監測提供一定的科學基礎。
內蒙古河套灌區位于內蒙古自治區西部,是中國設計灌溉面積最大的灌區,也是重要的糧油作物生產基地之一。研究區位于河套灌區解放閘灌域內的沙壕渠灌區,是典型的黃土高原鹽漬土灌區,地理位置介于東經107°05′~107°10′,北緯40°52′~41°00′之間(圖1)。該地區地形平緩,平均坡度約為0.02%,土質類型以粉砂質黏壤土為主。氣候類型為典型的大陸性干旱-半干旱氣候,冬長夏短、干燥多風、晝夜溫差較大。年平均氣溫7.1 ℃,平均相對濕度40%~50%,年均降水量155 mm,年均蒸發量2 000 mm,全年無霜期約130~150 d左右,主要作物包括小麥、玉米、西葫蘆和向日葵等。近年來由于長期不合理的灌溉方式加上平緩的地形以及高蒸發量的自然條件,使得該地區約半數以上的土地都出現不同程度的鹽漬化,嚴重影響了農業生產的發展。

圖1 研究區位置圖Fig.1 Location map of study area
本試驗于沙壕渠灌域內選取4 塊不同鹽分分布的試驗地(1、2、3、4 號地)作為采樣區,每塊試驗地的面積約為16 hm2。試驗地以農田為主,主要種植作物為葵花。試驗于2018年5月和6月分2次進行,這個時期的農田已被覆膜,土壤鹽分向表層聚集且地表綠色植被較少,采樣時間分別為5 月14 日~18 日、6 月15 日~19 日。根據每塊試驗地的鹽漬化程度和地形地貌特點,綜合考慮采樣點分布的代表性、均勻性等因素,在每塊試驗地布置13~14個采樣點,采樣方法為五點取樣法,采樣單元為16 m×16 m,采樣深度為0~20 cm,最終樣本數據為五點取樣的均值,其中5 月份獲得樣本56 個,6 月份53 個,共計獲得109 個試驗數據。同時采用手持GPS 儀記錄相應的位置信息,試驗田及采樣點位置如圖2所示。

圖2 試驗田及采樣點分布示意圖Fig.2 Schematic diagram of test field and sampling point distribution
土壤含鹽量采用電導儀法測量,首先將獲取的土樣烘干研磨后過1 mm 篩,之后按照土水比1:5 的比例配置土壤浸提液,靜置8 h 后采用電導率儀(DDS-307A,上海佑科儀器公司)獲取土壤溶液電導率(EC1:5,dS/m)值,最后通過經驗公式換算得到土壤含鹽量(SSC,%):SSC=(0.2882EC1:5+0.0183)[16],土壤的鹽漬化等級劃分以SSC<0.2% 為 非 鹽 土,0.2%≤SSC<0.5% 為 輕 度 鹽 漬 化,0.5%≤SSC<1.0%為重度鹽漬化,SSC≤1.0%為鹽土,土壤采樣點的具體鹽分統計狀況如表1所示。
1.3.1 遙感數據的采集
遙感平臺為深圳大疆創新科技有限公司生產的經緯M600六旋翼無人機,攜帶的遙感傳感器為美國Tetracam公司生產的Micro-MCA 多光譜相機(簡稱MCA)。MCA最多可安裝6 個通道,對應有6 個鏡頭,可采集6 種不同波長地物光譜反射信息,6 種波長分別為490(藍光)、550(綠光)、680(紅光)、720(紅邊)、800 (近紅外)和900 (近紅外) nm。多光譜圖像的采集時間與土樣的采集時間一致,無人機的飛行高度為120 m,多光譜相機鏡頭垂直向下,影像地面分辨率為0.065 m,無人機每次飛行前在試驗區域布置校正白板,用于對獲取影像的輻射標定。
1.3.2 遙感圖像的處理
使用與多光譜相機配套的軟件PixelWrench2 對獲取的多光譜遙感影像進行提取、配準與合成,最后導出tif 格式的六波段遙感影像。利用Pix 4d軟件將獲取的試驗地單幅遙感影像拼接為全景圖。將獲取的試驗地全景圖導入ENVI 5.3 軟件中,同時按照取樣點標定的GPS信息在圖像中導入取樣點位置信息。以取樣點為中心,在遙感圖像上裁剪出200×200(像素)、地面分辨率為13 m×13 m的遙感影像。同時考慮到遙感圖像中覆膜對光譜反射率的影響,采用監督分類中的最大似然法首先對裁剪的遙感圖像進行地膜和土壤的分類,之后導出只包含土壤層的遙感影像以達到去膜的目的(如圖3 所示)。在ENVI 5.3 軟件中分別提取出取樣點去膜前后的灰度值均值,利用白板的灰度值進一步計算出對應的光譜反射率值。

表1 土壤采樣點的鹽分統計分析Table 1 Statistical analysis of soil salinity of sampling points

圖3 多光譜圖像去膜前后對比圖Fig.3 Contrast before and after removing film of multispectral image
在裸地或者植被覆蓋度極低的土壤中,通過土壤的光譜指數作為間接指標來對鹽漬化區域鹽分進行評價和作圖,已取得良好的效果[17]。而鹽度指數作為直接的鹽度指標,突出了土壤表面鹽殼的光譜反射率,尤其是在電磁波譜的可見光和近紅外范圍內[18]。因此,根據之前得到的土壤表層不同波段的光譜反射率數據,結合參考文獻和經驗,本文選取13 種常見的光譜指數(包括11 種鹽度指數)作為土壤鹽漬化監測模型的備選指標,其計算方法如表2所示。
機器學習算法是隨著計算機技術和互聯網的快速發展,通過計算機模擬或實現人類的學習行為而使計算機程序能隨著經驗的積累自動提高性能,最終實現從大數據中提取特征、發現隱含規律的方法[23]。由于鹽漬化土壤的光譜信息與土壤參數間的轉換函數是復雜的非線性關系,因此有越來越多的學者將機器學習算法應用到土壤鹽漬化反演的模型構建上并取得了較好的效果[24]。本文采用支持向量機、反向傳播神經網絡和極限學習機算法來構建土壤鹽分的反演模型。

表2 土壤光譜指數匯總表Table2 Soil spectral index summary
本次試驗數據的采集時間為2018 年5 月和6 月,需要分不同的月份進行建模和驗證,5 月份可供分析樣本數為56 個,6 月份為53 個,總樣本數為109 個,隨機選取70%的樣本作為建模集,30%的樣本作為驗證集,具體劃分情況如表3所示。

表3 建模集和驗證集Table 3 Modeling and Verification sets
對于模型的建模和驗證精度評估采用以下3 個指標:決定系數R2、均方根誤差RMSE 以及相對誤差RE。R2越大,RMSE 和RE 越小說明模型效果越好,其計算公式如式(1)~式(3)所示。


式中yi為土壤含鹽量實測值,y^i為土壤含鹽量預測值,yˉ為土壤含鹽量平均值,n為樣本數。
將不同數據集中不同波段的光譜反射率與對應的土壤含鹽量進行相關性分析,其相關系數的變化如圖4示。

圖4 光譜反射率與土壤含鹽量的相關系數變化圖Fig.4 Change chart of correlation coefficient between spectral reflectance and soil salinity
從圖5 中可以看出,在波段490、550、680 和800 nm處的光譜反射率與土壤含鹽量的相關性較高,均位于0.5以上,其中680 nm 處的相關性最高,而在720 和900 nm處的相關性則相對較低,這與前人的研究基本一致[25]。從圖中還可以看出,經過去膜處理的光譜反射率與土壤含鹽量的相關性相比未去膜的有所提高,其中5 月份平均提高0.040,6 月份平均提高0.013,總體平均提高0.028。而5 月份去膜處理后的數據在680 nm 波段處的光譜反射率與土壤含鹽量的相關系數最為0.770。
根據不同光譜指數與土壤含鹽量的相關性分析,得到不同處理的13 個光譜指數與對應的土壤含鹽量相關系數,結果如表4所示。
通過分析不同光譜指數與土壤含鹽量的相關系數大小,可以得出對應的相關性顯著程度。由表4 可以看出,無論是5月、6月還是總體,S3、S4、S5、S6、SI1、SI2、SI3、BI這8 個光譜指數與土壤含鹽量均表現出了極顯著相關的相關關系,而S1、S2、SI-T、SR、NDSI這5個光譜指數與土壤含鹽量的相關性則較低。其中,S3和S5與土壤含鹽量的相關系數變化范圍在0.4~0.6 左右,因此,本文擬采用與土壤含鹽量極顯著相關且相關系數r>0.7 的6 種光譜指數即S4、S6、SI1、SI2、SI3、BI 作為最佳光譜指數用于土壤鹽分模型的建模驗證。

表4 不同光譜指數與土壤含鹽量的相關系數Table4 Correlation coefficients between different spectral indices and soil salinity
將不同處理得到的6 波段光譜反射率作為自變量,對應的土壤含鹽量作為因變量,分別利用支持向量機、反向神經網絡和極限學習機3 種機器學習方法建立基于光譜反射率的土壤鹽分估算模型。3種機器學習方法分別使用R 語言軟件中的e1071、nnet 和elmNNRcpp 包實現(下同),相關建模及驗證結果如表5所示。
從表5 可以看出,3 種機器學習模型中,建模集的決定系數均在0.6 以上,均方根誤差均在0.2 以下,均取得了較好的建模效果。而驗證集驗證效果則相對較差,但驗證R2也都達到了0.5 以上,驗證均方根誤差均在0.25以下,相對誤差均在50%以下。同時可以看出,通過去膜處理的數據集建模驗證效果要好于原始的數據集,其中基于SVM 回歸的5 月份去膜數據達到了最好的建模效果,建模R2和RMSE 分別為0.790 和0.154,基于ELM回歸的6 月去膜數據達到了最好的驗證效果,驗證R2和RMSE分別為0.717和0.171。5月未去膜數據的建模驗證效果要好于6月,但通過去膜處理后,6月的數據建模驗證效果有明顯提升,即6月的去膜效果好于5月份。而就3種機器學習方法而言,ELM的建模與驗證效果相對最穩定,建模集和驗證集的決定系數最為接近。

表5 光譜反射率與土壤鹽分的機器學習模型Table 5 Estimation models for spectral reflectivity and soil salinity by machine learning
將2.2 節篩選得到的6 種光譜指數作為自變量,分別與對應的土壤含鹽量建立支持向量機、反向神經網絡和極限學習機機器學習模型,結果如表6所示。
由表6可知,基于不同機器學習方法構建的光譜指數與土壤鹽分的估算模型中,建模集的決定系數都在0.6以上,RMSE 都在0.25 以下,驗證集的決定系數都在0.5 以上,RMSE 都在0.25以下,RE 都在50%以下,通過去膜處理的數據集建模和驗證的效果都要優于原始數據。其中,在6 月份,基于ELM 構建的鹽分估算模型未去膜前的建模R2和RMSE 分別為0.639 和0.198,驗證R2和RMSE 分別為0.617和0.194,通過去膜處理后的建模R2和RMSE分別 為0.663 和0.191,驗 證R2和RMSE 分 別 為0.716 和0.169,去膜前后模型精度提升最為明顯。而就總體數據而言,基于不同機器學習方法構建的鹽分估算模型雖然精度相差不大,但通過去膜處理后的模型精度都有所提升。

表6 光譜指數與土壤鹽分的機器學習模型Table 6 Estimation models for spectral index and soil salinity by machine learning
通過對表5 和表6 的綜合分析可以發現,3 種機器學習模型對基于光譜反射率和光譜指數來反演土壤鹽分均可以達到較好的建模驗證效果,且無論是光譜反射率還是光譜指數,通過去膜處理均能使模型的預測效果有所提升。同時,基于光譜指數建立的鹽分估算模型的穩定性整體要優于直接采用光譜反射率建立的鹽分模型。從表5 可以看出基于光譜反射率建立的鹽分模型的建模R2大多分布在0.6~0.7之間,而驗證R2則大多分布于0.5~0.6之間,從表6 可以發現,基于光譜指數建立的鹽分模型的建模R2大多分布在0.6~0.7之間,驗證R2同樣大多分布于0.6~0.7之間。
基于光譜反射和光譜指數的3 種機器學習模型的預測值和實測值比較如圖5 和圖6 所示。從圖5 中可以看出,在5 月份,基于光譜反射率的3 種機器學習模型的擬合效果相差不多,擬合曲線幾乎重合。而在6 月份用去膜處理后的數據建立的BP 模型和ELM 模型的擬合效果明顯要優于其他模型,曲線斜率更加接近于1。基于總體數據建立的3 種機器學習模型的決定系數均大于0.6,表現出了較好的擬合效果。從圖6 可以看出,就5 月份和總體的數據而言,基于光譜指數的3 種機器學習模型擬合效果相差不大,擬合回歸直線近似于重合分布。而以6 月份的數據建立的預測模型中,通過去膜處理的ELM 模型預測效果最好,擬合方程的決定系數為0.716,未去膜的BP 模型預測效果最差,擬合方程的決定系數為0.611。

圖5 基于機器學習的光譜反射率反演土壤含鹽量預測值與實測值比較Fig.5 Comparison of measured and predicted SSC by spectral reflectance based on machine learning

圖6 基于機器學習的光譜指數反演土壤含鹽量預測值與實測值比較Fig.6 Comparison of measured and predicted SSC by spectral index based on machine learning
本文研究發現無論是直接提取得到的光譜反射率,還是進一步構建的光譜指數,均能夠與實測的土壤含鹽量達到良好相關性,對土壤鹽漬化的定量分析有一定的指示作用,這與前人的研究基本一致[16,26-28],同時發現基于光譜反射率進一步構建光譜指數來反演土壤鹽分的整體反演效果優于直接使用光譜反射率反演。Triki等[29]在突尼斯東南部利用獲取的多光譜遙感數據構建光譜指數反演土壤鹽分,發現SI3和S3與土壤鹽度的相關性最高,而本研究中S3則不是最優指數,可能與試驗區域地理位置及取樣方法的不同有關。Allbed 等[30]在利用IKONOS高分辨率圖像建立基于光譜反射率的土壤鹽分綜合反演模型來反演試驗區鹽分的空間變化時,發現可見光波段中的紅波段能更好地表征土壤鹽分格局和分布特點,而本研究也發現紅光波段與土壤鹽分具有較高的相關性。除此之外,通過去膜處理后的數據建立的鹽分反演模型整體上相較于原始數據,在模型穩定性及反演效果上均有所提升,印證了在無人機遙感監測領域剔除相應的干擾背景的必要性[31]。而在不同月份數據的對比上,出現了5 月份整體數據建模效果優于6 月份但6 月份的去膜效果好于5月份的現象,分析原因可能5月份試驗區只有裸土和地膜,無其他干擾因素,而在6 月份的地膜上已長出部分作物幼苗,使得未去膜地面的光譜反射情況更加復雜,去膜后數據變化幅度更大,去膜效果也就更明顯。此外,不少學者在土壤鹽漬化遙感監測的研究中均引入機器學習方法來建模驗證,并取得了較好的預測效果[24,32],但是在無人機遙感領域的應用則相對較少。因此,本文在建模方法上對機器學習算法的應用不僅是對前人研究方法的肯定,同時也是對相關研究領域的必要補充。
然而,本研究也存在許多不足之處。張同瑞等[33-34]以黃河三角洲為研究區,基于不同光譜參數構建的鹽分估算模型精度的相對誤差RE 變化范圍僅為6.64%~13.64%和18.56%~22.42%。王瑾杰等[35]利用相對誤差RE對艾比湖流域土壤剖面電導率的模型精度進行驗證,認為當RE 小于30%時,模擬效果較好。而本文研究結果中的建模集和驗證集的相對誤差RE 多集中于20%~40%,相較于其他人的研究出現了偏大的情況。但是,由于野外試驗條件的限制以及土壤鹽分分布的復雜性,本研究中在數據采集的過程中難免會出現一些誤差。同時,土壤鹽分數據采集的面積廣、無人機傳感器飛行的高度高等因素都會產生一定的隨機誤差,這些誤差都會導致最終構建的模型精度低于傳統的小區域或近地試驗的精度,因此,本文的相對誤差針對本研究而言,尚在合理的范圍之內,依然具有一定的代表意義。此外,相較于王飛等[36]和哈學萍等[37]基于光譜指數構建特征空間來反演土壤鹽漬化的方式,本試驗缺乏對鹽漬化的空間分布監測。此外,單一的多光譜遙感形式的監測也會導致信息收集的不完整,有不少學者已經開始嘗試使用多種遙感形式來綜合進行鹽漬化的監測,逐漸成為了今后的研究重點[38-39]。最后,由于研究區溫度、氣候、土壤水分等自然條件的差異,本試驗的試驗方法以及研究結論是否適用于其它地區的土壤鹽漬化狀況還有待進一步探討。
1)農田覆膜會對無人機多光譜遙感反演土壤鹽分產生一定的影響,經過去膜處理后的數據構建的模型反演效果要優于原始的數據,基于光譜反射率進一步構建光譜指數來反演土壤含鹽量,也可以提高鹽分模型的反演精度。其中最佳模型的建模R2和RMSE 分別為0.695 和0.182,驗證R2和RMSE分別為0.717和0.171。
2)基于不同處理的不同月份數據構建的鹽分反演模型預測效果不同,基于整體數據構建的模型與各月份數據構建的模型反演效果也有所差異。總體而言5 月份的數據構建的模型反演效果最好,其中最佳模型的建模R2和RMSE 分別為0.792 和0.154,驗證R2和RMSE 分別為0.641和0.195。6月份數據去膜處理的效果最為明顯,其中最佳模型的建模R2和RMSE 分別為0.663 和0.191,驗證R2和RMSE分別為0.716和0.169。
3)比較3 種機器學習方法構建的鹽分反演模型精度,發現ELM 模型的反演效果最好,SVM 模型效果次之,BPNN模型反演效果相對較差。但3種模型均可在一定程度上對土壤鹽分取得不錯的反演效果,表明這3 種機器學習方法在無人機多光譜遙感監測農田土壤含鹽量方面均具有一定的適用性。