999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的皖北旱作區表層土壤有機質含量估測

2021-06-21 01:35:06楊邵文
黑龍江工程學院學報 2021年3期
關鍵詞:模型

楊邵文

(安徽理工大學 空間信息與測繪工程學院,安徽 淮南 232001)

作為地理環境中的重要組成部分,土壤在人類生存和社會發展過程中具有十分重要的地位[1]。而有機質作為土壤中的重要組成部分,是衡量土壤肥力的重要理化指標,在土壤結構和性狀的改善方面具有重要的作用[2],因此,實現土壤有機質含量的測定顯得尤為重要。傳統的做法是通過實驗室化學分析測定土壤有機質含量,該方法測定的結果較為準確,但是卻存在費時、費力以及耗資較高的問題[3]。由于土壤光譜曲線可以很好地反映出包括土壤有機質含量在內的多種土壤屬性[4],且遙感影像具有獲取簡單、便捷、覆蓋面積廣、時間分辨率較好等特點,為土壤有機質含量的快速監測提供了一個新的途徑[5]。該方法的基本原理是利用有機質的顏色、吸濕作用以及相關化學鍵對土壤反射光譜特征的影響,尋找可見光與近紅外范圍內光譜信息與土壤有機質間的響應關系,以實現基于遙感影像的土壤有機質含量空間估測。

近年來,以統計學中的回歸方法為基礎,在探討涉及土壤有機質的遙感影像反演的過程中,國內外學者進行了大量研究。Guo等人基于高光譜影像通過偏最小二乘回歸(Partial Least Squares Regression,PLSR)等方法實現了全區范圍內的土壤有機碳含量估測[6];Chen等人則是通過對有機碳含量進行對數變換,并利用線性模型實現可見光波段范圍內基于航空相片的研究區有機碳含量估測[7];劉煥軍等人基于多光譜影像的可見光與近紅外波段建立了土壤有機質含量估測模型[8];欒福明等人探討了不同土壤深度范圍內基于多光譜影像建立土壤有機質含量估測模型的可行性[9];喬娟峰等人則是對多光譜遙感影像的反射率進行相應預處理后,對比單波段和多波段模型的估測效果,并進行有機質含量估測模型的優選[10]。上述研究表明,基于遙感影像的土壤有機質快速估測技術具備較高的可行性,均取得了令人滿意的結果。但以上研究多是以單期影像為基礎構建反演模型,忽略了多時相影像中所包含的變化信息,已有研究表明,利用這種多余觀測的方法來豐富光譜信息可有效增強影像中所隱藏的弱信號[11],且在較大范圍的旱作區下,利用支持向量機這一機器學習方法來建立土壤有機質多光譜估測模型的可行性問題鮮有研究。同時,對于建模數據優化、建模方法優選等問題還有待進一步分析。

本文以兩期landsat8 OLI遙感影像為數據源,采用不同的波段變換方法構建光譜參量,嘗試不同的建模數據選取方法,利用不同核函數構建支持向量機(SVM)模型,遴選土壤有機質含量優化估測模型,以期為皖北旱作區土壤有機質含量快速監測的實現提供技術參考。

1 材料與方法

1.1 研究區概況

以坡度小于5°且每平方公里內旱地占耕地比例在40%以上作為界定的依據,確定安徽省旱作區范圍,即皖北旱作區。該區域以平原為主,范圍為東經114°52′~118°11′,北緯32°24′~34°39′之間,涵蓋了宿州、淮北、蚌埠、阜陽、淮南、亳州6個省轄市,四季變化較為明顯、氣候溫和、雨水適中且平均海拔在30 m左右,主要土壤為砂姜黑土,此外還包括褐土和潮土[12]。

1.2 數據采集

以研究區25個縣中的耕地土壤為研究對象,綜合考慮成土條件、土壤環境、土壤類型、耕作方式等自然和人為因素的影響,采用網格布點結合分層抽樣的方法均勻布設土壤采樣點,以確保樣點的代表性與合理性。采樣時間為2017年,采樣深度為0~10 cm,利用GPS對采樣點進行精確定位,采用梅花法、“S”法或棋盤法在每個采樣點所處位置采取混合樣,共采集樣點34個,采樣點具體分布情況如圖1所示。

圖1 研究區位置及采樣點分布

采集到的土壤樣本經自然風干及過篩后采用重鉻酸鉀-外加熱法檢測土壤有機質含量。為確保數據劃分的合理性,采用 Kennard-Stone(K-S)方法[13]基于兩期遙感影像中各樣點對應的光譜反射率劃分建模集與驗證集,比例設為2∶1,其中,建模集樣點23個,驗證集樣點11個。表1為樣點有機質含量統計特征,可以發現建模集樣本整體分布與總體樣本較為相似,具備較高的代表性,而驗證集雖然與建模集相比數值分布較為集中,但均值與總體樣本接近且分布趨勢也較為相似,因此,也可以認為具備較好的代表性。

表1 土壤有機質含量統計特征

1.3 影像預處理

Landsat8 OLI影像共有9個波段,包括分辨率為30 m的海岸波段、藍光波段、綠光波段、紅光波段、近紅外波段和2個短波紅外波段以及1個紅外卷云識別波段,此外,還包括1個分辨率為15 m的全色波段[14],本次主要選用前7個波段作為建模依據。數據級別為L1T級,數據來源為地理空間數據云(http://www.gscloud.cn/)。

由于土壤有機質含量短期內變化幅度較低,為了進一步豐富影像的光譜信息,且考慮到云層和植被對影像反射率的影響,分別選取2017年11月和12月兩期云量低于5%的四景Landsat8 OLI影像作為研究數據,該時期研究區的植被覆蓋度整體相對較低,更易反映出土壤的光譜信息。影像軌道號分別為P122R36、P123R37、P122R37、P121R37,由于受云量影響,11月軌道號為P123R37的影像使用10月30日獲取的影像來代替。對前7個波段進行輻射定標、FLAASH大氣校正、鑲嵌、裁剪等預處理,最終得到研究區的兩期遙感影像,并提取樣點對應的光譜反射率。

1.4 光譜預處理

本文結合已有研究[15],對兩期影像中獲取的7個波段反射率,分別嘗試進行對數、倒數、倒數之對數3種數學變換以及波段組合等預處理以進一步增加光譜參量。其中,波段組合包括比值形式、差值形式、差值倒數形式以及差和與和差比值形式,具體如表2所示,其中,Bi和Bj表示第i和第j波段的反射率,i,j取1到7且i不等于j,每期影像可得到7個原始光譜參量和147個波段變換參量(不考慮正負號),兩期數據共獲得308個光譜參量。

表2 波段變換形式

1.5 建模數據的選取

為探討合理的建模數據選取方法,本次分別將全參量、顯著性參量、極顯著性參量以及基于最優多元逐步回歸模型選取的優化參量作為建模數據,建立研究區土壤有機質含量的估測模型,即基于皮爾森相關系數對采樣點有機質含量實測值與相應光譜參量進行相關性分析,其中,全參量是以所有的光譜參量作為建模依據,顯著性參量是選擇通過P=0.05水平上的顯著性檢驗的光譜參量,極顯著性參量則是僅選取通過P=0.01水平上的顯著性檢驗的光譜參量;而基于多元逐步回歸模型的建模數據選取方法則是基于樣點的實測值與對應光譜參量建立多元逐步回歸模型,選取最優模型對應的光譜參量作為后期的建模依據。

1.6 建模方法與精度評價

由于支持向量機(SVM)具備較好的小樣本學習能力,且能夠很好地處理非線性問題[16],因此,嘗試使用該方法建立土壤有機質含量估測模型,并探討不同核函數下模型的精度變化。支持向量機作為1種內核統計模型,是1種監督類學習方法,它可以依據定義的核函數將輸入數據映射到高維特征空間,以尋找1個滿足分類或回歸的超平面來實現分類與回歸決策[17]。本次分別采用線性函數、多項式函數、高斯徑向基函數作為核函數進行對比分析,其中,多項式函數選擇較為常用的二次和三次多項式,模型的其余相關參數通過網格搜索法結合十折交叉驗證的方式來確定[18]。

選用均方根誤差(Root Mean Square Error,RMSE)和平均相對誤差作為模型精度評價指標,兩者值越小說明誤差越小,估測精度越高。

(1)

(2)

式中:SOMob為樣本有機質含量實測值;SOMpre為預測值;n為樣本數量。

本文所涉及的數據處理與分析均是基于ENVI5.3、Matlab2018以及SPSS20來實現,圖片制作與優化則是利用ArcGIS10.1軟件來完成。

2 結果與分析2.1 土壤光譜與有機質含量相關分析

將有機質含量實測值與對應的308個光譜參量進行基于皮爾森系數的相關性分析,結果顯示在11月的影像中不存在極顯著性相關的光譜參量,顯著性相關的參量共18個,以差值組合及其倒數形式為主,倒數形式居多,此外,還包括紅光波段、短波紅外波段(SWIR 2)以及2個短波紅外波段的3種數學變換形式;在12月的影像中顯著性參量較多,達到42個,其中,極顯著性參量數量達到29個。42個顯著性參量中有25個是差值組合及其倒數形式,分別為12個和13個,還包括1個和差比值形式以及紅、綠波段和2個短波紅外波段及其3種數學變換形式,而極顯著性參量與顯著性參量相比,剔除了紅、綠波段、和差比值形式以及其余形式中的部分光譜參量。最終,基于兩期的Landsat8 OLI影像共獲取60個顯著性參量以及29個極顯著性參量,其中,12月的海岸波段與短波紅外波段差值的倒數形式與有機質含量實測值相關性最高,相關系數絕對值達到0.56。所有顯著性參量的具體信息如表3所示。

表3 土壤有機質含量與光譜參量的相關分析

2.2 基于多元逐步回歸模型的光譜參量優選

根據樣點有機質含量實測值與相應光譜參量,構建多元逐步回歸方程,選取擬合效果最優,即解釋能力最強的模型。該模型下篩選的光譜參量即為多元逐步回歸模型確定的重要參量,將其作為下一步建模過程中的光譜參量,實現優選。此方法共篩選出6個參量,分別是11月影像中海岸波段與藍光波段的和差比值形式((B1+B2)/(B1-B2))、紅光波段與短波紅外波段的比值形式(B4/B6)、紅光波段與藍光波段的比值形式(B4/B2)、綠光波段與紅光波段差值的倒數形式(1/(B3-B4))、近紅外波段與短波紅外波段差值的倒數形式(1/(B5-B6))以及12月影像中海岸波段與短波紅外波段差值的倒數形式(1/(B1-B6))。可以發現入選參量均是經預處理后得到的變換參量,且兩期影像中的光譜參量均有包含。

2.3 土壤有機質含量估測模型及驗證

基于3種核函數與4種建模數據選取方式建立土壤有機質含量估測模型并對驗證集進行精度評定,結果如表4所示。

表4 土壤有機質含量估測模型驗證

由表4可知,各建模方式下估測精度存在一定程度的差異,基于優化參量建立的估測模型取得了最好的估測效果,RMSE普遍在5以下,表明模型具有較好的估測能力,且在多項式函數下的模型取得了最好的估測效果;其次是全參量下的估測模型,該建模方式在多項式函數下也取得了相對較好的估測效果,RMSE位于5以下,MRE最低達到21.55;而基于顯著性參量與極顯著性參量建立的估測模型整體上效果要弱于優化參量與全參量,MRE整體位于25左右,且RMSE均出現大于5的情況。

從建模方法上來看,基于線性函數的估測模型在4種建模方式下均未體現出較為優越的估測效果;基于多項式函數的模型在全參量和優化參量建模形式下擁有最好的估測能力,但在顯著性參量和極顯著性參量建模方式下效果較差,尤其是以極顯著性參量作為建模數據時,二次多項式下驗證集的MRE已經達到30以上,從整體估測效果來看三次多項式下模型估測性能更為穩定;而RBF函數下的估測模型則在顯著性參量和極顯著性參量建模方式下體現出較好的估測效果。

為了進一步探究模型在研究區不同土壤類型下的估測精度,以整體估測效果最優的優化參量建模方式為例,按土類對驗證集樣點進行劃分,分析各模型在3種主要土壤類型下的估測效果,結果如表5所示。從土類來看,估測模型在砂姜黑土和褐土中的估測效果較好,MRE與RMSE均處于20和4以下,而潮土的效果整體較差,其MRE與RMSE均分別處于30和7以上。從建模方法上來看,在砂姜黑土和褐土中,三次多項式下的SVM模型依然取得了很好的估測能力。而在潮土中,RBF函數下的SVM模型則取得了相對最好的估測結果,但考慮到潮土下各模型的MRE均位于35附近,因此,4種建模方法并無較大差異。綜合來看,三次多項式下的估測模型在3種土類中的整體估測效果較好。

表5 優化參量下不同土類的有機質含量估測模型驗證

2.4 研究區土壤有機質空間格局分析

基于上述各建模方式和建模方法以及不同土類下驗證集的估測效果,遴選優化估測模型,最終決定以優化參量建模方式下的三次多項式SVM模型對研究區進行全區范圍內的表層土壤有機質含量估測。為防止異常值和水體的干擾,利用ENVI中的band math功能實現土壤相關區域的掩模,其中,考慮到研究區土壤養分的實際情況以及未經處理前有機質含量反演圖中像元值的分布情況,將非異常值范圍設為0~50 g·kg-1以去除少數異常值,而水體的掩模圖像則是基于歸一化水體指數(Normalized Difference Water Index,NDWI)來制作,最終得到皖北旱作區的土壤有機質含量空間格局特征,并以全國第二次土壤普查養分分級標準為依據對皖北旱作區的土壤有機質含量進行分級。其中,小于6 g·kg-1為六級,6~10 g·kg-1為五級,10~20 g·kg-1為四級,20~30 g·kg-1為三級,30~40 g·kg-1為二級,大于40 g·kg-1為一級(見圖2)。

圖2 研究區土壤有機質含量反演

由反演結果可得,全區土壤有機質含量以三級和四級為主,分布較為廣泛,其中,三級面積占比最高,在6個等級土壤的總面積中占比為62%左右,四級則為26%。而一級、五級和六級占比較低,三者在總面積中的占比大約為4%。二級分布則較為分散,其在研究區的東北部相對較為明顯。綜合分析可得,皖北旱作區土壤有機質等級基本位于四級及以上,各級土壤在全區均有分布,且東北方向有機質含量整體較高,而南部地區整體較低。

3 討論與結論

3.1 討論

研究結果表明,紅、綠及兩個短波紅外波段與土壤有機質含量存在顯著的負相關關系,且7個原始波段經進一步預處理后相關性可以得到進一步提升,尤其是在波段組合形式下存在較為顯著的相關性,相關系數絕對值最高達0.55以上,而從篩選的優化參量也可以發現,基于波段組合的光譜參量對土壤具備更好的解釋能力,這表明對原始波段進行這種波段組合的變換后可以有效減小地形、大氣對光譜數據的影響[19],更好地凸顯出光譜與土壤有機質含量間的關系。值得指出的是,篩選的優化參量與顯著性參量存在差異,在確定的6個優化參量中,僅2個存在顯著性相關,這可能是因為顯著性參量是利用基于雙變量的相關性分析選取的,而多元逐步回歸模型綜合考慮到每個入選變量的重要性[20],篩選出的是解釋程度較高且相互之間相關性較低的參量組合。此外,篩選的優化參量包含兩期影像的光譜參量,則表明利用多期影像可有效解決多光譜數據信息量較少的問題,提升光譜數據對土壤屬性的解釋能力[21]。

不同核函數的SVM模型在各建模方式下的估測效果也存在差異,可以發現線性函數下估測模型由于核函數較為簡單,對數據的敏感性較差,整體估測效果并不突出。而多項式函數和RBF函數下的部分模型則體現出更好的估測效果,這表明相較于線性函數,多項式函數和RBF函數在小樣本學習下具備一定的優勢;而從建模方式上可以看出,相較于選取顯著性參量建立估測模型,將整體解釋度較高的全參量和優化參量組合作為建模數據應是更理想的選擇,其中,在優化參量建模方式下取得了最好的估測結果則表明在保留較強解釋度的前提下,考慮光譜參量之間的多重相關性,實現建模數據的降維可進一步提升估測精度;在不同土類下,估測模型也體現出不同的估測效果,結果表明模型對砂姜黑土和褐土的估測精度整體較高,對潮土的估測能力卻較差,這可能是受影像的光譜分辨率以及采樣點數量的影響,更多的光譜信息與樣本數據理論上可以增強潮土下模型的學習效果,因此,在建立有機質含量的估測模型時可考慮增加潮土采樣比例或選用波段數量更多的遙感影像以提升潮土的估測精度。同時值得注意的是由于皖北旱作區面積較大且基于遙感影像獲取的光譜數據受大氣條件、影像分幅等多種因素的影響,如何進一步提升模型的估測精度還有待于進一步分析[22]。

3.2 結 論

本文以兩期Landsat8 OLI遙感影像為數據源,結合有機質含量實測值探討在不同的建模方式和建模方法下建立皖北旱作區有機質含量估測模型的可行性,得到以下結論:

1)紅、綠、短波紅外波段與表層土壤有機質含量存在較高的相關性,且對兩期影像的7個原始光譜反射率進行基于波段組合的變換后可以更好地實現研究區土壤有機質含量的估測。

2)相較于選擇顯著性參量,利用全參量以及優化參量可以更好地反應出光譜參量與土壤有機質含量間的關系,實現更高精度的估測,且在優化參量建模方式下模型的估測效果更好。

3)在不同的建模方式下可結合不同種類的核函數以提升SVM模型的估測精度,其中,基于優化參量建立的三次多項式核函數下的估測模型可以更好地實現研究區內土壤有機質含量的快速估測,整體上具有較好的估測效果,其反演結果可以為耕地質量評價、土壤肥力估算提供一定的參考。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产精品999在线| 亚洲色图欧美视频| 九九热精品在线视频| 国产91精选在线观看| 中文字幕无码av专区久久| 理论片一区| 国产欧美专区在线观看| 日本免费精品| 国产精品综合久久久| 国产亚洲精| 免费毛片视频| 国产成人精品无码一区二| 国产一区二区福利| 国产毛片一区| 国产成人8x视频一区二区| 欧美成人一级| 欧美无专区| 中文字幕日韩丝袜一区| 亚洲欧美极品| 久久精品国产91久久综合麻豆自制| 色综合天天娱乐综合网| 亚洲人成影院午夜网站| 亚洲男人天堂2020| 少妇精品网站| 一级片免费网站| 国产在线欧美| 亚洲人成网站在线观看播放不卡| 91精品专区国产盗摄| 亚洲欧美日韩成人在线| 久久精品午夜视频| 亚洲人成影视在线观看| 欧美日韩国产精品综合| 中文字幕乱妇无码AV在线| 国产精品伦视频观看免费| 亚洲天堂首页| 国产va视频| 国产迷奸在线看| 日韩无码精品人妻| 国产在线高清一级毛片| 欧美人与牲动交a欧美精品| 欧美日韩午夜| 亚洲日韩久久综合中文字幕| 日韩中文无码av超清| 制服丝袜 91视频| 免费看的一级毛片| 成人无码一区二区三区视频在线观看| 最新亚洲人成无码网站欣赏网| 在线观看欧美国产| 都市激情亚洲综合久久| 福利姬国产精品一区在线| 亚洲欧美成aⅴ人在线观看| 日本高清有码人妻| 国产99精品久久| 在线播放91| 国产小视频免费观看| 国产精品精品视频| 国产一线在线| 中文字幕在线看| 国产毛片基地| 先锋资源久久| 国产乱人伦精品一区二区| 午夜电影在线观看国产1区| 欧美一区福利| 国产一级毛片yw| 精品国产成人a在线观看| 毛片大全免费观看| 一区二区三区四区精品视频| 欧美日韩国产成人高清视频| 亚洲欧美综合在线观看| a在线亚洲男人的天堂试看| 国产成人高清精品免费5388| 免费观看精品视频999| 在线观看无码a∨| 日本午夜视频在线观看| 久久www视频| 色悠久久久| 久久精品中文字幕免费| 伊人成人在线| 中文字幕永久在线看| аⅴ资源中文在线天堂| 亚洲av无码成人专区| 精品超清无码视频在线观看|