999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

河套灌區土壤質地克里金插值與平滑效應校正

2023-03-07 07:33:06萬核洋齊泓瑋尚松浩
農業機械學報 2023年1期
關鍵詞:模型

萬核洋 齊泓瑋 尚松浩

(清華大學水沙科學與水利水電工程國家重點實驗室, 北京 100084)

0 引言

土壤是與人類關系最為密切的環境要素之一,其中的元素遷移、分散和累積受到地域特征的制約,既表現出垂向和區域的結構性,又具有時空上的漸變性[1]。而土壤質地作為土壤的重要物理屬性,在母質、氣候、地形、人類活動等因素的影響下,也會在空間上呈現出特定的規律和結構性。研究土壤質地的空間分布規律,對指導土壤改良、灌溉排水管理、生態農業區劃以及水土資源合理利用具有重要的現實意義,進而為灌區農業可持續發展奠定基礎[1-2]。

土壤質地的空間變異性分析和插值方法有很多,其中基于變異函數理論的克里金法應用最為廣泛,但是克里金法往往會產生平滑效應,即高估較小值卻低估較大值。楊雨亭等[3]研究發現,克里金平滑效應會導致結果無法真實反映土壤水分空間分布的局部特征,李江等[4]在地下水位的克里金插值研究中發現平滑效應對極高值與極低值點的準確預測產生了較大的影響。

決定土壤質地類型的顆粒組成屬于典型的成分數據,在插值中需額外滿足各成分非負且和為常數 (1或100%)的約束條件。AITCHISON[5]提出了對數比轉換的方法用于解決成分數據的閉合問題,后來有學者又進行了大量改進和研究[6-7]。對數比轉換方法有很多種類,主要包括加和對數比(ALR)轉換[5]、中心對數比(CLR)轉換[5]、等距對數比(ILR)轉換[6]和對稱對數比(SLR)轉換[7]。已有研究表明,與直接對原始數據插值相比,對于經過對數比轉換的土壤顆粒組成進行插值的結果更加合理,精度也更高[8-11]。WAN等[8]研究表明ALR轉換對克里金插值結果的平滑性產生了一定影響。但目前不同轉換方法對克里金插值平滑性的影響分析研究較少。

此外,關于非成分數據克里金平滑效應的專門處理方法也有很多研究。隨機模擬是重現區域化變量空間結構的方法,可以避免平滑效應,但是無法保證局部估計精度且結果不唯一[12-13]。OLEA等[13]提出的補償克里金法全局最優性不如隨機模擬,局部精度亦低于傳統的克里金估計。JOURNEL等[14]的后處理方法較好解決了平滑效應問題,但也降低了局部估計精度。YAMAMOTO[15-16]提出的后處理方法會導致插值表面光滑性降低,而且仍局限在克里金法的理論體系內。段建軍等[17]提出的極差平滑率和標準差平滑率等定量指標較好地評估了克里金的平滑效應,并且提出了簡單易行的一元二次回歸模型校正方法,但也存在特征點少、模型穩定性不夠的缺點。目前,在土質插值中考慮組分數據克里金插值平滑效應及其校正的研究較少。

BP神經網絡是一種應用最廣泛的人工神經網絡模型,結構簡單,適用性強,具有較強的非線性函數逼近能力,在數據預測、樣本分類等研究中均有較好的精度及應用價值[18-21]。在克里金插值中驗證點的殘差受到周圍觀測點及其克里金權重的影響,這也是產生平滑效應的原因,而決定克里金權重的變異函數一般是非線性模型,因此基于BP模型尋找殘差與鄰近點的關系就有了可能。

本文以內蒙古河套灌區的土壤質地為研究對象,基于普通克里金法進行空間插值,分析評估不同的對數比轉換方法對克里金插值平滑效應和插值精度的影響,進一步建立基于BP神經網絡的后處理模型,以期能夠較好地改善克里金插值結果的平滑效應,提升插值精度,并得到較為合理的研究區土壤質地空間分布。

1 材料與方法

1.1 研究區概況

河套灌區位于內蒙古自治區西部的巴彥淖爾市境內(40.1°~41.4° N,106.1°~109.4° E),是我國干旱區的最大灌區,也是亞洲最大的一首制灌區,東西長約500 km,南北寬20~90 km,灌區占地 1.21×106hm2,灌溉面積約7.3×105hm2(圖1)。

河套灌區地處典型的中溫帶大陸性季風氣候區,蒸發強烈,降水稀少。年平均氣溫6~8℃,自東向西升高;平均相對濕度40%~50%;年日照時數為3 100~3 300 h;年平均降水量為150~200 mm,自東向西遞減;20 cm蒸發皿年蒸發量 1 900~2 300 mm。河套灌區種植結構十分復雜,作物呈插花式、細碎化分布。其中,春玉米、向日葵和春小麥是河套灌區的主要作物,占總種植面積的85%以上[22]。

河套灌區是由于黃河攜帶大量泥沙在狼山以南的陷落地帶沖刷堆積而形成的沖積平原,土地肥沃,整體上地勢西南高、東北低,高程在1 000~1 090 m之間,該地形特征為自流式引水灌溉提供了天然條件。灌區土壤類型主要以鹽漬化淺色草甸土、鹽土和灌淤土為主,質地偏砂,有機質含量約1%,含鹽量較高。

1.2 土樣采集與顆粒組成測定

本研究采用網格法和隨機法相結合的方式進行點位設計,使得采樣點不僅能均勻覆蓋全灌區,而且采樣點的間距也有大有小,共計采樣298個(圖1)。土樣采集時間為2018年5月、2019年9月和2021年5月,采樣點主要分布于農田內,利用手持GPS進行定位確定采樣點的經緯度,采集表層土 0~20 cm 內的混合土樣作為待測樣品進行室內分析。

采用篩分法和比重計法測定土壤顆粒組成,根據美國農業部土壤質地分類法,利用土壤黏粒(Clay)、粉粒(Silt)和砂粒(Sand)的含量(質量分數),將土壤質地類型分為黏土、砂質黏土、粉質黏土、粉質黏壤土、黏壤土、砂質黏壤土、壤土、粉壤土、粉土、砂質壤土、壤質砂土、砂土。由于灌區內土質不會在短期內發生變化,因此3年的采樣數據一起處理和統計分析,通過R語言編程以及GS+ 9.0軟件進行。

1.3 研究方法

1.3.1成分數據的對數比轉換方法

AITCHISON[5]最早提出成分數據的對數比轉換方法,用以解決成分數據在插值過程中的閉合效應和統計分析問題,后續又經過不同學者改進與發展。目前,對數比轉換方法主要包括加和對數比(ALR)、中心對數比(CLR)、等距對數比(ILR)和對稱對數比(SLR)4種轉換方法,使用時均是先將各顆粒組分通過轉換公式進行變換,然后對變換后的數據進行插值等操作,最后采用轉回公式將結果轉換為原始的成分數據形式,這樣的變換過程能夠保證插值后的土壤顆粒各組分總和為100%,滿足定和、非負等約束。

加和對數比(ALR)轉換公式和轉回公式為[5]

yi=ln(zi/zD) (i=1,2,…,D-1)

(1)

其中

(2)

式中zi——第i種顆粒的質量分數(依次是黏粒、粉粒和砂粒)

yi——轉換后的顆粒i質量分數

yj——轉換后的顆粒j質量分數

D——顆粒組分種類數量,取3

中心對數比(CLR)轉換公式和轉回公式為[5]

(3)

(4)

等距對數比(ILR)轉換公式和轉回公式為[6]

(5)

其中

(6)

對稱對數比(SLR)轉換公式和轉回公式為[7]

(7)

其中

(i=1, 2, …,D)

(8)

式中δi——樣點中第i種顆粒最小質量分數(除0外)的1/2

δj——樣點中第j種顆粒最小質量分數(除0外)的1/2

1.3.2普通克里金法

克里金法是地質統計學的主要內容之一。普通克里金(Ordinary Kriging, OK)是最早被提出和系統研究的克里金法,它實質上是一個線性估計系統,基本原理是利用半變異函數模型來擬合經驗半變異函數,通過無偏估計和最優估計條件建立克里金線性方程式,求解各樣本線性權重,最后用各樣本及其權重表示未知點估計值[23]。

在二階平穩假設條件下,對土壤顆粒組分的普通克里金估計公式為

(9)

式中Z(x0)——位置x0處的土壤顆粒組分估計值

Z(xi)——已知位置xi處的土壤顆粒組分觀測值

λi——權重系數

n——用于估計的已知樣點個數

在無偏和最優的約束條件下,可得克里金方程組

(10)

式中μ——拉格朗日乘數

γ——變異函數

通過式(9)、(10)求解,即可得到權重系數λ,進而求得估計值。插值結果的精度采用交叉驗證法評價,即對任意一個采樣點,利用除該點之外的采樣數據進行插值得到該點的插值結果,其與實測值的差值作為誤差,然后計算1.3.5節的精度評價指標。

1.3.3BP神經網絡平滑性校正模型

BP神經網絡是一種信號向前傳遞、誤差反向傳播的有監督人工神經網絡,適用于非線性分類和回歸問題,由輸入層、隱含層和輸出層組成。

輸入層的特征變量為插值點周圍的觀測值序列。首先確定待插值點的位置,然后通過鄰近法尋找距離插值點最近的n個觀測點,這里的n與克里金插值時所用的插值點數量n保持一致,并將這n個點從近到遠排序;在交叉驗證中,每個采樣點依次進行類似操作,通過匯總,可以得n個向量,每個向量是由距離插值點遠近排序相同的觀測點組成,其元素個數為采樣點總數。比如對于不同插值點,對應距離最近的點組成第1個特征,第2近的點組成第2個特征,依次類推,可以得到n個特征向量。

其次確定輸出變量。在交叉驗證中,獲得每個點的克里金插值結果后,計算插值殘差,以此作為神經網絡模型的輸出變量。

根據交叉驗證的結果,得到訓練數據集,經過反復調整參數得到效果較好的BP網絡模型。對于某個位置的插值結果,將插值點周圍觀測值特征序列輸入模型,即可估算該插值點的殘差,然后結合插值結果,得到校正后的最終插值結果。

1.3.4平滑性指標

克里金插值的平滑效應是指插值后原來的高值被低估,而原來的低值被高估,呈現一種趨中性,因此本研究采用極差平滑率、標準差平滑率指標來衡量平滑效應[17],計算式為

(11)

(12)

式中CR——極差平滑率

CS——標準差平滑率

Ro——采樣點觀測值極差

So——采樣點觀測值標準差

RI——采樣點估計值極差

SI——采樣點估計值標準差

其中,CR和CS越大,說明平滑性越嚴重。

1.3.5精度評價指標

本研究在克里金插值中選擇合適的變異函數模型,需要通過交叉驗證法進行插值精度評估;其次在插值后構建BP神經網絡平滑性校正模型時,需要評估模型精度。采用平均絕對誤差(Mean absolute error, MAE)和均方根誤差(Root mean squared error, RMSE)作為精度指標來評價模型,通常兩個指標的值越小,模型的效果越好。

2 結果與分析

2.1 描述性統計分析

圖2為土壤實測樣本顆粒組成的小提琴分布圖。砂粒、粉粒和黏粒表現出不同的分布特點。其中黏粒含量平均值為15.3%,與中位數接近;粉粒含量平均值為40.5%,低于相應的中位數;砂粒含量平均值為44.2%,高于其中位數。從數據的分布形狀來看,黏粒分布的對稱性更好,粉粒向高值一側偏斜,而砂粒向低值一側偏斜。黏粒含量相對較低,分布集中,粉粒和砂粒含量整體較高,說明土壤黏粒不是該地區主要的控制性組分。另外粉粒和砂粒的分布范圍較廣,幾乎在0~100%內均存在,說明其變異性也較大。從極端值分布來看,黏粒中相對來說存在較多,在高值和低值區均存在,粉粒和砂粒的極端值相對較少。極端值的存在會影響插值結果的平滑性,一般來說,極端值越多平滑性越嚴重。在實際插值中,往往會將這些點視作異常值剔除,但是灌區中的確有沙地存在,為了反映客觀事實和對插值平滑性的探索,本研究保留這些極端值。

圖2 土壤實測樣本顆粒組成分布Fig.2 Distribution of soil particle-size fractions for observed samples

圖3 為對數比轉換前后的土壤組分數據的正態性分布。在轉換之前,粉粒相對來說更接近正態性,黏粒由于兩邊極端值較多而偏離正態曲線較多,砂粒中高值部分偏離了正態曲線。原始土壤組分數據經過不同的對數比轉換后,在正態性上表現各有差異。ALR轉換后的第1成分ALR1除了兩端少數點外的大部分點都在正態曲線上,第2成分ALR2除了較大的極端值偏離較多外,也基本都在正態曲線上。CLR和SLR轉換后的3個成分均各自對應于原始數據的黏粒、粉粒和砂粒組分,CLR1和SLR1表現類似,都是低值部分偏離較多,其他大部分點都接近標準線;CLR2和SLR2也是低值部分偏離較多;而CLR3和SLR3則是高值部分偏離較多,主要是因為原始數據中黏粒和粉粒均存在極端的低值,而砂粒相應存在極端的高值。對于ILR轉換,其中組分ILR1與ALR1類似,大部分值在標準線附近,而ILR2與ALR2不同,主要是極端的低值部分偏離了標準線。

圖3 原始樣本及對數比轉換后數據的正態分位圖Fig.3 Normal quantile-quantile plots for original and logratio transformed data

為了進一步說明正態性的變化,通過Kolmogorov- Smirnov(KS)檢驗得到原始樣本和不同轉換后的數據的p值結果,如表1所示。在剔除極端值之前,對數比轉換前后差別不大,遠不能滿足正態假設;但剔除極端值以后,經過對數比轉換的數據p值更接近甚至大于0.05,正態性明顯得到了改善。綜上可知,原始數據中由于存在離群值的情況,很難完全符合標準正態分布,即使經過對數比轉換也很難使所有數據都靠近標準線,但是可以使除極端值之外的大部分數據更加接近正態分布。

表1 原始樣本及不同對數比轉換后數據的KS檢驗的p值結果Tab.1 p values by KS test for original and logratio transformed data

2.2 基于原始數據的OK插值

首先使用普通克里金法直接對原始的土壤顆粒組分數據進行插值計算,然后對交叉驗證結果進行分析和評估。如圖4所示,對原始數據直接使用OK插值的結果具有較明顯的平滑性,平滑率基本都在0.3以上,其中粉粒的平滑性最大,極差平滑率和標準差平滑率均在0.4以上,黏粒和砂粒的平滑性較為接近,極差平滑率在0.3左右,標準差平滑率在0.35左右。

圖4 土壤顆粒組成原始數據及對數比轉換數據的插值平滑率Fig.4 Smoothing rates for interpolation of original soil particle size fractions and logratio transformed data

圖5為原始數據的OK插值精度評價結果。從圖5可以看出,不同組分的插值精度具有明顯差異,其中黏粒的插值精度最高,平均絕對誤差和均方根誤差分別為4.4%和5.6%。插值精度最差的是砂粒,兩個指標均大于12%,而粉粒精度介于黏粒和砂粒之間,平均絕對誤差為10.5%,均方根誤差為12.9%。

圖5 不同方法插值的交叉驗證精度Fig.5 Comparisons of accuracy indexes of cross-validation for different methods

2.3 基于不同對數比轉換的插值平滑性評估

原始組分數據經過4種不同的對數比轉換后,再用普通克里金插值,然后再使用轉回公式得到最終結果,通過交叉驗證結果評估插值的平滑性(圖4)。與原始數據的直接插值結果不同,經過對數比轉換后的插值結果中,砂粒的平滑性得到了明顯改善,極差平滑率由0.3降低到0.2以下,標準差平滑率也由0.38下降到0.15左右。黏粒的插值平滑性改善效果相對較差,其中極差平滑率甚至大于原始數據,在3個組分中平滑性最嚴重。粉粒則位于兩者之間,其極差平滑率由0.45下降到0.3左右,標準差平滑率也由0.43下降到0.25以下。

不同的轉換方法對平滑性的影響程度也有所不同。從極差平滑率來看,SLR轉換結果的平滑性最大,ALR和CLR相差不大,而ILR轉換結果的平滑性最小,其中黏粒和粉粒分別為0.29和0.30,砂粒僅為0.16。對標準差平滑率而言,規律類似,ILR具有最小的平滑性,黏粒、粉粒和砂粒的標準差平滑率依次為0.22、0.20和0.15??傮w而言,ILR轉換方法在普通克里金插值中對平滑性的改善效果最好。與直接使用普通克里金插值的結果相比, 黏粒、粉粒和砂粒的極差平滑率分別減小5.8%、33.8%和45.6%,標準差平滑率分別減小38.6%、53.9%和60.2%。另外從圖5中可以看出,基于ILR轉換數據的插值(ILR-OK)對各顆粒組分的插值精度影響不大,甚至比直接使用OK還略差,其主要原因是對數比轉換中考慮了組分數據的特性,相當于增加了OK插值的約束條件。

2.4 基于ILR轉換和BP神經網絡的平滑效應校正模型(ILR-BP)

與基于原始數據的普通克里金插值相比,對ILR轉換后的數據插值可以改善平滑性,但還依然存在較大的平滑率,尤其是黏粒和粉粒仍具有接近0.3的極差平滑率,因此需要進一步修正以降低平滑性。在ILR-OK的交叉驗證結果中,將目標點的插值殘差作為訓練目標,同時將目標點插值與周圍鄰近點觀測值的殘差構成的特征向量作為輸入,通過構建BP神經網絡模型擬合兩者之間的關系,不斷調試參數,將具有較好訓練效果的模型作為最終的殘差預測模型。

圖6為3種顆粒組分的殘差預測BP模型的擬合效果。由圖6可見,不同組分的殘差分布不同,黏粒的殘差最小,粉粒次之,而砂粒的殘差較大。另外,散點基本均勻分布在1∶1線兩邊,黏粒的擬合效果相對較好,平均絕對誤差和均方根誤差分別為3.24%和4.61%;粉粒和砂粒由于原始的殘差比較大,變異性強,因此整體擬合效果不如黏粒好。大部分散點主要集中在0值附近,說明大部分插值點的平滑性不明顯,而少數分布在兩端的點是影響平滑性的主要因素,也是決定平滑性修正效果的關鍵點??傮w可見,殘差預測模型的擬合效果在可以接受的范圍內,尤其是對于較大的殘差,即平滑性嚴重的樣點,有較強的擬合能力。

圖6 基于ILR-BP的殘差預測模型評估結果Fig.6 Evaluation results of residual prediction model based on ILR-BP

基于殘差預測模型的預測結果,對ILR轉換數據的交叉驗證結果進行校正。根據平滑性校正前后觀測值與交叉驗證結果的對比(圖7)可以發現,校正后的極差平滑率均為0,并且標準差平滑率也接近0(0.03 ~ 0.07),說明平滑性得到了很大改善,相比只使用ILR轉換,平滑性得到了進一步明顯的削弱。其中粉粒的平滑性效果改善最大,從原來的0.4以上直接減小為0,而黏粒和砂粒的標準差平滑率比粉粒稍大,均為0.07,但總體上平滑性也已很小。從散點分布來看,校正后的散點比校正前分布更加離散,但是更加均勻地分布在1∶1線的兩邊,靠近均值的點變化不大,高值區和低值區的點則均有向1∶1線靠攏的趨勢,更說明了校正模型對極端值平滑性的改善效果。從平滑性校正前后的插值精度對比(圖5)可以發現,經過ILR-BP模型校正后各組分的插值精度均有所提高。黏粒的平均絕對誤差和均方根誤差分別減小29.4%和19.8%;粉粒的精度提高也較為明顯,兩個指標分別減小27.6%和21.0%;砂粒的精度提升效果不如黏粒和粉粒,兩個指標分別減小17.1%和14.6%。因此,校正后的結果在平滑性得到極大改善的同時,還能保證插值精度有所提升。

圖7 平滑性校正前后觀測值與交叉驗證結果對比Fig.7 Comparisons between observations and cross-validation results before and after smoothing correction

由于土壤顆粒各組分是單獨進行插值,平滑性會直接體現在各組分自身上,但土壤質地類型是黏粒、粉粒和砂粒的含量共同決定的,因而各組分的插值平滑性會進一步影響到土質類型的預測結果。為了進一步比較ILR-BP模型校正后與校正前的土質類型變化情況,根據美國制標準,通過土壤質地三角來展示原始樣本數據以及插值平滑性校正前后的交叉驗證結果,如圖8所示。由圖8a可知,原始樣本數據中,共有7種土質,主要為壤質砂土、砂質壤土、壤土和粉壤土,另外還有少量的砂土、黏壤土和粉質黏壤土。直接經過OK插值的交叉驗證結果卻只有4種主要的土質(圖8b),正是因為插值的平滑效應,各組分的結果都向中部集中,使得原始樣本中存在的3種土質消失了。為了避免這種現象的發生,需要進行平滑性校正,校正后的土質分布與原始樣本高度一致(圖8c),首先是分布的離散程度,相比校正前的趨中性,校正后明顯更加分散;其次土質類型也包括了原始樣本中的所有7種土質,但是也出現了個別原始樣本中沒有的砂質黏壤土,主要是因為原始樣本中存在靠近砂質黏壤土與砂質壤土界限的一部分樣點,分類的不確定性大。因此,通過土質類型的對比,可以看出ILR-BP模型校正后的結果能更準確地描述原始樣本中的土壤質地類型。

圖8 原始樣本點及平滑性校正前后交叉驗證結果的土質類型對比Fig.8 Comparisons of soil texture types for original samples and cross-validation results before and after smoothing correction

2.5土壤顆粒組成及質地空間分布基于ILR-BP模型可以對研究區內表層土壤顆粒組分的空間分布插值結果進行校正,如圖9所示,圖中各組分的范圍是根據原始樣本數據設定的。圖9a為直接用OK插值后沒有經過校正的結果,由于平滑效應,插值的預測值都在相應閾值內,而且基本無法顯示出極端值的分布區域。圖9b為經過平滑性校正后的空間分布,黏粒在灌區中部和西部含量較低,在這兩個地方也確實存在黏粒含量幾乎為0的測量樣本,但是校正前的黏粒分布中幾乎不能體現這一特點。另外灌區大部分地區黏粒含量在15%~20%,東部存在零散的地區偏高。粉粒的分布特點與黏粒類似,校正后的分布更加精細,局部特征更明顯,尤其是存在極端低值的樣本區域,大部分地區的粉粒含量在40%左右。對于砂粒而言,幾乎與黏粒和粉粒的分布趨勢相反,主要是因為成分數據的定和約束,砂粒含量在灌區西部和中部偏南的部分地區較高,這也與實際采樣的結果一致。校正前的砂粒分布雖然也有此規律,但是原本的極端高值由于平滑效應而消失了,另外灌區東部存在砂粒含量較低的區域,大部分區域的砂粒含量在50%以下??傮w而言,校正后的顆粒含量空間分布更加明晰準確,局部變異特征更加明顯,更能反映采樣數據的空間特征?;谕寥李w粒組分的空間分布,根據美國制標準,可以計算出相應的土質類型的空間分布,如圖10所示。由圖10a可以看出,主要有4種土質類型,即壤質砂土、砂質壤土、壤土和粉壤土,與原始樣本的主要土質一致,但是沒有反映出其余3種分布較少的土質類型的采樣點特征,這正是由于平滑效應造成的結果。由圖10b可知,灌區中部和西部主要是偏砂性的土壤,與校正前相比,還顯示出了砂土的分布特征;壤土和粉壤土的面積最廣,其中壤土主要集中分布在中西部、東北部和東南部,粉壤土主要分布在北部和南部靠近黃河的地區;除此之外,灌區內還存在零星分布的黏壤土和粉質黏壤土,這與采樣點的土質類型基本一致。因此,經過平滑性校正后,土質的空間分布既能保證整體規律不變,又能反映更加真實的土質類型,呈現出更加明顯的交錯分布特征。

圖9 平滑性校正前后土壤顆粒組成空間分布Fig.9 Spatial distributions of soil particle size fractions before and after smoothing correction

圖10 平滑性校正前后土壤質地類型空間分布Fig.10 Spatial distributions of soil texture types before and after smoothing correction

在河套灌區,平均2~3年農田就會深耕一次,土壤經過上下的頻繁翻動,可以認為作物根系區的土壤質地較為均勻,研究中采用表層0~20 cm土樣具有代表性。根據ILR-BP模型校正之后的河套灌區各土質類型面積及占比情況,如表2所示,壤土和粉壤土的面積占比分別達到41.7%和27.3%,二者覆蓋了2/3以上的灌區面積;砂質壤土次之,占比15.8%;砂土和壤質砂土不到10%;其余3種占比很小,共占1.4%左右。

表2 河套灌區各土壤質地類型面積及相應占比Tab.2 Areas and proportions of different soil texture types in Hetao Irrigation District

3 討論

3.1 插值平滑效應與插值精度的關系

克里金插值中的平滑效應主要指高值低估和低值高估現象,為了定量表示,采用段建軍等[17]提出的極差平滑率和標準差平滑率,從數據離散程度的變化反映平滑效應。插值精度是用來衡量插值結果整體準確度的指標,本研究中采用使用廣泛的平均絕對誤差和均方根誤差來表示。平滑效應和插值精度之間存在一定聯系,但不完全同步變化。

以形式較為簡單的極差平滑率和平均絕對誤差為例。其中極差平滑率主要是通過最大值和最小值的插值前后變化來計算,本質上反映了極端值的插值精度。平均絕對誤差的計算是把所有樣本點的插值誤差都考慮在內,當然也包括極端值的誤差。從這個角度看,極差平滑率是構成平均絕對誤差的一部分。如果經過插值方法改進,極端值的插值誤差雖然減小但幅度不大,而其他樣本點的總誤差增大,那么就有可能導致平滑效應減小而插值精度卻沒有提高的現象,如ILR-OK的插值結果所示。但如果極端值的插值誤差減小的同時,其他樣本點的誤差也都不同程度地減小,那么平滑效應和插值精度就同時得到改善,如ILR-BP的插值結果所示。因此平滑率并不能完全決定插值精度,兩者也不存在絕對的同步變化關系。

3.2 對數比轉換對平滑效應的影響

對數比轉換是處理成分數據常用的方式。由于成分數據具有定和、非負的基本特點,在插值中為了保持這種性質,需要使用對數比轉換公式。此外,轉換前后數據的分布和數據維度會有所改變。根據前人的研究[9,24],對數比轉換一般能夠改善原始數據的正態性,圖3也說明了這一結論。從圖3可以看到,除個別極端值之外的數據,正態性確實得到了改善,但是同時也說明了對數比轉換不能很好處理存在極端值的情況。

對數比轉換還會影響插值結果的平滑性。根據圖4,經過對數比轉換后,土壤顆粒含量插值結果的平滑性大都得到了一定的改善(黏粒的極差平滑率除外)。可能是因為轉換后的數據具有更好的正態性,使得插值結果的統計特征與原始數據更加一致,極差平滑率和標準差平滑率也更小。同時不同的對數比轉換對平滑性影響的程度也不同,但差別不大。從本研究可以看出,ALR和CLR表現相似,主要是因為兩者的轉換形式類似,SLR也是基于ALR和CLR的原理進行改進,表現卻更差一些,但是ILR對平滑性的改善效果非常明顯,可能是因為ILR轉換方法符合Aitchison空間中同度量的轉換,是直接對數據處理的方法[6]。

3.3 ILR-BP模型校正的作用及與其他校正方法對比

克里金插值的平滑效應主要原因包括:首先是克里金插值的本質是局部線性加權平均,插值結果會更靠近局部平均值,因此使用的鄰近點個數會影響插值結果。鄰近點個數越多,結果就會更加穩定地趨向平均值,平滑效應就越明顯,所以不宜使用過多鄰近點,但是鄰近點又不能太少,否則插值結果不能反映空間變異規律。其次與地統計理論有關,克里金插值的算法基礎是變異函數,它能反映區域化變量空間變異的規律,但在實際計算中,是通過擬合經驗變異函數散點得到理論的變異函數模型,而且模型往往是非線性的。在變異函數擬合過程中,會抵消原始數據中的一部分變異性和隨機性,使得插值系數會具有一定的平滑性,最終導致插值結果的平滑性。但總體上還是遵循地理學第一定律,即越近的點對插值結果影響越大。事實上,平滑效應是克里金法的一種固有特點,李超[25]研究指出,應當客觀看待平滑性,要針對具體的研究目的進行分析。

由此可見,鄰近點值的大小和距離插值點的遠近是影響插值結果平滑性的主要因素。所以本研究提出使用按一定空間距離排列的鄰近點序列作為輸入特征,通過BP神經網絡模型訓練,建立鄰近點特征與插值結果殘差的關系,并結合對數比轉換處理,建立了ILR-BP校正模型。ILR轉換主要是為了預處理成分數據,在插值后再使用轉回公式,這個非線性過程改變了數據的統計特征,導致極端值的插值預測比原始數據直接插值好,一定程度上削弱了平滑性。進一步削弱平滑性主要依靠BP神經網絡模型的后處理方法,由于其直接基于殘差規律修正插值結果,大部分樣本點插值誤差都會不同程度減小,尤其是極端值插值結果得到明顯改善,因此平滑性得到了明顯削弱,同時插值精度也有所提升。

ILR-BP模型有以下特點:首先,理論簡單,不需要復雜的統計學理論,只需要找到合適的特征值預測殘差的分布即可。而YAMAMOTO[15]提出的方法是基于標準差數來校正,需要通過一系列的統計計算,稍顯復雜。其次,ILR-BP模型校正效果明顯,在保證插值精度的基礎上,能在很大程度上改善插值的平滑性。YAMAMOTO[15]校正方法中還需要使用克里金法去插值標準差數,從本質上來講還是局限在克里金法之中;段建軍等[17]使用一元二次回歸模型來模擬殘差的規律,雖然較為簡單,但是特征點較少,模型不一定能反映真實的規律;而本文的ILR-BP模型方法是基于機器學習,擬合能力更強。最后,ILR-BP模型方法也存在一定的局限性,即對采樣點的個數有要求,如果采樣點太少,可能無法訓練出較穩定的模型。

3.4 河套灌區土質空間分布的影響因素分析

河套灌區是由于黃河沖積作用形成的沖積平原,因此其中的母質大部分來自于上游的泥沙,整體上土質偏砂性。灌區西部位于河流上游,由于河流運動的分選和沉積作用,上游的顆粒偏粗,而中下游的顆粒更細,因此砂粒主要分布在灌區西部,而中東部更多的是粉粒和黏粒。但是由于人類活動和其他因素的影響,局部也會有異?,F象,比如中部存在砂粒集中的區域,這在河套灌區也較為常見,灌區中零散分布著大小不一的沙丘,這正是黃河沖積作用的見證,后來由于人類耕作活動使得土壤得到了一定的改良。

4 結論

(1)基于對數比轉換的普通克里金法對平滑效應有一定的改善作用,不同轉換方法的改善程度也不相同。ALR和CLR的效果一般,作用類似,SLR的改善作用最小,ILR的效果最好,改善后的黏粒、粉粒和砂粒的標準差平滑率依次為0.22、0.20和0.15。

(2)基于ILR轉換和BP神經網絡相結合的校正模型(ILR-BP)能夠較好地削弱克里金插值中的平滑效應。校正后的土壤組分交叉驗證結果的極差平滑率為0,標準差平滑率為0.03~0.07,同時平均絕對誤差和均方根誤差都有一定的下降,這說明平滑性得到校正的同時,插值精度也有所提高。

(3)校正后的土壤顆粒組成和質地類型的空間分布更加精細,局部特征更加明顯,并且能夠很好地還原樣本的特征,在極端值的表現上更加符合實際。河套灌區中部和西部主要是偏砂性土壤,壤土主要集中分布在中西部、東北部和東南部,粉壤土主要分布在北部和南部接近黃河的地區。

(4)基于ILR-BP的普通克里金法不但能夠解決成分數據空間插值問題,同時能夠削弱插值的平滑效應,得到較為真實的區域土壤質地分布,為河套灌區的水鹽運移研究和水土資源規劃提供了基礎資料。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 日韩精品一区二区三区免费在线观看| 欧美成人aⅴ| 久久 午夜福利 张柏芝| 亚洲va精品中文字幕| 久久精品无码一区二区国产区| 又黄又湿又爽的视频| 亚洲最新地址| 欧美中文字幕无线码视频| 日本免费福利视频| 国产精品主播| 一级香蕉人体视频| 亚洲黄色视频在线观看一区| 亚洲人成网址| 亚洲综合狠狠| 亚洲天堂777| 无码人中文字幕| 国产欧美视频综合二区| 日韩麻豆小视频| 久久精品视频一| 亚洲日本韩在线观看| 亚洲一区二区视频在线观看| 亚洲综合久久成人AV| 国产成人无码Av在线播放无广告| 亚洲色图欧美在线| 黄色一及毛片| 成人在线不卡| 亚洲色图欧美激情| 国内自拍久第一页| 无码丝袜人妻| 特级欧美视频aaaaaa| 91视频首页| 日韩区欧美国产区在线观看| 日韩精品亚洲人旧成在线| 久久精品无码国产一区二区三区| 激情综合网址| 成人亚洲国产| 激情综合五月网| 亚洲精品午夜天堂网页| 国产黄在线观看| 亚洲品质国产精品无码| 露脸国产精品自产在线播| 一级毛片在线播放| 永久天堂网Av| 亚洲精品动漫| 久久精品一卡日本电影| 无码在线激情片| 91精品aⅴ无码中文字字幕蜜桃| 亚洲综合专区| 亚洲最黄视频| 一级黄色欧美| 亚洲欧洲一区二区三区| 国产成人一二三| 亚洲一欧洲中文字幕在线| 欧洲亚洲欧美国产日本高清| 国产成人三级在线观看视频| 国产区福利小视频在线观看尤物| 全午夜免费一级毛片| 日本精品αv中文字幕| 在线看片中文字幕| 19国产精品麻豆免费观看| 色综合色国产热无码一| 国产对白刺激真实精品91| 国产福利免费视频| 免费毛片a| 91亚洲免费视频| 国产成人AV综合久久| 婷婷亚洲视频| 国产清纯在线一区二区WWW| 国产高潮视频在线观看| 色偷偷综合网| 91黄色在线观看| 最新国产成人剧情在线播放| 99这里只有精品6| 欧美中日韩在线| 久久激情影院| 欧美日韩第三页| 55夜色66夜色国产精品视频| 成年片色大黄全免费网站久久| 亚洲精品日产精品乱码不卡| 免费毛片全部不收费的| 亚洲精品日产精品乱码不卡| 欧美爱爱网|