蓋姜坤 解恒燕 鄭 鑫
(黑龍江八一農墾大學土木水利學院,黑龍江 大慶 163319)
降水作為最重要的氣象信息之一,是驅動大陸水文過程的水文循環中最相關的因子[1]。獲取詳盡的空間降水信息是農業生產、水文分析、旱澇災害預測、水資源管理以及生態環境治理的首要任務[2]。降水量主要通過氣象觀測站進行獲取,但由于地形地貌、經濟技術等因素,導致氣象觀測站點存在數量稀疏、分布不均等現象,因此,很多區域缺少詳細且精準的降水信息。根據已知氣象站點觀測的降水量進行空間插值是獲取區域降水數據的常用手段之一[3],主要的空間插值方法有反距離權重法(IDW)、克里金法(Kriging)、樣條函數法(Spline)。莫躍爽等[4]對貴州省17個氣象站點的降水數據進行插值分析,研究表明普通克里金法對月降水量的插值精度最高。解恒燕等[5]對美國Upper Sangamon 流域9 個氣象站點月降水量進行插值分析,結果發現反距離權重法插值效果較好。張瑋瑋等[6]對浙江省68個國家氣象觀測站的氣象數據進行插值,研究發現Anusplin 法的插值精度更高。符靜等[7]對湖南省87 個氣象站點的年均降水量進行插值,結果發現反距離權重法插值精度較高。綜上所述,由于研究區域的地理地形特點,降水空間插值方法具有不同的適用性。黑龍江省烏裕爾河流域地形起伏較大,區域降水較少,而且氣象觀測點稀少,研究該流域的降水空間分布對水資源開發利用、生態環境綜合治理等具有十分重要的意義。本研究以黑龍江省烏裕爾河流域北安段15 個氣象站點2010—2021 年的月降水量為基礎數據,采用反距離權重法、普通克里金法和以高程為協變量的薄板樣條函數法進行降水空間插值,利用留一法交叉驗證比較每種方法的插值精度,選出滿足實際需求的降水插值方法,以期為整個區域降水數據的獲取提供有效途徑。
烏裕爾河流域位于黑龍江省西部(東經125°25'~128°30',北緯47°40'~48°20'),境內地勢東北高、西南低,屬于低山丘陵地區,海拔在100~800 m之間。烏裕爾河流域屬于中溫帶大陸性季風氣候,夏季溫熱多雨,冬季寒冷干燥,多年平均降水量為496.7 mm,6—9月的降水占全年降水量的80%。本研究選取2010—2021年烏裕爾河流域北安段15個氣象站點觀測的逐日降水量,降水資料來源于黑龍江省北安農墾管理局氣象臺,經數據質量控制,保證了觀測數據的連續性和代表性,通過累計求和,計算得到月降水量,經統計分析,該區域降水量具有較高的一致性,氣象站點分布見圖1。

圖 烏裕爾河流域北安段氣象站點位置分布
1.2.1 反距離權重法。反距離權重法(Inverse Distance Weighting,IDW),是以待插點與其他樣本點之間距離為權重的插值方法[8]。該方法是基于“地理第一定律”的基本假設,距離越近,則相似性越高,權重系數越大,反距離權重法計算為式(1)、式(2)和式(3)。

式中:Z(xi)是已知點的實測值;λi是權重系數;Z(x0)是待插點的估計值;di是待插點到第 i 點的距離;n是樣本點的數量;p是指數值。
1.2.2 普通克里金法。普通克里金法(Ordi?nary Kriging,OK),是以變異函數理論和結構分析為基礎,在有限區域內對區域化變量進行無偏、最優估計的一種方法[9]。半變異函數通過曲面函數進行擬合,從而得到最優權重系數,普通克里金法計算為式(4)。

1.2.3 樣條函數法。樣條函數法(Spline)是通過利用最小化表面總曲率來估計待插點的數值[10],本研究采用規則樣條函數擬合插值曲面,樣條函數法計算為式(5)。

式中:Z是估計值;n是樣本點的數量;λi是線性方程的系數;di是待插點到第 i 點的距離;T(x,y)是樣本點的位置。
1.2.4 Anuspian插值法。Anusplin法是基于普通薄盤和局部薄盤樣條函數插值理論,引入線性協變量子模型[11]。本研究以高程為協變量,利用Anusplin 軟件包進行空間插值,Anusplin 插值法計算為式(6)。

式中:Zi是估計值;xi是自變量;f(xi)是光滑函數;yi是協變量;b 是協變量的系數;ei是自變量隨機誤差。
本研究采用留一法交叉驗證來評價插值方法的精度,即預先假設某個觀測點實測數據未知,利用剩余的樣本點的實測數據插值計算,從而得到待插點的估計值,然后計算實測值與估計值的誤差[12]。插值精度的評價指標包括平均絕對誤差(MAE)、均方根誤差(RMSE)。MAE、RMSE 數值越小,則插值精度越高,誤差計算為式(7)、式(8)。

式中:Yi是插值估計值;Xi是實際觀測值;n 是參證點的個數。
分別應用 IDW、OK、Spline、Anusplin 4 種空間插值方法,對烏裕爾河流域北安段15 個氣象站點的月降水量進行插值,通過交叉驗證對插值精度進行評價,得到每個月的誤差結果,平均絕對誤差、均方根誤差分別見圖2、圖3。

圖2 月降水量平均絕對誤差結果

圖3 月降水量均方根誤差結果
由圖2、圖3可知,月降水量MAE的排序為IDW>Spline>OK>Anusplin,其值分別為11.05 mm、10.59 mm、10.52 mm、5.61 mm;RMSE 的排序為 IDW>Spline>OK>Anusplin,其值分別為 13.87 mm、13.27 mm、13.16 mm、7.27 mm。由此可以發現,Anusplin 插值法得到的誤差明顯小于其他3 種插值方法,Anusp?lin 插值法的插值精度最高。4 種插值方法MAE、RMSE 月變化特征明顯,1—7 月呈現上升趨勢,7—12月呈現下降趨勢,這與烏裕爾河流域的月降水分布一致,月降水量越大,則插值誤差也越大。結果表明:對于月降雨量,不論降雨量的多少,Anusplin方法插值效果優于IDW、Spline、OK,4 種方法的插值誤差總體上隨著降水量的增多而增大。
為判斷4 種插值方法對單個氣象站點是否有相同的適用性,選取具有季節代表性的1 月、4 月、7月降水量進行分析,通過對氣象站點估計值與實測值的比較,得到不同氣象站點的最優插值方法,1月、4月、7月降水量的結果見圖4。
由圖4 可知,雖然總體上Anusplin 的估計值較其他三種方法更接近實測值,但就具體站點來說,不同站點的最優插值方法存在季節和站點差異。例如,1月和4月降水量,紅星站點和建設站點實測值分別為19.67 mm、19.20 mm,Spline 預測值(18.65 mm、19.78 mm)較Anusplin 預測值(18.12 mm、20.26 mm)誤差更小;就7月而言,二龍山站點、引龍河站點和趙光站點OK插值方法的誤差最小。對整體插值效果較好的Anusplin并非對每個站點的插值效果都好。

圖4 1月、4月和7月降水量實測值和預測值比較
①從研究區域的整體性來看,Anusplin 方法插值效果優于IDW、Spline、OK,4 種方法的插值誤差均隨月降水量的增多而逐漸增大。
②從研究區域各個站點來看,總體上Anusplin的估計值較其他三種方法更接近實測值,不同站點的最優插值方法也存在季節和站點差異。在1 月、4 月中,紅星站點和建設站點Spline 的誤差最小,在7 月中,二龍山站點、引龍河站點和趙光站點OK 的誤差最小。
由于降水受研究區域地理地形的影響較大,具有空間變異性,將高程等地形因子引入空間插值模型,考慮地理地形對降水的影響,可以提高降水插值精度。以高程為協變量的Anusplin 法適用于地形較為復雜的研究區域,這對我國其他地區插值方法的研究具有一定借鑒意義。