曾廣建
(廣東省水文局汕頭水文分局,廣東 汕頭 515041)
降雨是研究流域或地區水文循環系統的關鍵要素,對于工農業生產、水利開發、江河防洪和工程管理等方面作用很大,降雨量的多少直接影響到人類的生產和生活。受地形地貌、技術手段、財力等因素限制,大部分地區空間位置上的雨量數據是無法實測獲取的。根據已有的地面離散站點的降雨數據,選擇合理的空間插值方法得到整個區域的降雨空間分布是研究者探索的熱點[1-6],如房林東等研究了反距離權重插值法在貴州西部地區插值分析,得出在山區、平原混合地形區,普通的反距離權重插值法精度較高[1];王旭等研究了自適應距離的反距離權重法,并在灤河流域進行了應用[2];吳曉燕等應用5種插值方法對新疆天山山區降雨量進行分析,得出西部復雜山區考慮地形因素的協同克里金法最優[3];莊立偉等對東北降雨量數據進行空間插值方法比較,認為IDW插值方法優于克里金插值法[4]。
已有研究表明[4-7,11],由于研究區域、數據集、時間尺度等的差異,不同的插值方法適應性不同,無普遍適用的插值方法和固定的參數取值。大多數研究者在平坦內陸地區或者中等尺度的復雜山區進行分析,在沿海地區進行分析的較少,而粵東地區地勢北高南低,西北部和東北部主要是山地丘陵地帶,平原主要分布在南部和東南部沿海地帶,這種復雜的地形及沿海氣候特征,受地形因子、氣候多變、技術手段和現有站點數目少等多種因素的限制,致使對粵東地區降雨空間分布特征的認識不完整,制約了該地區與降雨規律相關的各種水文分析研究,因此積極探索一種適用于粵東地區的降雨插值方法是必然的、迫切的。本文以粵東地區70個雨量站點1980—2019年降雨資料為基礎,采用反距離權重法(IDW)、徑向基函數插值法(RBF)、普通克里金插值法(OK)、回歸克里金法(RK),分別對粵東地區降雨量進行空間插值計算,采用站點驗證法進行插值結果評估,尋求最適合該區域的降雨空間插值方法,為進一步研究粵東地區水文模型、水生態環境、水資源管理等工作奠定數據基礎。
粵東地區地處廣東省東南部,南臨南海,北靠蓮花山脈,地勢北高南低,西北部和東北部主要是山地丘陵地帶,平原主要分布在南部和東南部沿海地帶,包括汕頭、潮州、揭陽、汕尾4個地級市,總面積為 15 516萬km2。屬東南亞季風區,雨熱同季,是全國光、熱和水資源較豐富的地區,降雨主要集中在4—9月。受海洋性東南季風影響,雨量充沛,其中海豐、陸豐、揭西等雨量高區是省暴雨高區之一?;洊|沿海也是西太平洋和南海熱帶氣旋和臺風經常登陸及影響的地區,風暴潮災害時有發生。
數據為粵東地區70個省水文局參編雨量站點40 a(1980—2019年)的逐月降水資料和坐標數據,時間序列連續,滿足可靠性;樣本容量大于30 a,滿足代表性;對逐月降水資料進行統計處理,計算各站點年平均降水量和月平均降水量,并驗證其正確性。
數字高程模型(DEM)為ASTER GDEM,是由NASA和MFTI于2009年6月共同發布的最新的全球高程數據。覆蓋了99%的地球陸地面積,是迄今最完整的DEM數據。該DEM數據水平分辨率為30 m,垂直精度為±20 m,置信度均為95%[12]。利用ARCGIS軟件進行數據拼接和掩膜裁剪得到粵東地區數字高程模型(見圖1)。

圖1 粵東地區雨量站點分布示意
本文中站點海拔高度、坡度、坡向等地形因子的提取、計算及降水量的空間插值和制圖都在GIS軟件ArcMap10.5下進行;多元線性回歸分析采用SPSS軟件。
采用站點檢驗法分別對4種方法在粵東沿海地區的插值結果進行評估。選取58個站點作為樣本點用于降水插值計算,另12個站點數據作為實測值對空間插值得出的預測值進行誤差分析。采用平均絕對誤差(MAE)、均方根誤差(RMSE)、皮爾遜相關系數(PPMCC)3種指標進行評估[13]。
(1)
(2)
(3)
式中:
Rei、Roi——第i個站點的預測值和實際觀測值;

σe、σo——降雨量預測值和觀測值的標準差。
影響降水的因素很多,如地理位置、大氣、地形、洋流、植被及水文狀況、人類活動等。多元線性回歸常用于一種現象與多種因素相聯系,由多個自變量的最優組合共同來估計因變量,比只用某一個自變量進行估計更有效,更符合實際,用這種方法估算降水量不依賴于周圍站點的密度,在各因子相關較強的情況下可以得到精度較高的模擬結果[14]。
本文將58個樣本點的月平均降雨量、年平均降雨量分別與站點的經度、緯度以及通過DEM提取或得的坡度、坡向、海拔高度進行線性回歸分析。表1中列出了粵東地區平均年降水量和平均月降水量分別與各地形因子的多元線性回歸方程的回歸系數??梢钥闯觯骄邓颗c經度顯著負相關,尤其是年平均降水量和3—10月的月平均降水量,系數范圍為-479.121~-15.724,表明平均降水量隨著經度的增加而減少,遞減率為479.1 mm/10E;月平均降水量在1—4月、7—10月和年平均降水量與緯度表現為正相關,系數范圍為4.825~130.854,表明平均降水量大部分時候是隨著緯度增加而增大;平均降水量與海拔高度全年表現為正相關,其中在1月、2月、7—12月以及年平均降水量表現為顯著正相關,系數為0.013~0.523,表明降水量隨海拔升高而變大;而平均降水量與坡度、坡向相關性都較差。綜合得出,平均降雨與某一地形因子相關性并不是很穩定,隨季節的變化存在差異性,而平均雨量與多地形因子構成的復相關系數全年除11月之外都為顯著相關,復相關系數為0.327~0.763,明顯優于某一地形因子相關性。

表1 粵東地區平均降水量與各地形因子的多元線性回歸方程的回歸系數
經上述分析,平均降水量及其變化情況需要通過經度、緯度、坡度、坡向海拔高度這些地形要素有效組合才可以反應出來,因此平均降水量的多元線性回歸方程可表示為:
R=aE+bN+cS+dA+eH+Q
(4)
式中:
R——降水量;
E、N、S、A和H——分別是經度、緯度、坡度、坡向和海拔高度;
a、b、c、d、e——回歸系數;
Q——常數項。
表2為粵東地區月、年平均降水量多元線性回歸模型。

表2 粵東地區各月及年平均降水量多元線性回歸模型
2.3.1反距離權重法(IDW)
反距離權重法以待插值點到樣本點間的距離為權重進行加權平均,認為與插值點距離越接近的若干樣本點的權重越大,其貢獻與距離成反比[6]。缺點是其計算值易受數據點集的影響,從而使計算結果常出現孤立點數據明顯高于周圍數據點的情況[7]。
2.3.2徑向基函數插值法(RBF)
徑向基函數插值法一種精確插值器,可以根據大量數據點生成平滑表面,可預測大于最大測量值和小于最小測量值的值。有薄板樣條函數、張力樣條函數、規則樣條函數、高次曲面函數、反高次曲面函數五種基函數,這些函數可為平緩變化的表面生成很好的結果。缺點是表面值在短距離內出現劇烈變化和懷疑樣本值很可能有測量誤差或不確定性時這種插值方法不適用。
2.3.3普通克里金插值法(OK)
普通克里金是最早被提出和系統研究的克里金法,并隨著地統計學的發展衍生出一系列變體和改進算法[8]。通過利用區域化變量的原始數據和變異數據的結構特點對未采樣點的取值進行線性無偏最優估計[5]。
2.3.4回歸克里金插值法(RK)
回歸克里金是線性回歸模型和克里金法相結合的算法,也是最常見的混合算法[9]?;貧w克里金首先使用建立輔助變量與目標變量之間的回歸方程,然后利用回歸方程對目標變量進行預測,并計算目標變量的殘差,對殘差進行克里金插值后,將殘差的插值數據加到目標變量的回歸值中從而得到一個新的預測值[5]。
本文中IDW插值冪指數為2,站點最大搜索范圍為臨近15站,最小范圍為臨近10站;RBF插值中,利用GIS地統計工具依次對5種徑向基函數進行插值預測,經交叉驗證誤差比較得出采用薄板樣條函數進行插值效果最佳;對于OK插值,在考慮方向性的前提下依次利用GIS地統計工具對3種理論半方差模型進行了對比分析,得出在不考慮向異性的前提下用球面函數插值效果最佳;RK插值法由趨勢項和殘差項構成,趨勢項為以降雨量為因變量,經度、海拔高度為自變量,建立的線性模型,殘差項為對殘差建立的克里金模型。4種插值結果見表3,站點檢驗法的各項誤差及相關系數見表4。

表3 12個檢驗站點年平均降水量不同插值方法結果

表4 4種插值方法的檢驗誤差及相關系數
綜上,考慮MAE和RMSE時,優劣順序均為RK>RBF>OK>IDM,4種插值方法的預測值與實測值的相關系數都表現為顯著相關。在年平均降水插值中,考慮了經度、緯度、高程、坡度和坡向的回歸克里金法(RK)插值精度最好,其次是RBF法,再者是OK法,最差的為IDW法,分析原因為粵東地區為平原和山區混合地形,經緯度、海拔高度等地形因子對降水影響明顯,RK法比較全面的考慮了這些影響因子,又通過較好的半方差模型的普通克里金插值法來修正殘差,因此得到較好的插值效果(4種插值方法分別生成的粵東區域年平均降水量空間分布示意見圖2)。
由圖2可以看出,粵東地區雨量北多南少,西北部和東北部主要山地丘陵地帶降雨量豐富,成為粵東地區降雨最多的地方,南部和東南部沿海地帶的平原地帶雨量最少。RK插值法受回歸變量影響明顯,呈現出與經度顯著負相關,與海拔高度正相關,導致模擬的降水量存在空間變異比較大,有大數值雨量區分布在海拔較高地帶(圖2 a中的紅色部分),但也在一定程度上說明高海拔區域的小范圍氣候特征,且最大值大于其他3種插值方法模擬的降水量最大值500 mm左右,可以得出線性模型會造成模擬數據出現不太符合實際的極值情況,但現有站點并不能有效驗證這種情況[5]。OK插值和RBF插值法模擬結果圖表現為降水的空間連續性很強,總體趨勢平滑且相近,插值結果基本一致。IDW插值法模擬結果圖都有明顯的極小值點,有圓形區域和條帶區域[5],即有明顯的“鋸齒”和“牛眼”現象[10]。

a 回歸克里金插值法
為了研究不同的插值方法在豐水期和枯水期時的插值效果,使用年平均降水相同的插值方法及參數,分別對58個樣本站點月平均降水進行插值計算,采用MAE、RMSE、PPMCC3種指標對12個檢驗站點實測值和預測值進行評估,結果見圖3。

a MAE
由圖3可得,RK插值方法整體精度最高,MAE為1.98~21.50 mm,均值為9.85 mm,RMSE為2.57~28.23 mm,均值為13.46 mm,PPMCC為0.797~0.951,全年表現顯著相關;其次為OK插值方法,MAE為2.78~22.70 mm,均值為10.06,RMSE為3.63~29.90 mm,均值為13.84 mm;再者為RBF插值方法,MAE為2.50~24.13 mm,均值為10.68,RMSE為3.28~31.13 mm,均值為14.18 mm;IDW插值方法精度最差,MAE為2.49~27.37 mm,均值為12.60 mm,RMSE為3.42~34.40 mm,均值為16.07 mm。在豐水期(7—9月,月降雨量大于200 mm),RK插值方法精度高的效果明顯好于IDW、RBF法,和OK法,5月、6月,OK法略優于RK法;在枯水期,1月、12月(月平均降雨量小于40 mm),IDW插值法效果最好,略優于RK法,指標PPMCC值更是在1月為0.965,為所有月份中擬合程度最好的;而在2月、3月,RBF插值法效果最佳。從圖3中還可以看出,無論采用何種插值方法,不同月份插值精度相差較大,例如反映預測值和實測值的擬合程度的指標PPMCC在1月份為0.924~0.965,而在10月份為0.732~0.797,這說明插值精度不僅僅取決于插值方法還與數據本身的自相關性等有關系。
以70個雨量站點40 a降水資料為基礎,采用IDW插值法、RBF插值法、OK插值法、RK插值法,對粵東地區年平均降水量和月平均降水量分別進行空間插值,采用站點驗證法對插值結果進行評估研究,主要結論有:
1) 將月平均降雨量、年平均降雨量分別與站點的經度、緯度以及通過DEM提取或得的坡度、坡向、海拔高度進行線性回歸分析。得到平均降水量與經度顯著負相關,在豐水期表現尤為明顯;與緯度在1—4月、7—10月和年平均降水量表現為正相關;與海拔高度全年表現為正相關,其中在1月、2月、7—12月以及年平均降水量表現為顯著正相關;與坡度、坡向相關性都較差。綜合分析得出,粵東地區平均降雨與某一地形因子相關性并不是很穩定,隨季節的變化存在差異性,需要通過經度、緯度、海拔高度這些地形要素有效組合才可以反映出來。
2) 在年平均降水插值中考慮了經度、緯度、海拔高度的RK插值法精度最好,其次是RBF法,再者是OK法,最差的為IDW法,分析原因為粵東地區為平原和山區混合地形,經緯度、海拔高度等地形因子對降水影響明顯,RK插值法比較全面的考慮了這些影響因子,又通過較好的半方差模型的OK插值法來修正殘差,因此得到較好的插值效果。
3) 在豐水期,RK插值法和OK插值法精度明顯好于RBF和IDW插值法。在枯水期,四種插值方法精度都比較高,RBF插值法和IDW插值法效果略好。