□張 昊 楊艷玲 趙子岳 趙 偉 韓姝嫻
插值可以根據有限的樣本數據點預測柵格中的像元值,可以預測任何地理點數據(如高程、降雨、化學物質濃度等)的未知值。常用的插值算法有克里金法、反距離權重法、含障礙的樣條函數、樣條函數法、自然鄰域法、趨勢面法等,各種插值算法均能根據有限測量樣本數據點實現插值功能,但基于各算法內在屬性,插值成果各有優劣。
利用一二維耦合數學模型進行洪水演進的分析,對模型模擬范圍內地形插值是必不可少的關鍵步驟,而插值后地形場文件的精度對水位、水深、流速等計算成果影響較大,因此根據測量數據的精度及研究區域的具體情況合理選擇插值算法具有一定的推廣應用價值。插值示意圖見圖1。
此文以滹沱河(南水北調—機場路)高標準行洪區為研究對象,利用MikeFlood、Arcgis、Surfer 等 插 值 軟 件,通過采用不同插值算法對該區域地形場文件進行插值研究發現,平原區域河道高標準行洪區(分洪區)制作地形場文件時,根據測量數據特點進行合理分區,對插值算法進行組合應用可得到較為合理、準確度較高的插值結果。

圖1 插值示意圖
高程數據插值作為空間數據內插的一個重要方面,在二維數學模擬、地形圖dem 制作中均有著廣泛的應用。而高程插值方法也已經成為一個重要研究方向。目前可采用的插值算法種類較多,可選用的工具軟件也較多,此文主要借助Mike、Arcgis、Surfer 三款軟件,選取反距離權重法、自然鄰近插值算法、克里金法進行研究。
利用Arcgis 工具箱進行插值時,還可利用障礙選項,指定將中斷表面連續性的線狀要素的位置。例如行洪區域內的堤壩、道路等線狀阻水構筑物,以期剔除其對插值產生的不良影響,障礙要素作為折線要素輸入即可。
使用一組采樣點的線性權重組合來確定像元值。權重是一種反距離函數。此方法假定所映射的變量因受到與其采樣位置間的距離的影響而減小,主要依賴于反距離的冪值,冪參數可基于距輸出點的距離來控制已知點對內插值的影響。通過定義更高的冪值,可進一步強調最近點。因此,鄰近數據將受到最大影響,表面會變得更加詳細,隨著冪數的增大,內插值將逐漸接近最近采樣點的值。指定較小的冪值將對距離較遠的周圍點產生更大影響,從而導致更加平滑的表面。缺點在于由于反距離權重公式與任何實際物理過程都不關聯,因此無法確定特定冪值是否過大。若采樣對于正在嘗試模擬的本地變量來說足夠密集,則基于反距離權重法會獲得最佳結果。

圖2 網格剖分示意圖

圖3 模型區域實測地形數據分布示意圖
該方法可找到距插值點最近的輸入樣本子集,并基于區域大小按比例對這些樣本應用權重來進行插值。該方法的基本屬性是具有局部性,僅使用插值點周圍的樣本子集,且保證插值高度在所使用的樣本范圍內。該方法不會推斷趨勢且不會生成輸入樣本尚未表示的山峰、凹地、山脊或山谷,但插值生成表面將通過輸入樣本且在除輸入樣本位置外其他位置均是平滑的。所有點的自然鄰域都與鄰近Voronoi(泰森)多邊形相關。相比之下,基于距離的插值器工具(如反距離加權)會根據距插值點相同的距離為最北部點和東北部點分配相同權重。而自然鄰域法插值會根據重疊百分比為其分別指定權重。
通過一組具有z 值的離散點生成插值表面的高級地統計過程。與其他插值方法不同,選擇用于生成輸出表面的最佳估算方法之前應對由z 值表示的現象的空間行為進行全面研究。假定采樣點之間的距離或方向可以反映可用于說明表面變化的空間相關性。可將數學函數與指定數量的點或指定半徑內的所有點進行擬合以確定每個位置的輸出值。在反距離權重法中,權重λi 僅取決于預測位置的距離。而使用克里金方法時,權重不僅取決于測量點之間的距離、預測位置,還取決于基于測量點的整體空間排列。
研究范圍西起南水北調、東至機場路,南北分別以滹沱河南堤和石黃高速為界,本段滹沱河河段全長約24km,為石家莊“一河兩岸”規劃的核心地帶。防洪標準北堤為100 年一遇,南堤為50年一遇。中心城區段滹沱河超標準洪水將在右堤以南、石黃高速以北區域行洪,以石黃高速作為中心城防洪的第二道防線。
考慮洪水自滹沱河河道分洪后順地形地勢的演進情況,二維模型模擬區域(地形插值區域)以滹沱河規劃右堤堤線位置作為北邊界,石黃高速公路為南邊界,西邊界為南水北調總干渠,東邊界到深澤縣省道233。右堤至石黃高速之間模型計算范圍面積約為321.2km2。計算區網格擬采用不規則三角形網格進行剖分,對于模型區域內堤防、道路沿線重點計算區域,確定公路、堤防的長度、高度等技術指標,要求模擬精度較高,采用局部加密的方法,網格劃分最大面積不大于0.01km2。計算區域內網格劃分共計30832 個,計算節點16388 個。網格剖分示意圖見圖2。
對各計算分區進行網格剖分后,為滿足地形插值的需要,對關鍵區域采用1∶1000、1∶2000 高程數據,其余非核心區域采用1∶10000、1∶50000 地形圖進行 網 格 高 程 插 值。其 中1∶1000、1∶2000 提取高程點75000 個,其余比例尺高程點據18000 個。
此次選用誤差M、標準差R、相對誤差分布3 個評價指標進行精度評價。模型區域實測地形數據分布示意圖見圖3。
在利用反距離權重法插值前,根據采樣點集合,利用加權函數計算插值權重。選取核心區域內實測點據高程值作為X 軸,不同插值算法插值出的高程值作為Y 軸,建立正交坐標系,得到3種插值算法的正交坐標圖見圖4—圖6。
自然鄰域法和反距離權重法與實測高程點據擬合程度更好,擬合曲線基本從點群中心穿過,偏差相對較小,首尾點據也有所兼顧,而樣條函數法偏離點群位置相對較大,整體效果不如前二者,與自身特性以及實測數據精度有關,即前二者僅使用插值點周圍的樣本子集,且保證插值高度在所使用的樣本范內,即便插值表面不夠平滑,實測數據點集在插值時也得到了充分的考慮。若采樣對于正在嘗試模擬的高程變量來說足夠密集,則會獲得最佳結果。

圖4 反距離權重法

圖5 自然鄰域法

圖6 克里金法

表1 不同插值算法誤差統計表(全區域)
對3 種插值算法分別計算其中誤差與標準差,計算成果見表1。由表中數據可知,對于整個行洪區域,自然鄰域法插值誤差最小,反距離權重法次之。
相對誤差的分布能夠直接體現插值效果,3 種插值結果的相對誤差分布見圖7—圖8 所示。自然鄰域插值法結果相對誤差主要集中分布在0.5% 附近,反距離權重法集中分布在0.5%~0.8%之間,克里金法則在0.5%~1.2%之間均有分布,集中分布在0.5%、1%附近。
通過對滹沱河高標準行洪區地形插值的研究,對平原區河道高標準行洪區(分洪區)地形插值算法提出優先推薦方案。
反距離權重法以插值點和樣本點之間距離作為權重進行加權平均,離散點距插值點越遠,影響力越小,甚至完全沒有影響力。自然鄰域法具有局部性,不會推斷趨勢,僅使用插值點周圍的樣本子集,并保證插值在使用樣本范圍內。行洪區處于平原區域,坡度相對較緩,對于實測高程數據較為密集、采樣較均勻的區域,可優先采用自然鄰域法或反距離權重法進行插值,雖然實測數據鄰近插值表面未必特別平滑,但整體來看,對于真實地形的插值效果相對最優,插值誤差相對較小。克里金插值算法考慮了實測點與插值點的位置關系,且考慮了各實測點間的相對位置關系,采樣均勻時插值整體效果不如前兩者,但在模型網格尺度較小、地形數據相對稀疏的區域,所插值表面較為平滑,效果反而比反距離權重等方法要好。
對于研究范圍較大的區域,可以根據實測數據采樣精度、數學模型網格尺度劃分不同片區,采用多種插值算法分區域組合插值的方法。
利用誤差、標準差、相對誤差等指標圖、表可以量化各種插值算法插值成果的優劣,對研究區域插值算法的最終選用具有一定指導意義。□

圖7 不同插值算法相對誤差分布圖

圖8 不同插值方案比選后采用成果圖