曾金迪,張豐*,吳森森,杜震洪,劉仁義
(1.浙江大學 浙江省資源與環(huán)境信息系統(tǒng)重點實驗室,浙江杭州310028; 2.浙江大學 地理信息科學研究所,浙江 杭州310027)
空間插值是空間統(tǒng)計分析中的熱門研究領域[1]。在空間研究區(qū)域內(nèi),由于存在不可觀測的位置,或難以大面積鋪設監(jiān)測站點,導致產(chǎn)生大量未知數(shù)據(jù)點。依據(jù)地理學第一定律[2]:“任何事物都是與其他事物相關的,只不過相近的事物關聯(lián)更緊密”,嘗試通過已知點,對研究區(qū)域內(nèi)的未知點進行空間插值[3-4]。因此,如何有效表征事物在空間范圍內(nèi)的分布,反映其空間變化趨勢與內(nèi)在規(guī)律,成為空間插值的重點與難點。
空間插值方法主要有兩種:一種是確定性方法,即基于樣本點之間的相似程度或者平滑程度構(gòu)建擬合曲面,預測未知點數(shù)據(jù),如反距離權重(IDW)法[5]、趨勢面法以及樣條函數(shù)法等;另一種是地統(tǒng)計方法,即利用樣本點變量隨空間位置變化的規(guī)律,使樣本點之間的空間自相關性定量化,從而在待預測點周圍構(gòu)建樣本點的空間結(jié)構(gòu)模型,預測整個空間區(qū)域情況,如克里金(Kriging)插值法[6-7]。空間插值被廣泛應用于降雨分布規(guī)律預測[8]、土地污染評估[9]、空氣質(zhì)量研究[10]、物質(zhì)濃度分布[11]等領域。
空間插值的本質(zhì)是建立樣本點和待預測點之間的自相關關系[12-13],即

其 中,z?i為 待 預 測 點 的 估 計 值,zj為 第j個 樣 本 點 的觀測值,λij為權重系數(shù),其求解方法可影響預測結(jié)果的準確性。不同插值方法其權重求解策略不同,例如IDW 法以空間距離冪次方倒數(shù)的加權平均作為空間權重系數(shù),Kriging 法用變異函數(shù)計算權重,而變異函數(shù)又與空間距離有關[14],可統(tǒng)一表示為權重系數(shù)λij和空間距離之間的非線性關系,即

傳統(tǒng)空間插值方法如反距離權重和半變差函數(shù)等在一定程度上擬合了權重與空間距離的相互關系,但由于其需要一定先驗假設條件,求解模型相對簡單,難以精準計算權重與空間距離間的復雜非線性關系,易造成“牛眼”和鋸齒現(xiàn)象,過渡處平滑性欠佳,影響插值效果。近年來,神經(jīng)網(wǎng)絡的興起為空間插值提供了新思路。由于神經(jīng)網(wǎng)絡對復雜系統(tǒng)具有強大的非線性建模和分析能力[15],已有學者將其應用于空間插值并取得了良好的效果。李純斌等[16]建立了以經(jīng)緯度、高程為輸入,降雨量為輸出的BP 神經(jīng)網(wǎng)絡,并與支持向量機(SVM)方法進行比較;邱云翔等[17]用粒子群算法優(yōu)化BP 神經(jīng)網(wǎng)絡,并將其應用于流域降水空間插值,提高了模型的穩(wěn)定性,但缺乏對空間權重的考慮;SOARES 等[18]對傳統(tǒng)方法進行了優(yōu)化,基于原始增量高斯混合網(wǎng)絡(IGMN),提出了IGMN 神經(jīng)網(wǎng)絡模型,并將其應用于模擬數(shù)據(jù)插值研究,在保持空間相關性的同時兼顧空間異向性,但數(shù)據(jù)需滿足高斯分布;ZHU 等[19]提出了條件生成對抗神經(jīng)網(wǎng)絡(CEDGANs)模型,即由生成器生成偽樣本,用判別器對偽樣本進行修正,并對珠江三角洲等4 個地區(qū)的DEM 數(shù)據(jù)進行了插值研究,該模型對地形解釋能力較強,但對遷移的解釋能力有待驗證,且模型較復雜。
綜上所述,現(xiàn)有基于神經(jīng)網(wǎng)絡的空間插值方法提高了插值精度,針對已有方法的優(yōu)化,或是直接擬合得到未知數(shù)據(jù)與已知數(shù)據(jù)間的非線性關系,模型較為復雜,缺乏對空間相關權重的精準解算。而傳統(tǒng)空間插值方法需先驗假設條件,模型相對簡單,但難以精準擬合權重與空間距離間的相互關系。因此,針對式(2)中權重系數(shù)與空間距離間的非線性擬合問題,本文將空間神經(jīng)網(wǎng)絡應用于權重系數(shù)求解,提出了一種空間自回歸神經(jīng)網(wǎng)絡(SARNN)模型,并將其應用于空間插值,對兩類模擬數(shù)據(jù)和海洋環(huán)境數(shù)據(jù)進行了交叉驗證,并將傳統(tǒng)的反距離權重法和普通克里金法進行了比較。
IDW 法以未知點和樣本點之間的空間距離為權重進行加權平均,距離越近權重越大,其權重貢獻與距離成反比,計算公式為

其 中,z?i為 未 知 點 的 估 計 值,zj為 第j個 樣 本 點 的 觀測值,dij為待插值點i和第j個樣本點之間的歐式距離,P為冪指數(shù),通常取2。IDW 法簡單方便,效果直觀,被廣泛應用于地理、環(huán)境、農(nóng)業(yè)、海洋等領域,但樣本點中的極端值對空間預測結(jié)果影響較大。
克里金法包括普通克里金法、泛克里金法、協(xié)同克里金法等,其中普通克里金法(ordinary Kriging,以下稱Kriging 法)最為常用。Kriging 法利用空間研究區(qū)域內(nèi)已知點的數(shù)據(jù),由變異函數(shù)計算最佳權重系數(shù),從而對未知點進行線性無偏估計。Kriging法的計算公式為

為了滿足估計值的無偏性與最優(yōu)性,設z*(x0)為z(xi)的無偏估計,E[z*(x0)]=E[z(xi)]為估計值的最小方差,即Var(z*(x0)-z(xi)),建立以下方程組計算權重系數(shù)λi:

其中,μ為拉格朗日乘數(shù),c(xi,xj)為樣本點與樣本點間的協(xié)方差函數(shù),c(xi,x)為樣本點與未知點間的協(xié)方差函數(shù)。考慮樣本點在空間研究區(qū)域隨機分布的特點,Kriging 法選取不同的變異函數(shù),如球形函數(shù)模型、指數(shù)函數(shù)模型等進行權重計算,變異函數(shù)的選擇影響預測精度。
傳統(tǒng)空間插值方法其核心是基于空間自相關關系,建立權重系數(shù)與空間距離之間的非線性函數(shù)。基于此,本文構(gòu)建了一種融合神經(jīng)網(wǎng)絡的空間自回歸(spatial auto-regressive neural network,SARNN)模型。
1.3.1 模型算法
對式(1),IDW 法以空間距離冪次方倒數(shù)的加權平均作為空間權重系數(shù),得到式(3);Kriging 法則利用變異函數(shù)計算權重,其與空間距離相關,得到式(5)。兩者均需建立權重系數(shù)λij和空間距離間的非線性關系。
由于待預測點與已知樣本點的空間權重系數(shù)與其到已知樣本點之間的距離有關,定義空間權重系數(shù)λi與空間距離d的非線性函數(shù)如下:

其中,wij為第i和第j個點之間的空間權重,dsij為第i和第j個點之間的空間距離。同時,訓練時為了防止自擬合,待預測點與自身之間的空間權重應當為0,即

因此,根據(jù)式(6)和式(7),定義

從而確保模型訓練過程中樣本點的估計值與自身無關。為了表征權重系數(shù)與空間距離之間的非線性關系,利用神經(jīng)網(wǎng)絡強大的分析建模能力,設計空間神經(jīng) 網(wǎng) 絡(spatially neural network,SNN)對ρi=(ρi1,ρi2,…,ρin)進行非線性擬合,SNN 用樣本點之間的空間距離作為網(wǎng)絡輸入,適當設置隱藏層并以空間權重系數(shù)分量ρi作為網(wǎng)絡輸出,即

其中,[]T代表第i個樣本點到所有樣本點之間的距離。將通過空間神經(jīng)網(wǎng)絡訓練得到的空間權重系數(shù)分量ρij與kij相乘,得到兩點之間的權重系數(shù)λij,其矩陣形式為

將權重矩陣λ 與已知的觀測數(shù)據(jù)相乘,得到樣本值的估計結(jié)果:

1.3.2 模型流程設計與訓練流程設計
采用十折交叉驗證法進行模型訓練與驗證。將樣本點分為10 等份,隨機選取9 份作為訓練集、1 份作為驗證集。在訓練過程中,模型的輸入為訓練集中樣本點的空間距離矩陣,損失函數(shù)為均方誤差(MSE),通過SNN 得到空間權重分量ρ,再與權重分量k 和已知點的觀測值y 相乘得到未知點的預測值,并進行精度檢驗。模型流程如圖1 所示。
為了提高模型的訓練效率和精度,設計了一套訓練流程。首先,用Early Stop 方法防止過擬合,當訓練集的MSE 繼續(xù)下降,驗證集的MSE 開始上升時,提前終止訓練;其次,用dropout 層隨機隱藏部分神經(jīng)元,以提高模型泛化能力并避免過擬合[20-21];此外,對神經(jīng)網(wǎng)絡的每層,用PReLU 作為激活函數(shù)[22-23];最后,采用batch-normalization 技術[24]通過變化的學習步長進行訓練。訓練流程如圖2 所示。
將決定系數(shù)R2、均方根誤差RMSE、平均絕對誤差MAE、平均相對誤差MAPE 作為模型精度的評定標準,計算公式如下:


圖1 模型流程Fig.1 The process of mode l

圖2 訓練流程Fig.2 Training process
為了驗證在不同空間環(huán)境下模型的效果,參考HARRIS 提出的空間數(shù)據(jù)模擬方法[25],分別定義了2種模擬數(shù)據(jù):一般的空間自相關數(shù)據(jù)和突變的空間自相關數(shù)據(jù)。首先,定義一個12×12 單元的空間區(qū)域,在此區(qū)域中,共計有25×25=625 個樣本點,垂直方向和水平方向相鄰的2 個樣本點的距離為0.5,樣本點的空間坐標(ui,vi)按以下方式生成:

其次,在此空間區(qū)域,對2 類數(shù)據(jù)集進行模擬。(i) 模擬數(shù)據(jù)集1

其中,m=k0(ui,vi)+k1(ui,vi)α為具有空間自相關性的趨勢項,α~U(0,1),k0,k1與空間位置有關:

ri為具有空間自相關性的殘差項,依據(jù)有基臺的高斯模型生成:


數(shù)據(jù)集1 的預測結(jié)果如圖3 所示,預測散點分布如圖4 所示。從圖3(a)中可以看出,數(shù)據(jù)集1 的模擬結(jié)果總體呈從左上到右下漸變的趨勢,具有一定的空間相關性。(ii) 模擬數(shù)據(jù)集2

數(shù)據(jù)集2 的預測結(jié)果如圖5 所示,預測散點分布如圖6 所示。從圖5(a)中可以看出,數(shù)據(jù)集2 的模擬結(jié)果較為復雜,既有與空間相關的數(shù)據(jù),又有較強的空間突變數(shù)據(jù)。
最 后,對2 類 數(shù) 據(jù) 集 進 行Moran’I 檢 驗,結(jié) 果見表1。
由表1 可知,數(shù)據(jù)集1 和數(shù)據(jù)集2 具有較強的空間相關性,可以用于空間預測的驗證。本文將2 類數(shù)據(jù)集分別隨機分為10 等份,按照上文定義的模型進行訓練。由于本文模型是一個f:n→n的映射,在綜合考慮網(wǎng)絡復雜度、模型平衡性與特征提取能力的基礎上,設計了一個5 層的神經(jīng)網(wǎng)絡,包括1 個輸入層、1 個輸出層和3 個隱藏層。神經(jīng)元數(shù)目過少會導致模型特征提取能力不足,過多則會增加網(wǎng)絡的復雜程度,降低計算效率。因此根據(jù)SARNN 模型特點,當輸入樣本數(shù)為n時,可通過以下算法計算隱藏層神經(jīng)元數(shù)目,提取樣本特征。

表1 模擬數(shù)據(jù)集的Moran’I 檢驗結(jié)果Table 1 Moran’I of simulation data set
算法1隱藏層神經(jīng)元數(shù)目的確定。
輸入:訓練數(shù)據(jù)樣本數(shù)n;
計算過程:
1: fori=0 do
2: if 2i>n
3: then 輸出[2i,2i+1,2i]
4: elsei=i+1
5: end;
輸出:隱藏層神經(jīng)元數(shù)目。
模擬數(shù)據(jù)集訓練網(wǎng)絡的結(jié)構(gòu)和超參數(shù)設置如表2 所示。

表2 模擬數(shù)據(jù)集訓練網(wǎng)絡的結(jié)構(gòu)和超參數(shù)Table 2 Structure and super parameters of simulation data set training network
IDW 法、Kriging 法以 及SARNN 法的交 叉驗證結(jié)果如表3 所示。從預測結(jié)果的精度上看,SARNN法誤差最小,效果最好。對于數(shù)據(jù)集1,SARNN 法的R2由IDW 法 的0.752 5 和Kriging 法 的0.710 2 提升至0.782 7,分別提升了4.01%和10.21%,RMSE由IDW 法 的0.008 4 和Kriging 法 的0.010 0 降 至0.007 4,分別降低了11.90%和26.00%,在MAE 和MAPE 上,SARNN 法 相 對 于IDW 法和Kriging 法也有一定程度的改善;對于數(shù)據(jù)集2,SARNN 法預測效 果 更 好,R2由IDW 法 的0.707 2 和Kriging 法 的0.718 2 升 至0.896 8,分 別 提 升 了26.81% 和24.87%,RMSE 由IDW 法 的0.016 2 和Kriging 法 的0.014 8 降 至0.005 5,分 別 降 低 了66.05% 和62.83%,在MAE 和MAPE 上,SARNN 法 相 對 于IDW 法和Kriging 法也有較大改善。

表3 模擬數(shù)據(jù)集交叉驗證結(jié)果Table 3 Cross validation results of Simulation data set
IDW 法、Kriging 法和SARNN 法 基于模 擬數(shù)據(jù)的空間預測結(jié)果和預測散點圖如圖3~圖6 所示。從預測結(jié)果看,對于數(shù)據(jù)集1,SARNN 法在較高值和較低值的預測上更精準,預測的整體趨勢面過渡較為平滑,沒有出現(xiàn)明顯的突變和鋸齒;對于數(shù)據(jù)集2,SARNN 法對突變空間數(shù)據(jù)的預測更精準,在突變處未出現(xiàn)明顯的過渡帶,這是由IDW 法和克里金法對突變位置兩側(cè)的數(shù)據(jù)取平均造成的預測偏差。
總體而言,利用神經(jīng)網(wǎng)絡,SARNN 法能夠較好地擬合空間預測模型中權重與空間距離之間的復雜非線性關系,在權重計算與空間數(shù)據(jù)突變處理上具有一定優(yōu)勢。

圖3 數(shù)據(jù)集1 的模擬結(jié)果Fig.3 The simulation results of data set one

圖4 數(shù)據(jù)集1 散點圖Fig.4 Scatter of data set one

圖5 數(shù)據(jù)集2 的模擬結(jié)果Fig.5 The simulation results of data set two
以浙江省近岸海域為研究區(qū),區(qū)域北界從浙滬交界向海延伸至外海領海界限,區(qū)域南界從浙閩交界向東延伸至外海領海界限,總面積約4.44 萬km2。本文選取浙江省近岸海域的海洋環(huán)境監(jiān)測數(shù)據(jù)的磷酸鹽()因子作為研究對象。作為水體富營養(yǎng)化的主要原因之一,研究其空間分布對于水體治理和保護具有重要意義。數(shù)據(jù)來自浙江省海洋監(jiān)測預報中心,對數(shù)據(jù)進行清洗、去噪,得到2016 年5月浙江省近岸海域的監(jiān)測數(shù)據(jù),共計314 條,數(shù)據(jù)集分布如圖7 所示。從圖7 中可以看出,數(shù)據(jù)集總體上呈現(xiàn)北高南低、西部沿岸高東部海域低的空間分布特性。

圖6 模擬數(shù)據(jù)集2 散點圖Fig.6 Scatter of simulation data set two

圖7 數(shù)據(jù)集空間分布Fig.7 Spatial distribution of data sets
表4數(shù)據(jù)集的Moran’I檢驗結(jié)果Table4Moran’I of data sets

表4數(shù)據(jù)集的Moran’I檢驗結(jié)果Table4Moran’I of data sets
數(shù)據(jù)集PO4 2-Moran’I 0.503 4 Z 得分24.104 4 P 值0.000 1
所示。相關系數(shù)R2從大到小依次為SARNN法、3種模型對數(shù)據(jù)的交叉驗證結(jié)果如表6 IDW 法與Kriging 法,其中SARNN 法的相關系數(shù)最高,為0.857 8,說明其插值結(jié)果與觀測值的空間一致性較好,從RMSE、MAE 和MAPE 看,SARNN 法的精度較IDW 法和Kriging 法有較大改善,其中RMSE 法 由IDW 法 的1.28×10-4和Kriging 法 的2.18×10-4降至0.86×10-4,分別降低了48.83%和60.55%,說明SARNN 法誤差較小,預測更精準。
表5 數(shù)據(jù)集訓練網(wǎng)絡的結(jié)構(gòu)和超參數(shù)設置Table 5 Structure andsuperparametersof trainingnetwork

表5 數(shù)據(jù)集訓練網(wǎng)絡的結(jié)構(gòu)和超參數(shù)設置Table 5 Structure andsuperparametersof trainingnetwork
神經(jīng)網(wǎng)絡超參數(shù)輸入層314最大學習率0.6隱藏層1 512最小學習率0.05隱藏層2 1 024最大迭代次數(shù)20 000隱藏層3 512批量64輸出層314退出0.75
在杭州灣、臺州灣等沿岸區(qū)域,低值區(qū)出現(xiàn)在西部海域及南部浙閩交界處。其中,IDW 法生成的插值結(jié)果出現(xiàn)了較為明顯的“牛眼”現(xiàn)象,這是其計算原理導致的;Kriging 法生成的PO42-空間分布圖存在大量局部鋸齒,插值精度較低,可觀性較差。相比之下,SARNN 法插值精度較高,在臺州灣、杭州灣等高值區(qū)域以及浙閩交界處等低值區(qū)域的插值結(jié)果更準確,整體空間范圍內(nèi)的插值結(jié)果更平滑,趨勢面過渡平穩(wěn)漸進,空間分布效果較好,但一些空間監(jiān)測站點也存在小圓區(qū)域,這是樣本數(shù)據(jù)與周圍數(shù)據(jù)跨度較大導致的。
表6 交叉驗證結(jié)果Table 6 Cross validation results of data set

表6 交叉驗證結(jié)果Table 6 Cross validation results of data set
數(shù)據(jù)集PO4 2-模型IDW 法Kriging 法SARNN 法交叉驗證結(jié)果R2 0.798 1 0.649 4 0.857 8 RMSE 1.28×10-4 2.18×10-4 0.86×10-4 MAE 0.007 4 0.008 9 0.006 7 MAPE 0.656 6 0.777 3 0.468 3

圖8 插值結(jié)果Fig.8 Interpolation results of

圖9 散點圖Fig.9 Scatter of
在傳統(tǒng)空間插值方法中,權重與空間距離的求解需先驗條件,且模型簡單,難以表征其復雜的非線性關系,而現(xiàn)有基于神經(jīng)網(wǎng)絡的插值方法通過直接擬合已知與未知數(shù)據(jù)間的關系,忽略了空間自相關權重。針對以上問題,本文建立了一種空間自回歸神經(jīng)網(wǎng)絡(SARNN)模型,將其應用于空間插值,對兩類數(shù)據(jù)集和實測數(shù)據(jù)集分別進行了交叉驗證,并與傳統(tǒng)的IDW 法和Kriging 法進行了比較。
交叉驗證結(jié)果表明,在空間插值精度上,SARNN 法整體優(yōu)于IDW 法與Kriging 法,但不同數(shù)據(jù)集的空間插值效果不同。在統(tǒng)計指標上,SARNN 法的相關系數(shù)R2和均方根誤差RMSE 均優(yōu)于IDW 法和Kriging 法,在其他統(tǒng)計指標,如MAE、MAPE 上,SARNN 法也有較大改善。
空間插值結(jié)果表明,SARNN 法更適合進行空間數(shù)據(jù)的平滑性建模和對突變數(shù)據(jù)的預測,能較好消除“牛眼”鋸齒等現(xiàn)象,更能表征事物在空間上的變化趨勢。SARNN 法充分利用了神經(jīng)網(wǎng)絡對樣本特征的學習擬合能力,將空間插值問題轉(zhuǎn)化為神經(jīng)網(wǎng)絡的優(yōu)化拓撲問題,在一定程度上解決了傳統(tǒng)插值方法對權重與空間距離間復雜非線性關系擬合欠佳的問題,模型相對簡潔,具有一定的適用性和推廣性。但對于大面積數(shù)據(jù)缺失的情況,SARNN 法尚待進一步驗證。