黎峻宇,劉立龍,蔡成輝,林國標(biāo),黃良珂(桂林理工大學(xué)a.測繪地理信息學(xué)院; b.廣西空間信息與測繪重點實驗室; c.廣西礦冶與環(huán)境科學(xué)實驗中心,廣西桂林 541004)
?
數(shù)據(jù)預(yù)處理對基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的影響
黎峻宇a,b,劉立龍,蔡成輝a,b,林國標(biāo)a,b,黃良珂a,b
(桂林理工大學(xué)a.測繪地理信息學(xué)院; b.廣西空間信息與測繪重點實驗室; c.廣西礦冶與環(huán)境科學(xué)實驗中心,廣西桂林541004)
摘要:介紹了數(shù)據(jù)預(yù)處理對基于徑向基函數(shù)網(wǎng)絡(luò)的高程轉(zhuǎn)換的必要性,提出了基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換建模的基本原理和實現(xiàn)步驟。結(jié)合工程實例,重點對歸一化、中心化、標(biāo)準(zhǔn)化3種不同的數(shù)據(jù)預(yù)處理方法對基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的影響進行計算分析。結(jié)果表明:針對大面積、高程異常值變化較大的區(qū)域,經(jīng)過數(shù)據(jù)預(yù)處理后模型能夠達到更高的轉(zhuǎn)換精度;不同的預(yù)處理方法對轉(zhuǎn)換結(jié)果影響不同,中心化預(yù)處理較其他兩種方法能夠更大程度地提高徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的精度;歸一化預(yù)處理方法不一定是最優(yōu)的,進行高程轉(zhuǎn)換前有必要對預(yù)處理方法進行選擇。
關(guān)鍵詞:歸一化;中心化;標(biāo)準(zhǔn)化;數(shù)據(jù)預(yù)處理;徑向基函數(shù)網(wǎng)絡(luò);高程轉(zhuǎn)換;改善精度
當(dāng)前,GPS測量技術(shù)已經(jīng)在測繪生產(chǎn)實踐中得到廣泛應(yīng)用,然而GPS測量直接獲得的高是相對于WGS-84橢球面的大地高,實際生產(chǎn)過程中使用的卻是相對于似大地水準(zhǔn)面的正常高[1]。因此,為了使GPS測量技術(shù)能夠得到更普遍的應(yīng)用,必須將大地高H轉(zhuǎn)換為正常高h,它們之間的關(guān)系是: h = H-ε,ε稱為高程異常。故只需知道每一點的高程異常,就能夠?qū)⒃擖c大地高H轉(zhuǎn)換為正常高h。高程異常轉(zhuǎn)換方法主要有4類:幾何解析法、物理大地測量法、人工智能法和混合轉(zhuǎn)換法[2]。人工神經(jīng)網(wǎng)絡(luò)屬于人工智能法的范疇[3],近年來許多學(xué)者對人工神經(jīng)網(wǎng)絡(luò)高程轉(zhuǎn)換模型作了進一步研究[4-14],這些研究在一定程度上對高程轉(zhuǎn)換模型進行了改進。然而,除了文獻[3]進行了數(shù)據(jù)預(yù)處理對基于BP神經(jīng)網(wǎng)絡(luò)的高程轉(zhuǎn)換的影響研究外,很少有人詳細研究不同的數(shù)據(jù)預(yù)處理方法對高程轉(zhuǎn)換結(jié)果的影響。徑向基函數(shù)網(wǎng)絡(luò)是一種結(jié)構(gòu)簡單、收斂速度快、能夠逼近任意非線性函數(shù)網(wǎng)絡(luò),文獻[1-2]中已經(jīng)有一部分學(xué)者將徑向基函數(shù)網(wǎng)絡(luò)用于高程轉(zhuǎn)換,并在一定程度上改善了高程轉(zhuǎn)換的精度;然而進行高程轉(zhuǎn)換的樣本數(shù)據(jù)往往是相當(dāng)龐大的,特別對于面積廣、高程起伏較大的地區(qū),樣本數(shù)據(jù)中的信息很繁雜,且樣本數(shù)據(jù)的北、東方向坐標(biāo)不在一個數(shù)量級上,對數(shù)據(jù)進行預(yù)處理或許可以使得北、東坐標(biāo)以及高程異常之間的關(guān)系挖掘過程更快捷、更精確,如此徑向基函數(shù)才能更好地逼近北、東坐標(biāo)與高程異常之間的函數(shù)關(guān)系。為了使得徑向基函數(shù)網(wǎng)絡(luò)在高程轉(zhuǎn)換領(lǐng)域得到更好的發(fā)展,本文通過在嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,增加一個數(shù)據(jù)預(yù)處理層,采用3種不同的預(yù)處理層構(gòu)造3種不同的徑向基函數(shù)網(wǎng)絡(luò)模型進行高程轉(zhuǎn)換,并將轉(zhuǎn)換結(jié)果與不帶數(shù)據(jù)預(yù)處理層的徑向基函數(shù)網(wǎng)絡(luò)模型的轉(zhuǎn)換結(jié)果進行對比、分析,探討數(shù)據(jù)預(yù)處理對基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的影響。
1. 1徑向基函數(shù)網(wǎng)絡(luò)基本原理
徑向基函數(shù)網(wǎng)絡(luò)是具有3層結(jié)構(gòu)的前向網(wǎng)絡(luò):輸入層在第1層,其節(jié)點個數(shù)等于輸入向量的維數(shù);第2層叫隱含層,節(jié)點個數(shù)由問題的復(fù)雜程度確定;第3層是輸出層,節(jié)點個數(shù)等于輸出數(shù)據(jù)的維數(shù)。徑向基函數(shù)網(wǎng)絡(luò)不同層的功能各不相同,隱含層是非線性的,以徑向基函數(shù)為基函數(shù),在此將輸入向量空間轉(zhuǎn)換到隱含層空間,達到將原來線性不分的問題變得線性可分的目的,輸出層則是線性的[10]。一個嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 61Strict radial basis function network structure

隱含層Φi( i = 1,2,…,N)為基函數(shù),本文使用高斯函數(shù)為基函數(shù),則有徑向基函數(shù)網(wǎng)絡(luò)模型為其中: Xk是m維的網(wǎng)絡(luò)輸入向量; y = F( x)為對應(yīng)的輸出;ωij( i = 1,2,…,N)為從第i個隱含節(jié)點到第j個輸出節(jié)點的權(quán)值; N為隱含層神經(jīng)元個數(shù);是高斯函數(shù)基函數(shù); Xi=[xi1,xi2,…,xim]為每個隱含層神經(jīng)元基函數(shù)的中心;σi為拓展常數(shù),且是所選取中心之間的最大距離,m為選取中心個數(shù)[1];建立和訓(xùn)練一個嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò),就是使其通過學(xué)習(xí)來確定Xi、ωi、σi的過程,以完成所需要的輸入到輸出的映射[2]。
1. 2徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的實現(xiàn)
本文的徑向基函數(shù)網(wǎng)絡(luò)輸入層神經(jīng)元個數(shù)是2個,即控制點的平面坐標(biāo)( x,y) ;輸出層神經(jīng)元個數(shù)為1個,即高程異常ε[1]。假設(shè)R = { ( Pi,Ti) | i = 1,2,…,M}為訓(xùn)練樣本集,M為訓(xùn)練樣本數(shù),稱P = [P1,P2,…,PM]T為樣本輸入陣,其中Pi= ( xi,yi),相應(yīng)的教師輸出為T =[T1,T2,…,TM]T,其中

徑向基函數(shù)網(wǎng)絡(luò)的高程轉(zhuǎn)換步驟為
①生成函數(shù)網(wǎng)絡(luò):本文中的徑向基函數(shù)網(wǎng)絡(luò)是通過MATLAB內(nèi)的newrbe函數(shù)實現(xiàn)的,形式為net = newrbe ( P,T,goal),P為樣本輸入陣,T為教師輸出陣,均方差精度goal選用默認(rèn)的微小值。
②調(diào)試網(wǎng)絡(luò):利用仿真函數(shù)Ts= sim ( net,P)對網(wǎng)絡(luò)進行調(diào)試,net為①生成的函數(shù)網(wǎng)絡(luò),P為樣本輸入陣,將仿真輸出Ts與T教師輸出進行比較判斷生成網(wǎng)絡(luò)的可靠性,本文所生成網(wǎng)絡(luò)滿足可靠性要求(由文獻[10]可知newrbe可以迅速創(chuàng)建一個誤差為零的嚴(yán)格徑向基函數(shù)網(wǎng)絡(luò))。
③高程轉(zhuǎn)換:利用①中生成的函數(shù)網(wǎng)絡(luò),運用函數(shù)G = sim ( net,J)求驗證樣本點的高程異常,其中J = ( J1,J2,…,JN)T,Ji= ( xi,yi) ;輸出陣G為利用徑向基函數(shù)網(wǎng)絡(luò)計算得到的高程異常陣,將G與正常高陣h = ( h1,h2,…,hN)相加就完成了所有點的高程轉(zhuǎn)換。
數(shù)據(jù)預(yù)處理方法種類很多,適用范圍也因?qū)嶋H處理問題的不同而不同。在高程轉(zhuǎn)換相關(guān)文獻中學(xué)者們最常用的方法是歸一化、標(biāo)準(zhǔn)化,中心化也是比較經(jīng)典的數(shù)據(jù)預(yù)處理方法,本文將就此3種數(shù)據(jù)預(yù)處理方法進行討論。
將輸入數(shù)據(jù)表示為Z = ( Z1,Z2),Z1= ( x1,x2,…,xn)表示輸入樣本的北坐標(biāo)矩陣,Z2= ( y1,y2,…,yn)表示輸入樣本的東坐標(biāo)矩陣。

歸一化公式為式中:Zij為樣本數(shù)據(jù)Zij歸一化的結(jié)果,Zmax、Zmin分別為Z1、Z2中的最大值和最小值[3]。


3. 1建立模型
本文在嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,于輸入層前分別增加1個歸一化、標(biāo)準(zhǔn)化、中心化數(shù)據(jù)預(yù)處理層,構(gòu)成3種不同的徑向基函數(shù)網(wǎng)絡(luò)訓(xùn)練方法來建立模型,分別簡稱歸一化模型、標(biāo)準(zhǔn)化模型、中心化模型。實驗過程中,運用這3種不同的模型和嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)(無數(shù)據(jù)預(yù)處理層,在此稱徑向基模型)用同樣的樣本進行訓(xùn)練,并對相同驗證樣本進行高程轉(zhuǎn)換[11]。
3. 2數(shù)據(jù)來源
采用某大型工程的D級GPS控制網(wǎng)點作為樣本數(shù)據(jù),該控制網(wǎng)共有點23個,控制區(qū)域面積較大,達850 km2。水準(zhǔn)按照二等水準(zhǔn)測量要求施測,高程異常變化較大,異常值變化如圖2所示,其中坐標(biāo)、異常值已通過歸一化。取18個分布相對均勻的點作為訓(xùn)練樣本,5個點作為驗證樣本[12-13]。樣本數(shù)據(jù)點位分布見圖3。

圖2 異常值變化Fig. 62Change of elevation anomaly change

圖3 樣本數(shù)據(jù)點位分布Fig. 63Distribution of example points
3. 3模型精度分析
由文獻[10]可知,newrbe可以迅速創(chuàng)建一個誤差為零的嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò),因此,不同的嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)模型的可塑性都較好,在此不再就模型可塑性進行比較。本文通過比較不同模型轉(zhuǎn)換所得高程異常與真值之差進行轉(zhuǎn)換精度的評定,運用標(biāo)準(zhǔn)差來考察不同轉(zhuǎn)換模型的泛化能力。比較統(tǒng)計見表1、圖4。
標(biāo)準(zhǔn)差公式

式中: n為驗證樣本點總數(shù),Δε表示模型轉(zhuǎn)換所得高程異常εi與高程異常真值ε之差。
本文實驗區(qū)域中,數(shù)據(jù)預(yù)處理使得徑向基函數(shù)

表1 轉(zhuǎn)換精度比較Table 1 Comparison of fitting accuracy m

圖4 不同模型轉(zhuǎn)換結(jié)果誤差絕對值Fig. 64Absolute value of fitting error based on different models
網(wǎng)絡(luò)高程轉(zhuǎn)換精度有較明顯的提高,且大大改善了徑向基函數(shù)網(wǎng)絡(luò)模型的泛化能力。由此可見,在應(yīng)用徑向基函數(shù)網(wǎng)絡(luò)進行高程轉(zhuǎn)換時,對數(shù)據(jù)樣本進行預(yù)處理是非常必要的。
由表1和圖4得知,在本文實驗中,中心化模型高程轉(zhuǎn)換精度最高,幾乎在所有驗證點處的轉(zhuǎn)換誤差絕對值都是最小的,標(biāo)準(zhǔn)差最小,在3種模型中具有最強的泛化能力。標(biāo)準(zhǔn)化模型高程轉(zhuǎn)換精度稍低于中心化模型,其各驗證點轉(zhuǎn)換誤差接近于中心化模型,也具有一定的泛化能力。歸一化模型高程轉(zhuǎn)換精度較低,且在某些驗證點處轉(zhuǎn)換誤差絕對值偏大,模型泛化能力較差。
本文通過對選定區(qū)域數(shù)據(jù)實驗分析表明,針對大面積、高程異常值變化較大的區(qū)域,在3種預(yù)處理數(shù)據(jù)中,中心化預(yù)處理數(shù)據(jù)對徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換精度提高程度最大,中心化預(yù)處理與徑向基函數(shù)網(wǎng)絡(luò)結(jié)合的模型具有較強的泛化能力。一部分參考文獻中常用的歸一化預(yù)處理方法,可能不是提高高程轉(zhuǎn)換精度的最優(yōu)數(shù)據(jù)預(yù)處理方式。在進行高程轉(zhuǎn)換時,有必要通過比較不同的數(shù)據(jù)預(yù)處理方法尋找更優(yōu)的數(shù)據(jù)預(yù)處理方式,以達到更優(yōu)化模型的目的。本文實驗獲取數(shù)據(jù)具有局域性,不同的數(shù)據(jù)預(yù)處理方式對其他高程轉(zhuǎn)換模型以及在其他區(qū)域的優(yōu)化能力有待進一步驗證。
參考文獻:
[1]劉建,王琪潔,王小輝,等.基于遺傳算法的RBF神經(jīng)網(wǎng)絡(luò)在GPS高程轉(zhuǎn)換中的應(yīng)用[J].測繪科學(xué),2013,38 ( 2) : 143-145.
[2]任超,吳偉,黃征凱,等.基于AIC準(zhǔn)則的RBF神經(jīng)網(wǎng)絡(luò)在GPS高程擬合中的應(yīng)用[J].測繪科學(xué),2013,38 ( 2) : 77-79.
[3]張昊,王琪潔,朱建軍,等.樣本數(shù)據(jù)預(yù)處理對基于BP神經(jīng)網(wǎng)絡(luò)的GPS高程擬合的影響[J].大地測量與地球動力學(xué),2011,31 ( 2) : 125-128.
[4]王小輝,王琪潔,丁元蘭,等.基于二次曲面和BP神經(jīng)網(wǎng)絡(luò)組合模型的GPS高程異常擬合[J].大地測量與地球動力學(xué),2012,32 ( 6) : 103-106.
[5]姬張建,袁運斌,盛傳貞.混沌粒子群支持向量機并考慮地形改正的GPS高程擬合[J].大地測量與地球動力學(xué),2010,30 ( 2) : 95-98.
[6]焦明連,蔣廷臣.基于小波方法和Kriging估計的GPS高程轉(zhuǎn)換[J].大地測量與地球動力學(xué),2008,28( 2) :100-103.
[7]魏子卿.GPS重力位水準(zhǔn)[J].大地測量與地球動力學(xué),2007,27 ( 4) : 1-7.
[8]趙輝,張書畢,張秋昭.基于加權(quán)總體最小二乘法的GPS高程擬合[J].大地測量與地球動力學(xué),2011,31( 5) :88-91.
[9]孫傳勝,楊國東,吳瓊.神經(jīng)網(wǎng)絡(luò)在GPS高程擬合中的應(yīng)用[J].測繪通報,2011 ( 8) : 48-50.
[10]陳明.MATLAB神經(jīng)網(wǎng)絡(luò)原理與實例精解[M].北京:清華大學(xué)出版社,2013.
[11]黃良珂,劉立龍,唐艷新,等.基于改進的Kriging法區(qū)域似大地水準(zhǔn)面精華[J].桂林理工大學(xué)學(xué)報,2012,32 ( 4) : 532-536.
[12]王新橋,黃良珂,劉立龍,等.GPS高程轉(zhuǎn)換模型[J].桂林理工大學(xué)學(xué)報,2013,33 ( 3) : 504-508.
[13]張騰旭,劉立龍,周淼,等.基于LS-SVM和BP神經(jīng)網(wǎng)絡(luò)組合模型的GPS高程擬合[J].桂林理工大學(xué)學(xué)報,2014,34 ( 3) : 505-509.
[14]張騰旭,劉立龍,周淼,等.基于最小二乘配置法的高程擬合及精度評定方法[J].桂林理工大學(xué)學(xué)報,2014,34(4) :728-731.
Effects of data pretreatment to elevation fitting on radial basis function network
LI Jun-yua,b,LIU Li-long,CAI Cheng-huia,b,LIN Guo-biaoa,b,HUANG Liang-kea,b
( a. College of Geomatics Engineering and Geoinformations; b. Guangxi key laboratory of Spatial Information and Geomatics; c. Guangxi Scientific Experiment Center of Mining,Metallurgy and Environment,Guilin University of Technology,Guilin 541004,China)
Abstract:The necessity of data pretreatment to the elevation fitting on radial basis function network modeling is described.The basic principle and implementation steps of the conversion modeling is depicted based on radial basis function networks elevation.With engineering examples,normalization,centralization,standardization of three different data pretreatment methods is used to calculate the impact of good conversion on radial basis function network.It is shown that data pretreatment model can achieve better conversion accuracy in a large area with elevation changes over the outliers.Different pretreatment methods result in different conversion.The centralization can improve the elevation accuracy on radial conversion function network in a greater degree.Normalization wouldn't be the best data pretreatment method.It is necessary for the selection of pretreatment method before elevation conversion.
Key words:normalization; centralization; standardization; pretreatment of data; radial basis function network; elevation fitting; raise accuracy
通訊作者:劉立龍,博士,教授,hn_liulilong@163. com。
作者簡介:黎峻宇( 1989—),男,碩士研究生,研究方向: GNSS技術(shù)及應(yīng)用,lijunyu36@163. com。
基金項目:國家自然科學(xué)基金項目( 41064001) ;廣西自然科學(xué)基金項目( 2012GXNSFAA053183; 2012GXNSFGA060001) ;廣西研究生教育創(chuàng)新計劃項目( YCSZ2013077) ;廣西空間信息與測繪重點實驗室項目(桂科能1207115-07) ;廣西礦冶與環(huán)境科學(xué)實驗中心項目( KH2012ZD004) ;廣西“八桂學(xué)者”專項經(jīng)費項目
收稿日期:2014-05-05
doi:10. 3969/j.issn. 1674-9057. 2015. 01. 015
文章編號:1674-9057( 2015) 01-0103-04
文獻標(biāo)志碼:A
中圖分類號:P228. 49
引文格式:黎峻宇,劉立龍,蔡成輝,等.?dāng)?shù)據(jù)預(yù)處理對基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的影響[J].桂林理工大學(xué)學(xué)報,2015,35 ( 1) : 103-106.