劉慕溪
(廣東省核工業地質局測繪院,廣東 廣州510800)
隨著衛星、導航定位技術的發展,空間定位測量技術(尤其是GPS測量)在測繪中應用越來越廣泛;GNSS系統,如美國的GPS、俄羅斯的GLONASS和北斗衛星導航系統,都能為用戶提供海量的數據信息[1]。全球已建成上百個全球連續運行參考站和數千個區域站,不但可以觀測到地表位移,進行形變分析以及板塊運動研究,而且還能觀測到震后形變等微小地殼形變,為地殼研究提供基本的原始資料。但測量不可避免的存在誤差,GPS測量中的誤差主要體現在與衛星有關的誤差,與接收機有關的誤差,與信號傳播有關的誤差,如何剔除GPS觀測值中的誤差,降低噪聲對觀測成果的影響成為一個重要問題。對流層濕延遲、電離層延遲、天線相位中心誤差和衛星軌道誤差等都是噪聲的潛在來源,隨著算法和模型的改進,該類噪聲能得到很好的消除或減弱。此外GPS觀測值中包含著時空相關的噪聲,以及非構造信號等共性誤差,對觀測結果帶來不確定性[2]。本文討論了基于主成分分析的噪聲剔除方法,結果表明主成分分析法可以較好地消除GPS解中的共性誤差,提高GPS測量定位的精度。
主成分分析又叫經驗正交函數分析,是現代數據分析的一個有效工具,廣泛應用于經濟、金融、測繪等領域,是一種非參數數據處理方法,計算簡單、效率高[3]。主成分分析法在測量控制網的靈敏度分析、粗差檢驗等得到了較好應用。通過尋找觀測數據的方差-協方差陣的前k個主分量,在保持數據信息損失最小的前提下,經過線性轉換將原始自變量中相關的維數消除,轉換到低維向量空間,低維中各主分量是相互正交的,從混雜的數據中提取出相關的信息。由于前幾個主分量綜合了原始數據的最大信息量,因此不會對數據分析結果帶來太大的影響,同時避免了法方程病態問題的出現,得到參數的精確估值,提高了解的準確性和可靠性,同時可以揭示數據中隱含的一些規律及結構特征[4]。
觀測P個變量x1,x2,…,xp,n個樣本的數據資料數據矩陣為:


主成分分析就是將p個觀測變量綜合成為p個新的變量(綜合變量),即

簡寫為:

要求模型滿足以下條件。
(1)各主分量不相關,即Fi,Fj互不相關(i≠j,i,j=1,2,…,p)。
(2)F1的方差大于F2的方差大于F3的方差,依次類推。

于是,稱F1為第1主成分,F2為第2主成分,依此類推,有第p個主成分。主成分又叫主分量。這里aij稱為主成分系數。通過前k個分量能夠反應隨機變量X的主要特征,該數據處理方法稱之為主成分分析。
主成分分析法一般分3個步驟進行求解: (1)首先對分析數據組成數據矩陣X(m,n),m為數據類型,n為數據樣本個數;(2)數據中心化,即將各個觀測數據減去均值得到新的數據矩陣; (3)計算新矩陣的方差、協方差,獲取特征向量,實現在重構誤差最小的條件下對數據維數的有效簡化。
以GPS臺站網的坐標時間序列為原始數據,每個臺站的坐標分量殘差時間序列排列起來形成一個(m>n)的矩陣X,m表示觀測歷元數,n表示觀測類型,數據矩陣如下:

做如下定義:



即V構成X的正交基底,矩陣X按照KLE展開可得

ak(ti)可由下式求出:

式中,ak(t)是第k個主成分,vk(x)是對應主成分的響應特征矩陣,分別代表時間特征和空間響應[5]。
本文對連續運行的IGS基準站2001-2007的觀測數據進行分析。首先對GPS觀測數據進行預處理,GPS數據預處理是指及時對外業觀測數據進行檢驗,探測數據中的粗差,剔除那些質量較差的數據,以提高觀測數據的質量。在數據預處理的過程中,使用TEQC軟件,對GPS數據進行質量分析[6]。數據預處理后按照如下步驟進行數據處理[7]。
(1)采用GAMIT軟件,通過無基準方法解算出各GPS站點的三維坐標及其方差-協方差陣,以每天24 h的GPS觀測數據為基本單位形成單天解。無基準算法可以有效地避免基準誤差的干擾,便于將內部獨立的坐標基準轉換到外部統一的參考框架。
(2)將獲取的單天解進行平差,獲得單天解坐標序列。對坐標序列去均值和趨勢項處理后(此處減去均值是為后續應用主成分分析法進行噪聲分析做準備),得到GPS基準站單天解連續坐標時間序列,限于篇幅以CAND站為例,圖1為CAND站垂向分量坐標序列。
(3)將上一步生成的殘余坐標時間序列進行主成分分析,把時間序列分解成時間域的主分量和空間域的特征分量,按其貢獻率排列,見表1。

表1 主成分分析后得到的前3個主分量的貢獻值
由表1可知在3個坐標方向主成分分析后前3個分量的累計貢獻率達到90%,綜合了絕大部分的原始信息,故采用前3個分量作為主分量,對GPS單天解形成的連續坐標時間序列進行處理,得到站點單天解的殘余序列(圖2)。

圖1 CAND垂向分量坐標序列

圖2 經過主成分分析剔除噪聲后的坐標序列
通過主成分分析法處理后,GPS單天解的坐標序列可看出,GPS坐標序列的波動趨于平穩,波動振幅有所減小,對非構造信號、時空相關的誤差源引起的站點位移進行了剔除。對數據進行分析可知,濾波之前垂向分量的均方根誤差為1.751 8,濾波之后為1.556 0,即通過主成分分析濾波方法分離出的誤差約減少了站點11%的不確定度,提高了站點坐標的精度、信噪比。此外,濾波前坐標序列呈現出明顯的周期性變化,濾波后坐標序列的周期性明顯減弱,表明坐標序列中存在的誤差呈現出季節性變化趨勢,有待于進一步分析。
本文基于主成分分析的噪聲剔除方法,針對GPS信號中存在的非構造信號誤差,時空相關誤差等,能有效的剔除或減弱上述誤差的影響,可提高GPS測量、定位的精度與可靠性,對GPS的應用具有一定的的參考價值。
[1] 夏金偉,趙東保.TEQC數據質量分析[J].地理空間信息,2012,(4):60-65.
[2] 田云鋒,沈正康.GPS坐標時間序列中非構造噪聲的剔除方法研究進展[J].地震學報,2009,(1):68-81,117.
[3] Shlens J.A Tutorial on Principal Component Analysis,Center for Neural Science[J].New York University New York City,NY 10003-6603 and Systems Neuro blogy Laboratory,Salk Insitute for Biological Studies La Jolla,CA 92037,April 22,2009.
[4] 馮光財,陳正陽.基于主成分回歸的GPS高程曲面擬合[J].測繪科學,2007,32(1):51-52.
[5] 殷海濤,甘衛軍,熊永良,等.PCA空間濾波在高頻GPS定位中的應用研究[J].武漢大學學報(信息科學版),2011,(7):825-829.
[6] 賀小星,周世健.某城區D級GPS靜態控制網設計與實施[J].江西科學,2012,30(3):295-298.
[7] 王 敏,張祖勝,許明元,等.2000國家GPS大地控制網的數據處理和精度評估[J].地球物理學報,2005,(4):817-823.