李宗勛
(上海市城市建設設計研究總院(集團)有限公司,上海200125)
粗差探測與剔除不僅是理論和算法問題, 而且具有重要的實用價值。 參與GNSS 控制網平差的基本觀測量是由基線解算得到的三維基線向量,因此,基線的3 個分量是一個不可分離的整體, 應該按照整體特性構造粗差探測的統計量。 然而, 目前的粗差探測理論并未考慮GNSS 基線向量的這一特性,因此,取得的理論成果也可用于其他測量方案的優化,以及其他各類觀測值的粗差探測[1-2]。 研究成果和開發的相應子程序可嵌入GNSS 數據處理軟件系統, 廣泛地用于實際的GNSS 控制測量工作。
測量中的平差問題是測量中有了多余觀測而產生的,因而使待估參數的解不定,而為了求得參數的唯一解,需要引入一個附加準則,我們稱之為最小二乘準則。 當觀測值中僅含有偶然誤差時, 在這個準則下進行的平差將使我們不僅能夠得到唯一的,更是具有最優性質的參數估計量。 但是當觀測值當中不僅含有偶然誤差而且還包含粗差時, 將對觀測值改正數以及平差結果造成影響。
在研究粗差時,將粗差歸入函數模型,在國內外應用最為廣泛的是Baarda 提出的單個粗差的探測方法——數據探測法(Data Snooping)[3],當觀測值之間不相關時,Baarda 給出的檢測粗差的統計量為:

以上為單位權方差已知時,在沒有粗差的情況下,檢驗量Wi服從標準正態分布。 當單位權方差未知時可構造t 分布檢驗量:
式中,ti為構造統計量;vi為第i 個觀測值殘差;qvii為殘差向量的協因數陣;n 為觀測值總數;u 為參數個數;V 為觀測值殘差矩陣;P 為其權陣;r 為多余觀測數。
在給出顯著性水平α 之后,若實際檢驗量大于臨界值,則認為該觀測值可能含有粗差。
Baarda 粗差探測法每次只能檢驗出一個粗差, 當存在幾個粗差時,只有進行逐個檢驗,即首先剔除超過臨界值最大的那個觀測值,然后進行下一次平差求出殘差,仿照前述方法再一次進行粗差探測,依次繼續下去。 此外,該算法是在假定各個觀測值彼此之間不相關時構造統計量進行假設檢驗的,在大多數實際情況中,觀測值彼此之間是相關的,比如說,GNSS基線向量觀測值的3 個分量是同時出現且彼此相關的。
同一條基線向量的3 個分量是同時出現且誤差相關的,利用以上單分量模型進行粗差探測與剔除時, 往往一個基線分量沒有通過檢驗,而將整條基線向量剔除。 考慮到GNSS 基線向量的這個特點, 我們考慮將基線的3 個分量看成是一個整體進行檢驗,然后直接剔除含有粗差的基線向量。
由式(3),假設第i 個觀測值存在粗差,當單位權方差未知時,則可構造統計量[4]:

對于GNSS 觀測來說, 同一條基線向量的3 個觀測值分量是同時出現而且彼此相關, 因此在構造假設檢驗的統計量時應該將整條基線看作是一個整體, 找出這個整體統計量在空間中的投影最大值,從而達到高效準確探測粗差的目的。
假設第i 條基線向量存在粗差,該基線向量的3 個觀測分量改正數分別為ViX、ViY、ViZ。 設在空間中投影方向,水平方向為α(0≤α≤2π),天頂距為z(0≤z≤π),當對第i 條基線向量進行假設檢驗時, 設該基線向量的3 個分量在空間中投影方向的單位向量為ni=[sinzcosα sinzsinα cosz],則將式(5)中的替換ei為:
構造統計量:

式中,ti為構造統計量;Ci假設第i 條基線向量存在粗差時構造的單位向量。
則按基線整體探測的基本思想為:
1)依次假設每條基線存在粗差,按照式(7)構造統計量,尋找該統計量在空間中的最大值timax作為檢驗統計量。求出最大值方向即水平方向α 以及天頂距z。
2)在一定的置信水平α 下,如果timax≤tα/2,則說明該條基線不存在粗差,若timax>tα/2,則說明該條基線含有粗差,剔除該條基線。 重復以上步驟,依次對其他基線進行檢驗,直到網中所有粗差都被剔除,精度達到要求為止,最后結果為上一次平差結果。
為了驗證以上整體探測模型的有效性, 本文采用上海某GNSS 控制網為實例進行計算。 該控制網由17 個GNSS 控制點組成,共包含37 條獨立基線。 其網圖如圖1 所示。

圖1 上海某GNSS 控制網網形圖
對該GNSS 控制網進行無約束平差, 以佘山IGS 跟蹤站的ITRF97 框架(歷元為2000.00)下的坐標作為起始值,平差后三維空間坐標的精度如圖2 所示。

圖2 平差之后各個點的坐標精度
無約束平差后37 條基線向量的111 個坐標分量的改正數中小于1 cm 有84%,在1~2 cm 的占14%,在2~3 cm 的只有1 個, 超過3 cm 的一個最大的改正數為-3.13 cm,是S006~S009 基線的Y 方向改正數。 因此,若采用檢驗粗差的經典方法3σ 準則,則認為觀測值是符合要求的。 下面比較采用單分量模型探測粗差和按基線整體模型探測粗差結果。
按照基線向量的各個分量分別構造統計量探測粗差,結果如圖3 所示。

圖3 單分量探測模型構造統計量與臨界值比較
取置信水平α=0.005,自由度為36,查表可得tα/2=2.719 5,由圖2 可知第20 條基線 (S002—S016) 和第24 條基線(S012—S016)的X 方向分量未能通過檢驗,但是這兩條基線的另外兩個分量能通過檢驗,則認為這兩個觀測值存在粗差,應該將兩條基線剔除。 其余各觀測值均未達到臨界值,通過檢驗。
將整條基線的3 個分量看成一個整體,構造統計量,并求得該統計量在空間中投影的最大值,計算結果如圖4 所示。

圖4 按基線整體模型構造統計量與臨界值比較
同樣,取置信水平α=0.005,自由度36,臨 界 值tα/2=2.719 5, 由 圖4 可 知, 第1(S002—S007)、20 (S002—S016)、24(S012—S016)這3 條基線超過臨界值,未能通過檢驗,其中,第一條基線向量在采用傳統單分量模型探測時未能在3 個分量中探測出粗差。 因此,按基線整體模型探測粗差是能夠有效探測出某條基線是否含有粗差的。 并且,有些在采用單分量探測時不能發現的粗差,在采用整體探測模型時能夠探測出來。
比較兩種探測粗差構造統計量的方法可以發現,采用按基線整體構造統計量的探測模型,由于尋找到了該條基線構造的統計量在空間中的最大值,因此,更加容易探測出不易發現的粗差,此外,按照基線逐條探測相比較于逐個基線分量觀測值探測工作量大幅減少,效率更高。