夏力
(漳州市測繪設計研究院,福建 漳州 363000)
在工程測量中,如果測量員嚴格按照測量規范進行測量,外界因素引起的測量精度不達標這一情況一般是可以避免的。對于系統誤差,數據處理時只需要根據一定的規范通過限差檢查得到消除或減弱的。而對于粗差,特別是相對來說比較小的粗差,由于其與系統誤差和偶然誤差難以區分,造成整個水準網平差后的單位權中誤差超限時,運用粗差探測理論可以快速發現含有較大誤差的觀測值并直接進行返工觀測[1,2]。當該模型中,多余觀測值較多時,直接剔除后再平差,就可以使單位權中誤差在限差范圍之內,不僅避免了返工的盲目性、節省工程時間和費用,還保證了測量成果的可靠性。因此,研究粗差探測理論有著其實際意義。
1968年巴爾達在論文《用于大地網的檢驗過程》中提出了關于粗差檢驗的理論和方法。從此奠定了粗差探測理論研究的基礎。巴爾達數據探測法是把粗差作為函數模型誤差,以標準化殘差作為統計量的大小判斷觀測值是否存在粗差,然后將標準化殘差超限的觀測值剔除后重新平差[3]。但是對于每次只能剔除一個粗差,對于多個粗差同時存在時,該方法就有可能失效。以1964年由Huber發表的《定位參數的穩健估計》論文為理論基礎,幾十年來,穩健估計理論經過眾多數理統計學家的開拓和發展創新,使得穩健估計作為一種抗差估計,逐步引入測量界[4]。該方法把粗差作為一種隨機模型誤差,從最小二乘平差原理出發,研究數據處理中如何抵抗和消除粗差對數據的干擾。近年來,我國的測量學者通過對該方法的不斷研究,逐步形成了抗差估計法抵抗粗差的概念。1996年,於宗儔和李明峰發表了《多維粗差同時定位定值法》,其思想是給定改正數絕對值總和最小這一條件來實現多個粗差的定位和定值。1999年,歐吉坤發表的《粗差的擬準檢定法》,從真誤差與觀測值之間的關系出發,在多維粗差的定位和定值上也取得了良好的效果[4]。
穩健估計的研究目的主要是為了抵抗和消除粗差對數據的干擾[5]。其基本思想是在粗差不可避免的情況下,選擇適當的估計方法,使參數的估計值盡可能避免粗差的影響,得到正常模式下的最佳估值[6],穩健估計的選權迭代法就是在平差過程中經過多次迭代來變權,使包含有粗差的觀測值的權函數不斷接近為零,進而在平差中不起作用,實現參數估計穩健性的一種方法[7]。
IGG法作為穩健估計選權迭代法中的一個算法,其思想是利用測量誤差的有界性給定一組權函數,把改正數與單位權中誤差估值的比值|ui|小于k0(k0=1.5~2)的值定權為1,大于k1(k1=2.5~3)的值定權為0。IGG方案是基于測量誤差的有界性提出來的,它對測量抗差估計比較有效。其等價權因子取為:
(1)

這種方式處理含粗差的觀測值,把越界的觀測值當作粗差直接剔除,數據收斂塊,平差后驗后單位權中誤差也很小。但是由于粗差對每個改正數都會有影響,如果權函數選擇不合理,就有可能使沒有粗差的觀測值改正數越界,即|ui|>k1時,把不含粗差的觀測值的權降為0,從而向錯誤的方向進行計算。
數據探測法的核心思想是將標準化殘差作為統計量,以標準化殘差的大小判斷觀測值是否存在粗差,然后將標準化殘差超限的觀測值剔除后重新平差[8]。由于最小二乘平差的牽連效應,一個觀測值的殘差會使多個觀測值的標準化殘差超出限差,實際計算中并不是將所有超出限差的觀測值都作為粗差予以剔除,而是將絕對值最大且超出限差的觀測值剔除,重新平差,再進行數據探測,直到所有的標準化殘差均不超限為止[8,9]。
本文結合數據探測法和穩健估計選權的思想,針對IGG法中存在的“缺陷”,提出了一種改進的IGG法。其基本思想是在IGG原有的算法上,先不將|ui|>k1的觀測值的權降為0,而是取|ui|中使|ui|>k1的所有觀測值,按照從大到小的順序依次將相應的觀測值的權降為相對于|ui|的極小值,然后分別比較相應的單位權中誤差估值。當有觀測值的權為極小,而單位權中誤差的估值為最小時,可以認為該觀測值存在較大誤差或粗差,將該觀測值視為粗差組且權值為極小。然后重新平差繼續尋找,如此反復,直到通過數據探測的整體檢驗且觀測值改正數變化值極小為止。其具體粗差探測模型及步驟為:
(2)

(1)選取使|ui|>3的所有觀測值,按照從大到小依次將其權降為一固定極小值后平差。比較平差后的驗后單位權中誤差。
(2)將單位權中誤差為最小的觀測值的權降為式(1)中給定極小值,其余觀測值的權按式(2)計算。
(3)用最小二乘平差法計算選權后的驗后單位權中誤差,當通過數據探測法的整體檢驗后繼續按式(2)定權,直到觀測值改正數變化極小。否則重復上述步驟(1)、(2)直到通過整體檢驗且觀測值改正數變化值極小為止。
此粗差探測模型中k0取值為1.5,k1取值為3,是基于測量誤差的有界性來確定的(按照誤差服從正態分布理論,誤差分布在3倍中誤差以外的概率趨近0)。判定粗差存在的標準是通過數據探測法的整體性檢驗,當整體性檢驗沒通過時,說明數據中存在粗差,但粗差的定位和定值并不明確,此時,借助改進的IGG法可以較準確地定位且定值粗差。
此算法相比傳統的IGG法的主要理論優勢有:
①由于最小二乘平差的牽連效應,數據中粗差存在可能會導致部分實際無粗差觀測值的|ui|>k1而直接被淘汰,從而造成“錯殺”,改進的方法則通過對可能存在粗差的觀測值進行一一判別后避免。
②改進的方法將含粗差的觀測值的權置為相對于|ui|的極小值,經過反復的選權迭代,可以對粗差定值。
例1:一水準網布設如圖1所示,A、F是已知高程的水準點,其高程值分別為 10.015 m、21.429 m,且假設已知高程點無誤差。圖1中,B、C、D、E、G為待定點,以每公里中誤差1(mm)為單位權中誤差。相應的數據如表1所示:

圖1 水準網線路圖

水準網中相應觀測數據 表1
用最小二乘法對水準網進行平差計算,得到相應的數據如表2所示:

水準網平差后觀測值數據統計 表2
經粗差探測檢驗顯示無粗差,在h2中加入 5 cm粗差后,相應的A到D的高差為 14.055 m,運用最小二乘平差后,相應的數據如表3所示:

線路2中加入5 cm粗差后平差后觀測值數據統計 表3
(1)IGG法
權因子為:
(3)

根據其權函數式子,最小二乘平差后,可以得到第一次迭代后相應的權因子分別為:
W=(0.82,0,0,1,1,0.96,1,0.74,1,0)
此時,根據W的結果,線路2,3,10的權為0,說明相應的觀測數據均被淘汰,雖然此例中除去三個觀測值后,仍然可以平差得出較好的結果(此時自由度降為2),但也損失了部分實際無粗差的觀測值。
(2)改進的IGG法
由表3中的改正數大小,得到使|ui|>3的觀測值按照從大到小的順序分別為線路2,3。將線路2,3的觀測值的權分別降為10-6后得到的單位權中誤差估值分別為1.228,3.78。將線路2的觀測值歸為粗差組,權置為10-6,重新平差后得到的單位權中誤差估值為1.228。然后進行數據探測的整體性檢驗。
給定顯著性水平α=0.05下,根據統計檢驗服從F0.05(5,)的F分布,得其臨界值為2.21,由數據探測法中的整體檢驗公式有:
(4)
此時,T小于臨界值,則說明觀測值中除了線路2,其余觀測值不包含粗差。為了檢驗該方法粗差的定值效果,平差后定權得到改正數如表4所示:

線路2中加入5 cm粗差后IGG法和改進的IGG法觀測值改正數統計 表4
同樣選取例1中數據,在線路2和線路7中分別加入 5 cm和 10 cm的粗差后,運用最小二乘平差,計算結果如表5如下:

線路2、7中加入粗差后平差數據統計 表5
用IGG法進行粗差探測時,線路2,6,7,8的數據均被淘汰,水準網因缺少必要觀測數據而無法計算,需要外業補測這4段數據方可。
而用改進的IGG法進行粗差探測,則可以通過對數據一一判別,得到理想的結果。其改正數結果如表6所示:

線路2、7中加入粗差后IGG法及改進的IGG法粗差探測改正數結果統計 表6
根據表4和表6中數據可以看出改進的IGG法粗差定值功能比較準確。
例2:某沉降監測項目中一水準網測段數據如表7所示,根據對測區水準數據整網平差后得到一期觀測數據成果,GCPI139高程為 121.388 m,GCPI142高程為 180.888 m。本例中假設這兩已知點之間高差無誤差,且以每公里中誤差 1 mm為單位權中誤差。

水準網中相應觀測數據 表7
用最小二乘法對水準網進行平差計算,得到相應的數據如表8所示:

水準網平差后觀測值數據統計 表8
經整體性檢驗后顯示無粗差存在。
在線路7(0371H21到0373H21段)中加入1 cm的粗差后進行整體性檢驗,給定顯著性水平α=0.05下得到其F分布臨界值為 1.938 5,此時統計量值為 2.717 1,說明未通過整體性檢驗,顯示有粗差存在。
現在用IGG法和改進的IGG法進行粗差探測,經整體性檢驗通過后分別算得改正數如表9所示:

IGG法和改進的IGG法算得改正數的結果統計 表9
從表8和表9中數據可知,IGG法在此例中剔除了線路6中數據,而加入的粗差被錯誤地分配到了其他線路,而本文改進的IGG法則準確地定位到了粗差的位置且定值效果良好。
IGG法進行粗差探測時,由于殘差對各個觀測值均有不同程度的影響,可能會導致沒有粗差的觀測值殘差很大,運用該算法時粗差探測有可能會失效。本文從粗差對觀測值改正數的影響入手,基于IGG法和數據探測法思想,提出一種改進的IGG法。通過”揚長避短”,得到了較好的粗差探測效果。
但是,大量研究表明,使用單一方法對測量數據中粗差探測效果總是不盡人意[10]。粗差的探測涉及理論和算法兩個方面,能夠對粗差在不同的平差問題及各式各樣的存在形式,都可以對其進行準確的定位和定值,仍需要進行長期的探索研究。