韋子豪
(華北理工大學礦業工程學院,河北 唐山 063210)
根據現代誤差理論,從科研實驗以及生產活動里收集的數據,其基礎數據在輸入空間數據平臺的階段,將出現不確定性,以及可能因為量測設備的固有精度、量測技術、實施方案等的局限性和差異性而引入不同程度的誤差,粗差的出現是不可避免的。為了獲得準確的變形監測解析數據,在數據的處理過程中需采取恰當的方法對粗差展開測定和篩除。粗差的處置一般能夠劃分成兩類:一種是先把包含粗差的測量值運用統計檢測的方法予以篩除,然后執行數據操作;第二種是把包含粗差的測量值視作方差反常,采取穩健估計方式予以處理,這是把粗差劃分為隨機模型,經過定權來清除粗差對測量結果造成干擾的一類辦法。
傳統最小二乘估計的手段由于難以排除粗差的干擾,產生了缺陷,不過穩健估計的手段可以憑借在數據中實施加權使得粗差信息的權值降低進而排除粗差帶來的影響,從而讓數據的穩定性增強,可以應對變形監測的要求。鑒于此,本文在對變形監測的數據進行處理時,運用穩健估計的方法,對其抗粗差特性進行深入探究,同時和常用的最小二乘法做出比較。
實驗牽涉到孔深和位移變化量兩個參量,運用的回歸模型屬于一元線性回歸模型[1]。這兩個指標參量間的關系是經過求算一個參量的線性回歸表達式來確認的,即是y=a+bx+v中a與b的數值。其中:x是孔深;y是位移變化量;v是y的更正數值;S是下沉量y的中誤差;n是觀察測定數值;a是回歸方程常數項;b是回歸方程的斜率。
由方程y=a+bx+v得:

數據的測定步驟是等權觀測,經過最小二乘法求算出a、b的數值:

中誤差:

穩健估計是隸屬于極大似然估計的一類特殊方式,可以確保所預估的參量不會受到粗差的干擾,其準則是有效運用測量數據當中的有效信息,刪掉無效數據[2]。從客觀使用階段,無法精確知曉測定數據信息中的有用信息與其所占有的比例,因此從抗粗差的目的入手,需冒著降低效率的風險,去獲得比較穩定且擁有實際效用的估計值。穩健估計一般包含了三種,主要是M-估計、L-估計與R-估計。首先,M-估計一般被解釋為極大似然估計。主要是Huber參考早期出現的M-估計進行優化升級而產生。丹麥研究者Krarup等曾將穩健估計運用到測定領域。L-估計被稱作排序線程組合預估。R-估計也被稱作秩估計。本論文選擇在測量界運用比較成熟普遍的M-估計展開數據處理與操作。
M-估計的方式有許多,運算方法近似于最小二乘法進行平差,其中便于程序實現的為選權迭代法[3],主要是按照回歸殘差的數值高低確認各位點的權重,給殘差比較大的位點賦予較小的權重或者零權值,以減弱其對回歸的干擾,實現穩健的目標。
權函數的確立屬于穩健估計的核心。在測量階段,測量誤差表現為正態分布的特征,權函數則參考測定數據的殘值情況而確定,對常規范圍區段之內的較小殘值賦上一般的權重,對比較大的殘差穩健預估會減低此測量值的權重,或者在其殘差過高時將此觀測值的權重設置為零,由此達成去掉粗差的作用[4-6]。穩健估計屬于一類特別的極大似然估計,穩健估計經過去除不利測定數值,間接地增大準確測定值權值的函數方法[7]。
穩健估計里存在一種重要的模型,即高斯—馬爾可夫模型,詳細如下:

其穩健估計準則如下:

在穩健預估過程中,對等權測定,權函數重點參考殘值的情況來確定。在非等權觀測階段,關于穩健估計應配置的權重必須考量觀測權重的干擾,在不等權觀測里,若無需考量觀測權重,一般取,但穩健估計就無法達到有效的抗差作用,對擁有穩健特性的權函數,在兼顧各個權iP的狀況之下,其預估標準為:

如果觀測值彼此不相關,則(1)~(5)式里,權函數對應的迭代模型可以歸納如下:

相應地,對于相關的觀測值,此時穩健估計的權函數模型為:

為進一步了解本研究制定方案的有效性,現將深圳某地鐵路段從建工點的基坑監測信息納入檢驗,這一基地表現出從西往東高度遞減的趨勢,且為3個臺地地形,其高程先后處在130 m、110 m、70 m~90 m,而地塊當中相對高差大致在10 m~70 m。區域東南端屬于廢舊的竹坑水庫,經測量,水面高程大致在65 m;但西側邊坡要求挖深降低高程,最大高度差約為49 m。本文數據是由CX-3C型基坑測斜儀采集得到的,本實驗選取第19期的前16組數據進行分析,如表1所示,經過驗證,該數據不含粗差。在使用最小二乘法的前提下,結合穩健估計的方法,就其回歸函數實施系數運算,評估后幾組的移動變化情況。先后探討具備粗差以及不存在粗差的情況下,兩類方式的精確性。

表1 原始監測數據
為對比最小二乘法與穩健估計在變形觀測項目數據處理中的差異,通過編寫Matlab代碼執行最小二乘法與穩健估計步驟的操作,進行程序實現,對兩者精度展開對比。同時,當觀測數據中存在粗差時,比較穩健估計法與最小二乘法的抗差性,由此體現穩健估計對粗差的抗干擾能力。
2.2.1 在不含粗差的情況下
在不包含粗差的狀況下,殘差圖如圖1所示,對回歸方程的系數依次運用最小二乘法和穩健估計的方式求算,同時獲得對應的回歸表達式,并展開比較。

圖1 不含粗差情況下得到的殘差圖
經過最小二乘法求出的方程系數為a1=1.8403, b1=-0.2099,因此回歸表達式為:

基于此,借助穩健估計的手段運算出a2=1.8463, b2=-0.2107,對應回歸方程如下:

通過兩個表達式的形式,對于不存在粗差的狀況,以上兩類方法獲取的結果基本相同,通過Matlab畫出兩者的函數曲線如圖2所示,可以看到兩條直線基本重合。比較兩類算法獲得的中誤差,最小二乘法運算所獲得的結果中誤差S1=0.4997,穩健估計運算的結果中誤差S2=0.5016,發現在不包含粗差的狀況下,最小二乘法和穩健估計所獲得的結果與精度都比較接近。

圖2 不含粗差情況下最小二乘法與穩健估計的對比圖
2.2.2 在含粗差的情況下
為了驗證穩健估計的抗差性,將原始數據中第7組的數據位移變化量改為1.65 mm,增加粗差之后結果如表2所示。

表2 加入粗差后的監測數據
所獲得的殘差圖如圖3所示,經過最小二乘法求算對應方程系數,可得 a3= 1.8903,b3= -0.2143,得到對應的回歸方程為:


圖3 在含有粗差的情況下得到的殘差圖
基于此,借助穩健估計回歸研究存在粗差的數據,從中獲取方程系數a4=1.8463,b4=-0.2107,則對應的一元線性方程如下:

在沒有粗差的情況下,最小二乘的方法與穩健回歸的方法產生的回歸模型相對一致,但在具有粗差的情況下,兩類方式產生的回歸模型存在非常明顯的差異。借助圖像能夠了解到,最小二乘法產生的回歸方程出現了往粗差值貼近的現象,但是穩健回歸下具有更顯著的抗差性。
經過把這兩類算法所獲得的方程圖像繪制在同一幅圖上如圖4所示,可知兩類算法獲得的方程圖像產生了顯著的偏離狀況,伴隨孔深的增長,變化量之間的偏差也愈來愈大[8-9]。
對比兩種運算方法獲取的中誤差,S3=0.5302為通過最小二乘法計算的中誤差值,S4=0.5016為通過穩健估計計算的中誤差值。對比發現,在監測數據含有粗差時,最小二乘法將粗差進行引入,平差結果不能反映真實情況,而穩健估計法能合理地將粗差剔除,在精確度和可靠性上均好于最小二乘法。
1)本研究借助穩健估計以及最小二乘法,就樣本基坑的監測數據實施了多項型曲線擬合,從中開展對實測數據的預估。基于兩類方法的平差情況,不存在粗差時,穩健回歸方法和最小二乘法在結果和精確度上比較接近,但最小二乘法實施起來相對簡便。而如果觀測數據中存在粗差,最小二乘法會產生粗差引入的問題,導致平差結果無法體現客觀數據,穩健估計可以有效應對粗差在平差系統的影響,解析算法則展現出良好的抗差性,合理利用有效信息,不管從精確度還是從結果的可靠性上均要好于最小二乘法。
2)在真實的測量工作過程中粗差是不可避免的誤差,能夠選取穩健估計的辦法對這類粗差進行去除,進而獲得更為精確的數據結果。同時,在監測環境受限的情況下,運用穩健估計的平差方法也可以對數據進行較為準確的預測。