馮壯壯,徐 工
(山東理工大學(xué) 建筑工程學(xué)院,山東 淄博 255049)
病態(tài)問題廣泛存在于大地測(cè)量控制網(wǎng)平差、航空重力向下延拓和GPS快速定位等領(lǐng)域中,線性方程組設(shè)計(jì)矩陣具有嚴(yán)重的復(fù)共線性,數(shù)據(jù)微小的變化對(duì)導(dǎo)數(shù)參數(shù)估計(jì)結(jié)果產(chǎn)生較大的影響[1]。雖然線性最小二乘具有線性無偏性和方差最小性,但由于小奇異值影響方差被嚴(yán)重放大,得不到所期望的結(jié)果。目前處理線性最小二乘病態(tài)問題的算法多以正則化理論為基礎(chǔ),通過修正設(shè)計(jì)矩陣病態(tài)性或者避免矩陣求逆來提高參數(shù)估計(jì)的解[2-3]。較常用的線性正則化算法有截?cái)嗥娈愔捣椒?TSVD)、Tikhonov算法和兩參數(shù)LIU估計(jì)等[4-5]。正則化算法是通過引入偏差量來降低方差,從而提高參數(shù)解的精度和穩(wěn)定性[6]。
TSVD實(shí)質(zhì)為分割法,該方法將小奇異值及其對(duì)應(yīng)的奇異分量刪除,保留大奇異值及其對(duì)應(yīng)的主成分信息,雖然能夠提高解的穩(wěn)定性和精度,但降低了解的分辨率[7]。標(biāo)準(zhǔn)Tikhonov方法對(duì)線性方程組設(shè)計(jì)矩陣無差異修正,引入了偏差量,降低了參數(shù)估計(jì)的可靠性[8]。此外,截?cái)鄥?shù)和正則化參數(shù)的確定問題是制約線性正則化算法求解精度和穩(wěn)定性的主要因素,常用的正則化算法有L曲線、方差最小法、和GCV廣義交叉法[9-11]。但由于問題復(fù)雜性,各種算法都有其實(shí)用性和局限性,即使最為經(jīng)典的L曲線法,針對(duì)某些問題也會(huì)出現(xiàn)無法收斂的問題,為此開展新的正則化參數(shù)確定方法顯得尤為重要,比如最近基于L曲線法發(fā)展起來的U曲線法,克服了L曲線法的不足,能夠更為準(zhǔn)確的定位正則化參數(shù)[12-13]。
本文針對(duì)TSVD方法和標(biāo)準(zhǔn)Tikhonov方法存在的不足,基于兩種算法處理病態(tài)問題的思想,根據(jù)奇異值分布空間差異性,提出了一種混合正則化方法。該方法主要是將奇異值進(jìn)行分割,保留大奇異值及其主成分信息,采用正則化參數(shù)來修正小奇異值及其奇異分量,以提高解的精度和參數(shù)估計(jì)的可靠性,最后采用實(shí)驗(yàn)驗(yàn)證了該方法的有效性。
設(shè)觀測(cè)向量為L(zhǎng)=[L1,L2,…,Ln]T,改正向量為V=[V1,V2,…,Vn]T,則誤差方程為
V=Ax-L
(1)
式中,A為系數(shù)矩陣,x為待求參數(shù)向量。線性最小二乘目標(biāo)函數(shù)為
φ(x)=VTV
(2)
根據(jù)最小二乘定理,按照拉格朗日求極值的思想,可解得線性最小二乘估計(jì)解為
xLS=(ATA)-1ATL
(3)
參數(shù)估值的協(xié)方差陣為
(4)

(5)
式中,λ1>λ2>…>λm為設(shè)計(jì)矩陣的奇異值。最小二乘估計(jì)解在線性估計(jì)類具有方差最小性。然而方程組設(shè)計(jì)矩陣呈病態(tài)時(shí),較小的奇異值能夠過度放大參數(shù)估值的方差,導(dǎo)致最小二乘求解性質(zhì)變壞。為準(zhǔn)確獲取參數(shù)估計(jì)的最優(yōu)解,改善系數(shù)矩陣秩虧或病態(tài)對(duì)參數(shù)估值的影響,可引入穩(wěn)定泛函極小準(zhǔn)則,將最小二乘優(yōu)化問題轉(zhuǎn)化為
φ(xtik)=VTV+αxTRx
(6)
式中,α為正則化參數(shù),用來平衡解的不穩(wěn)定性和光滑性;R為正則化矩陣,主要是平滑參數(shù)分量和殘差分量。根據(jù)拉格朗日求極值的思想,基于穩(wěn)定泛函極小準(zhǔn)則可得Tikhonov正則化解為
xtik=(ATA+αR)-1ATL
(7)
Tikhonov正則化是一類通過修正病態(tài)矩陣而降低均方誤差的有偏估計(jì)理論。嶺估計(jì)是正則化矩陣為單位陣的Tikhonov正則化的特例,稱為標(biāo)準(zhǔn)Tikhonov正則化,其估計(jì)解為
xtik=(ATA+αI)-1ATL
(8)
嶺估計(jì)在修正病態(tài)矩陣的同時(shí),不可避免的引入了偏差量。嶺估計(jì)參數(shù)估值的協(xié)方差陣為
(9)
則參數(shù)估值協(xié)方差陣的跡為
(10)
嶺估計(jì)的偏差計(jì)算公式為
bias(xα)=E(xα)-x=
(ATA+αI)-1ATEL-x=
((ATA+αI)-1ATA-I)x=
-α(ATA+αI)-1x
(11)
綜上分析,嶺估計(jì)無差別修正雖能夠良好的修正小奇異值的奇異分量,但不可避免的給大奇異值的主成分信息摻入了虛假信息,以致于標(biāo)準(zhǔn)Tikhonov正則化算法有效降低LS估計(jì)的均方誤差的同時(shí)不可避免的引入了偏差。為此,正則化矩陣的合理構(gòu)造是提高Tikhonov正則化估計(jì)解的可信度的重要手段之一。

(12)
式中,k為截?cái)鄥?shù)且1≤k≤m,該值主要是根據(jù)奇異值和正則化參數(shù)值的相對(duì)關(guān)系進(jìn)行確定,該方法能夠?qū)⑿∑娈惡痛笃娈愔颠M(jìn)行分割處理,這樣既能夠保留大奇異值及其對(duì)應(yīng)的主成分信息,也能夠采用Tikhonov正則化方法對(duì)小奇異值及其對(duì)應(yīng)的奇異信息進(jìn)行修正。
(13)
式(13)稱為混合正則化方法,該方法能夠保證解的分辨率,又能降低偏差量的引入,相比于嶺估計(jì)和截?cái)嗥娈愔捣煽啃愿摺?/p>
正則化估計(jì)的作用效果主要取決于正則化參數(shù)的選擇。獲取正則化參數(shù)較常用的方法,主要有GCV交叉檢驗(yàn)法、L曲線法和U曲線法,本文將采用U曲線法確定正則化參數(shù)。U曲線法基于SVD分解理論,由正則化參數(shù)α>0的殘差范數(shù)的倒數(shù)平方和信號(hào)范數(shù)的倒數(shù)平方之和定義U(α)。以U(α)為縱軸,α為橫軸所表示的曲線形狀U曲線,故稱為U曲線法,定義為
(14)

(15)
式中,U(α)′、U(α)″分別是U(α)的一階導(dǎo)數(shù)和二階導(dǎo)數(shù),并且
(16)
采用文獻(xiàn)[14]模擬空間測(cè)邊網(wǎng)的案例。設(shè)P1,P2,...,P9為9個(gè)已知點(diǎn),且已知點(diǎn)到待測(cè)點(diǎn)P10,P11(模擬值分別為(0,0,0) 和(7,10,-5)的觀測(cè)距離即表1所示,兩個(gè)待測(cè)點(diǎn)的觀測(cè)距離為13.107 85,觀測(cè)圖形如圖1所示,要求根據(jù)19個(gè)觀測(cè)距離確定待測(cè)點(diǎn)的坐標(biāo)。距離為等精度觀測(cè),中誤差為±0.001 m。假定坐標(biāo)近似值為(0.01,-0.01,0.02)和(7.01,9.99,-5.01)。經(jīng)計(jì)算設(shè)計(jì)矩陣條件數(shù)為cond(N(x))=4.601 5×103,表明方程組具有嚴(yán)重的病態(tài)性。
表1 測(cè)邊網(wǎng)控制點(diǎn)坐標(biāo)和已知觀測(cè)距離
Tab.1 Control point coordinates of trilateration network and known observation distance

點(diǎn)號(hào)坐標(biāo)觀測(cè)距離XYZdi,10di,11P123.00010.000 0.01025.078 616.765 17P2- 10.000 9.9900.00014.134 517.719 65P335.00010.010- 0.01036.415 928.442 94P4100.00019.9900.005101.479 493.168 39P5- 36.00010.005- 0.00037.364 243.299 05P60.00010.010- 0.00510.010 08.600 60P756.000 9.9950.01056.996 149.256 18P8- 15.00010.015- 0.01018.035 922.559 66P9-1.700 010.0080.01510.150 610.043 82

圖1 測(cè)邊網(wǎng)平面觀測(cè)圖形Fig.1 Plane observation graph of trilateration network
圖2給出了U曲線確定正則化參數(shù)的變化曲線圖,由圖可知,U曲線確定正則化參數(shù)相對(duì)于L曲線法不同之點(diǎn),是U曲線存在兩個(gè)極值點(diǎn),通過兩個(gè)極值點(diǎn)去逼近最佳正則化參數(shù),能夠克服L曲線法無法收斂的情況。經(jīng)確定,該案例最佳正則化參數(shù)為0.4130。分別采用LS估計(jì)、TSVD、嶺估計(jì)和混合正則化進(jìn)行解算,對(duì)比其偏差量bias和均方誤差RMSE,結(jié)果詳見表2。

圖2 U曲線確定正則化參數(shù)的變化曲線圖Fig.2 The curve diagram of U curve determining regularization parameter
表2給出不同方法的對(duì)比結(jié)構(gòu)。由表能夠看出,LS估計(jì)由于線性方程組病態(tài)的影響,其估計(jì)解以偏離真實(shí)解。嶺估計(jì)和截?cái)嗥娈愔捣椒ň岣吡司€性估計(jì)解的精度,但嶺估計(jì)作用于小奇異值及其奇異值分量時(shí),也會(huì)給大奇異值及其主成分信息摻雜虛假信息,降低了解的可靠性。截?cái)嗥娈愔捣椒ń档土私獾姆直媛?。本文提出的方法,所?jì)算的結(jié)果優(yōu)于嶺估計(jì)和截?cái)嗥娈愔捣?,相比于兩種方法可靠性更好。這是因?yàn)樘岢龅姆椒軌蚪档土似畹臄z入量,減少對(duì)解分辨率的影響。
表2 不同方法的解空間對(duì)比表
Tab.2 Solution space comparison table for different methods

參數(shù)真值LS估計(jì)/m嶺估計(jì)/mTSVD/m新方法/mX1 0-0.036 8-0.032 8-0.064 8-0.044 6Y100.051 80.008 0-0.017 10.029 5Z109.363 10.295 40.143 20.088 2X277.048 86.980 36.977 76.973 2Y2105.596 39.882 19.687 810.038 1Z2-5-4.648 2-4.914 9-4.960 4-4.871 7Bias010.353 30.331 60.352 90.171 1RMSE04.226 70.135 40.144 10.069 8
線性方程組求解過程中,若設(shè)計(jì)矩陣具有病態(tài)性,即使最小二乘具有線性無偏性和線性無偏估計(jì)類的方差最小性,但也會(huì)由于奇異值及其奇異分量的影響,方差被過度放大,最小二乘性質(zhì)變壞。截?cái)嗥娈愔捣椒m能夠提高線性估計(jì)解的精度,但會(huì)降低解的分辨率,嶺估計(jì)無差異修正方式,會(huì)給大奇異值及其主成分信息摻雜虛假信息,參數(shù)估計(jì)產(chǎn)生偏差,降低解的可靠性。本文提出的方法,能夠分割處理大奇異值和小奇異值對(duì)應(yīng)的成分信息,降低偏差量的攝入,提高了參數(shù)估計(jì)的可靠性和精度,最后實(shí)驗(yàn)驗(yàn)證了該方法的解算精度明顯優(yōu)于嶺估計(jì)和TSVD方法。