龔循強,汪宏宇,魯鐵定,游 為
(1.東華理工大學 測繪工程學院,江西 南昌 330013;2.自然資源部 環鄱陽湖區域礦山環境監測與治理重點實驗室,江西 南昌 330013;3.西南交通大學 地球科學與環境工程學院, 四川 成都 611756)
高速鐵路橋墩施工過程中非均勻荷載,以及高速鐵路運行后線路周邊的環境惡化,都有可能引起高速鐵路橋墩發生不均勻沉降,這勢必導致軌道幾何狀態惡化,從而對高速鐵路安全運營造成威脅[1-2]。因此,對高速鐵路橋墩沉降進行嚴格把控,是高速鐵路平穩、安全和高速運行的重要保障[3]。對于無砟軌道沉降變形監測工程,橋墩在施工后的沉降量不大于20 mm,同時應確保相鄰橋墩沉降量相差不超過5 mm[4]。在高速鐵路施工及運營時期進行高速鐵路橋墩沉降變形監測,根據監測所得高速鐵路橋墩沉降觀測值,對橋墩未來沉降量進行預測,判斷高速鐵路橋墩是否滿足規劃和運營要求,為高速鐵路的安全運營提供指導。
目前,沉降數據預測主要方法有曲線預測方法、灰色模型預測方法、人工神經網絡預測方法等[5-6]??紤]建模復雜度以及高速鐵路橋墩實際沉降規律,實際工程中主要采用曲線預測方法。其中,曲線為S形的Logistic模型能較好地反映高速鐵路橋墩沉降的全過程[4,7]。Logistic模型參數估計中,通常會根據經驗確定增長極限,將Logistic模型轉換為線性方程求出參數的最小二乘估計。顯然,這種線性化方法缺乏足夠的客觀性[8]。因此,可將Logistic模型參數估計看作非線性最小二乘問題,求解參數的非線性最小二乘估計,以減少主觀影響。高速鐵路橋墩沉降數據中異常值不可避免,而非線性最小二乘方法沒有考慮觀測值中所包含的異常值。因此,減弱異常值在參數估計中帶來的負面影響,是提高模型預測精度的關鍵因素之一。
單一Logistic模型雖然能夠較好地在整體上反映高速鐵路橋墩沉降數據趨勢,卻不能在細節上反映數據波動性。
為此,采用非線性最小二乘方法中Levenberg-Marquardt(LM)法,通過引入穩健估計,建立穩健的LM(Robust LM,RLM)法,從而優化曲線模型參數和削弱異常值擾動。在此基礎上,利用馬爾可夫鏈(Markov Chain,MC),構建馬爾可夫模型,改善單一曲線模型無法有效反映高速鐵路橋墩沉降數據存在隨機波動的問題,從而提高預測精度。本文通過組合RLM方法和馬爾可夫鏈,提出一種基于穩健Levenberg-Marquardt和馬爾可夫鏈(RLM-MC)的曲線預測方法,并根據高速鐵路橋墩沉降實際觀測值,將本文方法與最小二乘(Least Squares,LS)法、穩健最小二乘(Robust Least Squares,RLS)法、LM法和RLM法進行比較分析,驗證方法的有效性。
基于穩健Levenberg-Marquardt和馬爾可夫鏈的曲線預測方法是在曲線預測方法的基礎上發展而成的。
曲線預測方法是建立在根據某種曲線函數建立模型,對預測對象歷史觀測數據進行擬合,從而使得模型能夠描述該對象在時間推移下的變化過程。因此,選取符合高速鐵路橋墩沉降規律的曲線模型和合理的擬合手段是曲線預測方法的關鍵。
曲線預測方法在沉降預測問題中常用的模型包括指數曲線模型、雙曲線模型、Logistic模型等[9]。其中,Logistic模型又稱為生長曲線模型,常用于描述事物的發生、發展和成熟三個階段[10-11],這種S形型的生長曲線能夠較好地反映高速鐵路橋墩沉降整個過程。Logistic模型計算式為
( 1 )
式中:a、b、c為待解算參數;x、y分別為觀測時間、觀測值。
線性化是曲線擬合的重要手段之一。通過變量代換將曲線方程線性化,依據最小二乘原理求解變換后的線性方程,再將所得線性方程轉換為原曲線方程。

為使參數估計結果更具客觀性,本文將Logistic模型參數估計作為一個非線性最小二乘問題。常用的非線性最小二乘方法有最速下降法、高斯-牛頓法、LM法等[12-13]。
LM法是非線性最小二乘問題廣泛應用的一種算法,其結合最速下降法與高斯-牛頓法的優勢,優化了迭代效率,有效解決矩陣奇異和非正定問題[14-16]。
設曲線模型f(x)的參數向量為β,則存在非線性誤差方程
V=f(β)-Z
( 2 )
式中:V為殘差向量;f(β)為參數β的擬合結果;Z為實際觀測值組成的向量。
設βk為第k次迭代參數向量,則LM方法第k+1次迭代的參數向量βk+1為
βk+1=βk-(JTJ+uI)-1JTV
( 3 )
式中:J為V的雅可比矩陣;u為懲罰因子;I為單位矩陣。
當殘差向量V中含有異常值時,會導致參數β偏離預期值。為抵抗異常值影響,本文引入穩健估計[17],則相應的抗差解為
βk+1=βk-(JTPJ+uI)-1JTPV
( 4 )
式中:權陣P選擇IGG權函數進行計算,IGG權因子計算式為[18]
( 5 )

若存在一個離散的隨機過程,其時間參數是離散的集合T={0,1,2,…,t},所對應的狀態空間E=(E0,E1,E2,…,Et),對任意時刻t(t∈T)滿足:pb={pbn+1=En+1|pbn=En},即未來n+1時刻的狀態En+1僅與當前n時刻的狀態En相關,而與過去的狀態無關,這稱為馬爾可夫鏈的“無后效性”[19-20]。
時間序列統計量多數都具備馬爾可夫性質,利用這一性質可有效提高模型的預測精度[21]。馬爾可夫模型修正預測值主要過程如下所述。
(1)狀態劃分
根據曲線模型模擬值的相對誤差大小,采用聚類方法并結合IGG權因子結果剔除異常期數,將相對誤差區間分為d個狀態。其中,d的計算式為
( 6 )

(2)狀態轉移概率
狀態Si經一步狀態轉移到狀態Sj的概率pbij為
( 7 )
式中:Mij為狀態Si經一步轉移到狀態Sj的次數;Mi為Si發生一步轉移的次數。
計算所有狀態的狀態轉移概率,則其構成的矩陣為
( 8 )
式中:矩陣PB稱為狀態轉移概率矩陣。最后根據矩陣PB和當前時刻狀態Si,則可得下一時刻最可能所處的狀態Sj。
(3)預測值修正

( 9 )
式中:δs為預測值所處狀態對應的相對誤差;x為觀測時間;f(x)為原始預測值。
基于RLM-MC的曲線預測方法具體流程見圖1,主要步驟為:首先,使用嘗試法結合黃金分割法確定參數a的估值[8],即可利用LS方法估計曲線模型參數,再將參數的LS估值作為RLS方法迭代的初值;然后,將參數的RLS估值作為RLM方法迭代的初值,完成Logistic曲線擬合;最后,結合馬爾可夫模型修正Logistic模型預測值。

圖1 本文方法流程
本文方法具體計算步驟如下:

Step2計算權陣P=pW,再利用式( 2 )計算觀測值殘差向量。
Step3取k0=1.5、k1=2.5,根據式( 5 )確定一組新的權因子,可得權因子矩陣,進而得到新的權陣P。
Step4利用式( 4 )計算參數的穩健LM估值。
Step5重復Step2~Step4,直至JTPV≤10-10或迭代次數k大于最大迭代次數kmax(kmax通常在20~50之間選取[22-23],本文令kmax=30)。滿足條件后退出迭代,則獲取參數RLM估值及曲線模型預測值。
Step6計算曲線模型模擬值相對誤差,根據式(6)計算狀態區間個數,通過k-means聚類并結合IGG權因子計算結果剔除異常期數,從而確定每個模擬值所處狀態。
Step7以式( 7 )計算狀態轉移概率矩陣,預測后續狀態。
Step8根據預測狀態,利用式( 9 )修正曲線模型預測值,得到最終預測值。
以上闡述了基于RLM-MC的曲線預測方法,為驗證本文方法的有效性,采用兩組高速鐵路橋墩沉降觀測數據進行試驗,將所得結果與LS法、RLS法、LM法和RLM法的預測結果進行比較分析。
試驗使用的兩組高速鐵路橋墩沉降觀測數據來自西安—成都某高速鐵路,每組沉降觀測數據包含2014—2015年20個定期沉降觀測值[24],見表1、表2。兩組數據均設置1~17期為模擬區間,18~20期為預測區間。

表1 第一組觀測數據 mm

表2 第二組觀測數據 mm
對于LS、RLS、LM和RLM法的參數估計結果,使用單位權方差進行定量評估,單位權方差能反映模擬值與實際值的離散程度,從而體現參數估計結果的優劣。單位權方差越小,離散程度越小,則參數估計精度越高,單位權方差σ02計算式為
(10)
式中:n為模擬期數。
預測精度采用以下三個精度指標定量評估。平均絕對誤差MAE為最基本的評定指標,概念簡單易于解釋,只衡量預測值誤差的平均模長,直接反映預測值與真實值之間的誤差情況。均方根誤差RMSE相對MAE,易受偏差較大的預測值影響,導致放大RMSE的結果,因此可比較不同模型的穩定性。平均絕對百分比誤差MAPE考慮了誤差與真實值之間的比例,可以比較不同尺度下預測結果的好壞。
MAE、RMSE和MAPE越小,則預測結果準確度越高,其定義分別為
(11)
式中:[n+1,N]為預測區間范圍;i為預測期數;zi、f(i)分別為相對應的實際觀測值和預測值。
采用兩組高速鐵路橋墩沉降觀測數據進行試驗,分別利用LS、RLS、LM和RLM法進行參數估計,并通過馬爾可夫模型修正RLM法預測結果。模型參數估計結果,從各方法的模型和單位權方差等方面進行比較分析,并采用MAE、RMSE和MAPE等評定指標對預測結果進行評估。
根據表1數據,分別利用LS、RLS、LM和RLM法對曲線預測模型進行參數估計。結合嘗試法和黃金分割法計算參數a粗略估值,由于試驗數據沒有明顯地放緩趨勢,黃金分割區間的選取可略微偏大[8],本文選取模擬區間最后一期數據設為黃金分割區間下限,并將下限值的5倍設為黃金分割區間上限,則該區間為[1.740, 8.700]。對該區間進行一次搜索的結果作為參數a的粗略估值,即a=1.74+(8.70-1.74)×0.618 ,即得到參數a的粗略估值為6.041,接著進行LS、RLS、LM和RLM法的參數估計。參數a、b、c和單位權方差σ02見表3。

表3 第一組試驗各方法估計結果比較
LS與RLS法的參數a并未參與迭代運算,LS方法在不能迭代調整參數的情況下,參數a在一定程度上直接決定了參數b、c,這導致LS法b、c參數估計結果相對其他方法偏大,其單位權方差也大于其他方法。RLS法雖然不能調整參數a,但引入穩健估計后能動態調整參數b、c,單位權方差低于LS法,顯然減少了參數a帶來的主觀影響。RLM法所得單位權方差相對LS法減少了54.545%,而RLS和LM法相對LS法僅分別減少了13.636%與6.818%。RLM法單位權方差遠小于LS、RLS和LM法,在所有方法中表現最優,說明在第一組觀測數據中采用RLM法進行參數估計精度更高。
得到參數a、b和c的RLM估值后,即可根據式( 1 )計算模擬值,并計算模擬值的相對誤差。由于第一期沉降值為0無法計算相對誤差,所以相對誤差和狀態劃分均從第2期開始計算。
根據式( 6 )計算得出,相對誤差需劃分為4個狀態,使用k-means聚類將相對誤差分為4類(4個狀態),即可確定每期模擬值相對誤差的所處狀態,再結合RLM計算的權因子剔除可疑期的相對誤差對聚類質心結果的影響,將每個狀態的聚類質心作為其對應的相對誤差。最后,得到的4個狀態以及所對應的相對誤差為δS1=-6.171%,δS2=14.422%,δS3=-43.387%,δS4=1.927%。每期數據的具體模擬值、權因子w和狀態S劃分見表4。

表4 RLM方法模擬值、權因子和狀態劃分
根據表4及狀態轉移概率矩陣可知,17期所處狀態為S1,在狀態轉移概率矩陣中S1最有可能一步轉移到S1,其概率為0.75,則可認為第18期預測值所處狀態最有可能為S1。根據式( 9 )通過狀態S1所對應的相對誤差修正第18期預測值,同理依次可得后續預測值。各方法模擬值的殘差絕對值見圖2,各方法預測結果見表5。

表5 第一組試驗各方法預測值 mm

圖2 第一組試驗各方法模擬值的殘差絕對值
由圖2、表5可以看出,LS法相對其他方法在單位權方差偏大的情況下,預測結果整體變差,預測精度相對較低。RLS法因引入穩健估計,參數b、c的結果不會完全取決于參數a的估值,減少了人為主觀因素影響,提高了參數估計精度,因此,預測精度相比LS方法略微提高。LM法預測結果與RLS法相近,引入穩健估計后得到的RLM法預測結果比LS法、RLS法和LM法都更接近實際觀測值,并在使用馬爾可夫模型修正預測值后,精度得到了進一步提高。為更直觀地體現不同方法的精度變化,根據式(11)計算預測值的三個精度指標,結果見表6。

表6 第一組試驗各方法預測精度指標
從表6可以看出,每種方法所得的MAE和RMSE均十分接近,這表明在第一組觀測數據的試驗中,沒有出現相對偏差較大的預測。進一步分析可以得到,LM法比LS法的RMSE減少了37.309%,RLM法比LM法的RMSE減少了37.073%,RLM法經過馬爾可夫模型進一步修正后,RLM-MC法比RLM法的RMSE減少了76.744%。本文方法相對最小二乘方法的RMSE減少了90.826%,MAPE由16.548%下降到1.339%,預測精度得到顯著提高。因此,在第一組觀測數據的試驗中,RLM方法參數估計精度最優,并在結合馬爾可夫模型后,RLM-MC法預測結果遠好于其他方法,說明采用RLM-MC法進行預測更加合理。
根據表2數據,同樣使用嘗試法結合黃金分割法,確定黃金分割區間[1.550,7.750],即得參數a=5.382。分別利用LS、RLS、LM和RLM方法對曲線預測模型進行參數估計,求出參數a、b、c和單位權方差σ02,其結果見表7。

表7 第二組試驗各方法的估計結果比較
在第二組觀測數據中,RLS法相對LS法,RLM法相對LM方法,穩健估計均有效削弱了異常值擾動對參數估計帶來的影響,其單位權方差分別減少了30.233%和40.000%。同時,比較LM法與LS、RLS法的單位權方差可以看出,LM方法單位權方差小于LS法,接近RLS法,相比LS法單位權方差減少了18.605%,說明即使未引入穩健估計,非線性最小二乘在參數估計中,仍具有一定的優越性。
同樣根據式( 6 )計算得出,相對誤差需劃分為4個狀態,使用k-means聚類將相對誤差分為4類(4個狀態),則得到的4個狀態以及所對應的相對誤差為S1=-28.287%,S2=12.127%,S3=-2.663%,S4=78.883%。每期數據的具體模擬值、權因子和狀態劃分見表8。

表8 RLM方法模擬值、權因子和狀態劃分
根據表8及狀態轉移概率矩陣可知,17期所處狀態為S3,在狀態轉移概率矩陣中S3最有可能一步轉移到S3,其概率為1。根據式( 9 )通過狀態S3所對應的相對誤差修正第18期預測值,同理依次可得后續預測值,各方法模擬值的殘差絕對值見圖3。接著對預測值狀態進行預測,并修正預測值,各方法的預測結果見表9,預測精度指標見表10。

圖3 第二組試驗各方法模擬值殘差絕對值

表9 第二組試驗各方法預測值 mm

表10 第二組試驗各方法預測精度指標
從圖3、表9、表10可知,LS法在第二組試驗中預測結果偏離實際觀測值,且預測時間越長誤差越大,第20期預測值誤差最為嚴重,其相對誤差為32.626%。而在引入穩健估計后,RLS法的預測精度得到了較為明顯的提高,其第20期預測值相對誤差下降到18.994%。LM法與RLS法預測結果相近,精度略優于RLS法,在引入穩健估計和馬爾可夫模型修正預測值后,RLM-MC法第20期預測值相對誤差為11.173%,本文所提方法在第二組觀測數據中同樣體現出顯著的穩健性與準確性。
分析表6、表10可得,在第二組觀測數據中,各方法的MAPE均大于表6中相應的值。顯然,由于異常值的擾動,各方法的預測準確性都相對有所降低,體現出引入穩健估計的必要性。RLS法引入穩健估計后,精度得到顯著提升,RMSE減少了44.902%,證明RLS法有效削弱了異常值對預測結果的負面影響。LM法預測精度略好于RLS方法,進一步表明采用非線性最小二乘參數估計的合理性,且LM法在引入穩健估計與馬爾可夫模型后,RLM-MC法的RMSE相對LS法減少了71.150%,證明本文所提方法在高速鐵路橋墩沉降預測中的有效性和準確性。
本文在分析高速鐵路橋墩沉降規律以及實際工程需求后,提出了一種基于RLM-MC的高速鐵路橋墩沉降曲線預測方法,并對該方法的預測效果進行了工程實例分析和評估,主要結論如下:
(1)RLM法在兩組試驗中均能有效提升曲線擬合精度。在第一組試驗中RLM法單位權方差相對LS法、RLS法和LM方法分別減少了54.545%、47.368%和51.220%。在第二組試驗中,RLM方法單位權方差相對LS法、RLS法和LM法分別減少了51.163%、30.000%和40.000%。這一結果表明RLM方法的參數估計精度明顯優于其他三種方法。
(2)結合馬爾可夫模型能夠更加準確地描述高速鐵路橋墩沉降規律,提高預測精度。在兩組試驗中,RLM-MC方法的MAE、RMSE和MAPE均明顯小于其他四種方法,表明本文提出方法在高速鐵路橋墩沉降預測中更為準確。