馬卓然,高 亮
(北京交通大學 土木建筑工程學院, 北京 100044)
高速鐵路橋上無縫道岔軌道系統集合了無縫線路、無縫道岔、無砟軌道和大跨橋梁等技術難點,是高速鐵路最為敏感典型的區域[1]。由于其結構間相互作用復雜,受力變形發展規律較難把握,無法利用傳統理論分析手段準確判斷和預知軌道力學狀態[2]。而在長期服役過程中,軌道系統直接暴露在外部環境中,會受到溫度循環、列車荷載等復雜外部因素影響,引起結構力學狀態異常,進而影響系統的運營安全[3]。因此,有必要建立數據驅動的結構力學狀態預測方法,提早掌握結構的力學行為,輔助評估軌道系統的健康狀況。
目前,在軌道狀態預測方法方面,大多研究主要通過建立不同的軌道不平順預測模型,預測軌道幾何劣化,評估軌道幾何質量。較流行的預測方法包括ARIMA模型[4-5]、灰色模型[6-7]、貝葉斯網絡[8]、人工神經網絡[9-10]以及多種方法結合的組合模型[11-12]。上述方法重點關注軌道幾何狀態,并未涉及結構的力學本質。由于幾何不平順數據與反映力學狀態的受力變形數據在特征上差異較大,故既有不平順預測方法較難實現結構力學狀態的準確預測。此外,也有極少數研究采用線性回歸、神經網絡等方法對軌道結構的力學狀態進行預測[13],但研究仍處于起步階段,預測精度和穩定性均有待提高。
本文依托京滬高速鐵路橋上42號道岔監測工點,基于監測數據的基本特征,以氣溫序列為輸入,以反映結構健康狀態的鋼軌溫度、鋼軌縱向應力和尖軌伸縮位移為目標,構建遺傳算法優化的Elman神經網絡預測模型(GA-Elman)。通過對比不同氣溫輸入形式和不同模型構架的預測性能,驗證方法的優越性。
本文監測數據源于京滬高速鐵路天津南站42號大號碼道岔監測工點。該工點的具體測點布置如圖1所示,“數字”+“號”為傳感器編號。工點共計38個測點,包括氣溫、軌溫、鋼軌縱向應力、尖軌伸縮位移等指標。其中,尖軌伸縮位移采用視頻圖像監測(0.5 h/次),其余指標采用光纖光柵傳感器(15 min/次)。通過前期研究[14]發現,不同狀態指標的時程變化規律類似,且與溫度存在不同程度的相關性。在各項指標中,鋼軌溫度的變化會直接影響軌道結構的受力變形,鋼軌縱向應力異常可能導致脹軌跑道甚至斷軌,尖軌伸縮位移過大會導致道岔卡阻。可見,這三項指標均與結構狀態密切相關,通過預測其發展變化可間接掌握結構的健康狀況,因此,本文以這三者為例進行預測。
圖2為不同監測指標的時程變化。不同狀態監測指標在時程上與氣溫跟隨性良好,變化周期一致,為1 d,但不完全同步,與文獻[15]的觀點一致,這主要是由于軌道系統光照不均勻,空間傳熱存在滯后效應所致。為進一步分析各指標與氣溫的相關程度和主要相關頻率,對各指標與氣溫進行相干分析。圖3為鋼軌縱向應力4號與氣溫的相干分析結果。從圖3可以看出,應力4號與氣溫在0.98×10-5~1.74×10-5/s的范圍內相關程度較大,而在其他頻段相關程度較小。當頻率為1.30×10-5/s,即周期約為1 d時,相干系數達到最大值0.78,這與時域分析結果一致。

圖2 監測指標的時程變化曲線

圖3 鋼軌縱向應力4號與氣溫的相關程度
由于各指標與氣溫的時頻關聯性較強,且在實際中氣溫可通過氣象預報直接獲得,故采用氣溫作為預測模型的輸入。軌道結構狀態不僅與當前的溫度荷載有關,溫度力無法及時放散而在結構內部的累積也會對結構的受力變形發展造成影響[14-15],因此考慮以氣溫時間序列的形式輸入預測模型。為確定輸入的氣溫數據點數,建立多元線性回歸模型分析考慮不同氣溫范圍對力學狀態指標擬合程度的影響,即
yt=α0+α1Tt-n+1+α2Tt-n+2+ …+αnTt
(1)
式中:yt為t時刻的指標監測值;n為考慮的氣溫數據點個數;Tt為t時刻的氣溫值;α0,α1, …,αn為待定系數。
如圖4所示,隨著輸入氣溫數據點數的增加,氣溫對力學狀態指標的擬合程度先逐漸提高,后趨于穩定,最終可達0.845 6~0.968 4。這表明,相比以單點氣溫為輸入,以一定范圍的氣溫序列輸入模型,能夠更好地模擬各狀態指標的發展變化。

圖4 輸入氣溫范圍對狀態指標擬合程度的影響
因此,在預測前,對原始氣溫進行序列化預處理,即
(2)
式中:[·]為處理前后的輸入氣溫數據集;p為各指標所對應的最優氣溫時間序列長度。結合計算效率和擬合精度,綜合考慮各指標的不同測點,確定預測軌溫、鋼軌縱向應力和尖軌伸縮位移所輸入的氣溫數據點數分別為60、40和90。
Elman神經網絡是一種具有內部時延反饋功能的循環神經網絡[16],其網絡的結構如圖5所示,包括輸入層、隱藏層、承接層和輸出層四個層次。其中,承接層可用于存儲隱含層上一時刻的輸出值,從而形成一種短期記憶。Elman神經網絡可將隱含層的輸出通過承接層的延遲和存儲與隱含層的輸入自鏈接,從而能夠學習序列數據的時序特征[17],因此十分適用于本文所研究的時間序列預測問題。

圖5 Elman神經網絡拓撲結構
網絡的計算過程可以表示為
xc(t)=x(t-1)
(3)
x(t)=f(w1(u(t-1)+w2xc(t)))
(4)
y(t)=g(w3x(t))
(5)
式中:u(t-1)為網絡的輸入值;x(t)為隱含層的輸出值;xc(t)為承接層的輸出值;y(t)為網絡的輸出值;w1、w2和w3分別為輸入層對隱藏層、承接層對隱含層和隱含層對輸出層的權重;f(·)和g(·)分別為隱含層和輸出層的激勵函數。
本文以誤差平方和為損失函數,當訓練達到最大訓練次數或滿足精度10-5時則結束訓練。為提升模型的預測性能,通過反復試算法對隱含層節點數進行尋優,如圖6所示。基于均方誤差最小準則,確定軌溫、鋼軌縱向應力和尖軌伸縮位移的隱含層節點數量分別為10、5和2。此外,將隱含層和輸出層的激勵函數分別設為tansig和purelin,訓練函數設為trainlm,學習率設為0.001。

圖6 隱含層節點數量對模型性能的影響
遺傳算法(GA)是模擬生物進化和自然遺傳機制的全局優化算法[18]。它將“適者生存”的規則應用于編碼組[17],通過逐代的選擇、交叉和突變獲得最優個體。主要訓練過程如下。
(1)個體初始化:本文采用實數編碼來初始化個體,并將種群規模設為10。
(2)適應度值F計算:適應度值越小的個體越優,本文采用的適應度函數為
(6)
式中:Yi為實際值;yi為預測值;n為樣本點總數。
(3)選擇:以一定的概率從上一代中選擇個體到新的一代。本文采用輪盤賭的方法進行選擇。
(4)交叉:隨機交換兩個個體的一個或多個位置上的信息以產生新的個體。本文采用單點交叉法,交叉概率設為0.4。
(5)突變:通過改變個體某些位置的信息以產生更好的個體。本文突變概率設為0.05。
(6)終止:當迭代次數達到最大值50,或(Fmax-Fmin)/Fmin小于0.05時,計算終止。
基于上述方法,可構建遺傳算法優化的Elman神經網絡預測框架(GA-Elman)。通過氣溫序列化處理,利用最優氣溫序列對軌道結構的力學狀態指標進行預測,如圖7所示。其中,遺傳算法用于神經網絡結構參數的全局尋優,從而避免Elman神經網絡陷入局部最小,提高網絡收斂速度;Elman神經網絡用于結構狀態的預測。

圖7 預測框架
主要預測步驟如下:
Step1根據預測目標,確定神經網絡的拓撲結構,從而計算獲得遺傳算法需優化的個體長度。
Step2采用實數編碼方式對種群個體初始化。
Step3將原始氣溫數據進行預處理,生成溫度時間序列,輸入所建模型。
Step4通過遺傳算法選擇、交叉、變異、適應度值計算對個體進行逐代優化,獲取最優個體。
Step5將最優個體賦予神經網絡初始參數,并反復訓練,使模型預測性能達到最佳,測試即可獲得預測結果。
以監測工點2017年8月至2018年7月各測點的監測數據作為數據集,進行軌道結構力學狀態預測。其中,前95%的數據用于訓練,后5%的數據用于測試。從不同氣溫輸入形式和不同預測框架兩個方面,對所提出模型的預測性能進行驗證。
為對比氣溫輸入形式不同對預測精度的影響,分別以單點氣溫和氣溫時間序列為輸入,利用GA-Elman模型進行預測,部分測點的預測結果如圖8所示。

圖8 不同指標的預測結果
從圖8可以看出,所建預測模型對于各項監測指標均具有良好的預測性能,預測結果的整體變化規律與實際監測值均保持一致。與基于單點氣溫的預測結果相比,采用氣溫序列進行預測,預測值與實測值吻合度更高,并且能夠更好地模擬峰值的變化,峰值處的預測偏差相對較小。由此說明以氣溫序列為輸入的預測性能更優。
為驗證所建模型的優越性,將其從預測精度和預測可靠性兩個方面與多元線性回歸和基礎Elman神經網絡進行對比。各模型均以氣溫序列為輸入,選擇平均絕對誤差MAE、均方根誤差RMSE和誤差標準偏差S作為評價依據。MAE和RMSE直接反映預測誤差大小,即預測精度;S反映誤差的離散程度,間接表征了預測結果的可靠性。考慮預測目標有多個測點,取各測點評價指標的均值作為最終結果,各指標的具體計算方法為
(7)
(8)
(9)
式中:m為各目標不同測點結果取平均值;N為目標的測點數量;n為測試樣本點數;Oij、Pij和eij分別為預測目標第i個測點第j個樣本點的監測值、預測值和預測誤差。
各預測模型的誤差評價指標如表1所示,對比可發現,GA-Elman混合模型的預測性能最佳,Elman神經網絡次之,多元線性回歸最差。這說明:一方面,通過遺傳算法優化能夠使網絡預測精度更高;另一方面,僅通過線性擬合較難實現對軌道結構狀態的準確預測。考慮預測目標量值的差異,為便于對比,表2對GA-Elman模型相較于其他模型的優越程度(即評價指標降幅)進行了量化,計算式為

表1 不同模型的預測誤差對比

表2 GA-Elman模型相較其他模型的誤差降幅
R1/2=(E1-E2)/E1×100%
(10)
式中:R1/2為方法2相對于方法1的指標降幅;E1和E2分別為方法1和方法2的評價指標值。
從表2中可發現,相較其他模型,GA-Elman模型的預測精度和預測結果的可靠性均明顯提高。預測精度方面,相比于多元線性回歸,GA-Elman的MAEm平均下降39.48%,RMSEm下降29.10%;相比于Elman神經網絡,MAEm平均下降16.17%,RMSEm平均下降8.52%。預測可靠性方面,各目標的Sm相比于多元線性回歸和Elman神經網絡分別平均下降10.92%和6.84%。
此外,為對比GA-Elman模型和Elman的計算結果穩定性,以RMSE為依據,分別利用兩個模型對各指標進行10次訓練并預測,結果如圖9所示。

圖9 GA-Elman模型和Elman神經網絡的預測穩定性對比
從圖9可以看出,采用Elman神經網絡對同一測點進行多次測試,RMSE的波動劇烈且數值偏大,而GA-Elman的RMSE無明顯波動且均處于較低水平。這表明利用遺傳算法對網絡優化能有效提高模型的穩定性。
綜合上述分析,認為采用GA-Elman混合模型的預測精度最高,預測結果最為可靠穩定,能夠較好地應用于軌道結構力學狀態的預測預警。由于數據特征的相似性,所提出預測方法主要適用于軌道結構狀態數據預測。在實際應用中,通過訓練調整網絡模型參數,即可應用于各種軌道系統和各項狀態指標的預測中,可操作性較強,計算效率較高。
本文基于監測數據的分析,構建了遺傳算法優化的Elman神經網絡時間序列預測模型,以序列化后的氣溫為輸入,對鋼軌溫度、鋼軌縱向應力和尖軌伸縮位移三項反映結構狀態的監測指標進行預測,主要結論如下:
(1)基于監測數據的時頻分析,以氣溫最優序列為模型輸入,相較于單點氣溫輸入形式,以溫度序列為輸入的形式能夠使模型的預測精度得到較大的提高。
(2)利用遺傳算法對神經網絡優化,能夠使網絡參數取值更為合理,從而明顯改善模型的預測精度以及預測結果的可靠性。
(3)GA-Elman預測模型相較多元線性回歸和基本Elman神經網絡,MAEm分別下降39.48%和16.17%,RMSEm分別下降29.10%和8.52%,Sm分別下降10.92%和6.84%,說明其預測結果最為準確可靠。
綜上,GA-Elman模型預測性能最佳,可作為橋上無縫道岔軌道系統結構力學狀態預測的有效方法,能夠準確感知軌道結構的力學性能發展變化,為實現軌道系統結構隱患的預測預警提供支持。