李東帥,黃靖宇
(同濟大學(xué)1. 交通運輸工程學(xué)院; 2. 國家磁浮交通工程技術(shù)研究中心,上海201804)
軌道不平順是列車振動的主要激擾源,是產(chǎn)生車軌間動作用力的主要原因,對列車運行的安全性、穩(wěn)定性以及乘客的舒適性有著重要影響。
在目前高速磁浮的軌道不平順測量中,采用的主要系統(tǒng)仍是以慣性基準法為原理設(shè)計的系統(tǒng)[1]。慣性基準法效率高、成本低,適用于大多數(shù)情景下的軌道不平順測量。 然而,時瑾[2],石玉紅[3]等指出,車輛振動響應(yīng)與軌道不平順之間存在滯后性,因此利用當前點的加速度計算當前位置處的軌道不平順就不甚合理。此外,慣性基準法僅能夠適用于軌道的高低不平順,對于水平不平順計算精度誤差較大[4]。
目前,隨著計算機算力的不斷提升,利用慣性基準法的基本原理結(jié)合深度學(xué)習(xí)平臺來研究車輛的動態(tài)響應(yīng)成為了學(xué)術(shù)界研究的主流。 路天嶼[5]建立了車輛軌道耦合模型,利用支持向量機算法,以車輛振動響應(yīng)實現(xiàn)對軌道剛度突變位置的識別。史紅梅[6]利用車輛軌道耦合模型,設(shè)計出一種基于車輛振動響應(yīng)的軌道不平順智能感知算法,同時考慮了幾何不平順和剛度不平順等因素,實現(xiàn)了對軌道不平順的預(yù)測。PANG X M[7]利用非線性自回歸神經(jīng)網(wǎng)絡(luò)對軌道不平順等序列類型特征的適應(yīng)性,構(gòu)建深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)對軌道不平順的預(yù)測。利用深度學(xué)習(xí)平臺構(gòu)建車輛振動加速度與軌道不平順的關(guān)系未能夠根本解決利用慣性基準法測量產(chǎn)生的根本問題,仍存在如下3 類問題:①采用單一BP 神經(jīng)網(wǎng)絡(luò)進行建模,未能充分考慮車輛在軌道不平順激勵下所產(chǎn)生滯后性的特點;②大多數(shù)研究是對高低不平順進行建模,對水平不平順研究較少;③數(shù)據(jù)量較少,BP 神經(jīng)網(wǎng)絡(luò)容易存在過擬合現(xiàn)象,導(dǎo)致神經(jīng)網(wǎng)絡(luò)泛化能力較差[8]。 基于上述因素,導(dǎo)致利用神經(jīng)網(wǎng)絡(luò)進行軌道不平順預(yù)估的精度遠不能夠達到工程級別的要求。
本文基于車輛軌道耦合動力學(xué)理論,充分考慮車輛振動與不平順激勵的滯后性特點,對深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進行合理調(diào)整,構(gòu)建適用于軌道高低及水平平順狀態(tài)檢測的深度神經(jīng)網(wǎng)絡(luò),基于車體動力學(xué)仿真數(shù)據(jù)驗證表明,深度神經(jīng)網(wǎng)絡(luò)能夠較好應(yīng)用于軌道平順狀態(tài)檢測場景。
趙春發(fā)[9]指出,TR08 磁浮車輛結(jié)構(gòu)主要包括了車體和懸浮架,懸浮架是整車的走行機構(gòu),通過空氣彈簧、搖臂、擺桿、牽引拉桿等機構(gòu)與車體底部連接,從而將懸浮力、導(dǎo)向力、牽引力和制動力通過二系懸掛系統(tǒng)傳遞給車體。 經(jīng)過分析可知,TR08 型磁浮車輛各部件的自由度如表1 所示。

表1 TR08 型磁浮整車自由度Tab.1 TR08 maglev vehicle’s degree of freedom
時瑾[2],石玉紅[3]等指出,車輛振動與軌道不平順之間存在滯后效應(yīng),然而在以往的軌道不平順預(yù)測中大多忽視了這種滯后效應(yīng)所帶來的影響。 如圖1 所示為軌道高低不平順示意圖。

圖1 軌道高低不平順示意圖Fig.1 Schematic diagram of track height irregularity
列車在G 點處的振動加速度aG不僅受G 點處的軌道不平順δG的影響,還受G 點之前所有點的不平順影響,如式(1)所示

式中:δi代表第i 點的軌道高低不平順;ai代表第i 點的振動加速度。
由式(1)可得,通過振動加速度反算軌道不平順時,某一點處的軌道不平順,不僅與該點處的加速度有關(guān),還與該點附近處的振動加速度有關(guān),如式(2)所示

由此可以看出,利用傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)進行軌道不平順與列車振動響應(yīng)建模,不能很好的表征這種滯后效應(yīng),而通過卷積核掃描的方式能夠較好的表征這種滯后效應(yīng)。 故選用CNN 網(wǎng)絡(luò)構(gòu)建深度神經(jīng)網(wǎng)絡(luò),使其更能夠符合列車真實的運行狀態(tài)。
近年來,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)憑借著其優(yōu)異的性能,已經(jīng)在圖像理解、模式識別等領(lǐng)域得到了廣泛的應(yīng)用[10]。 與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)不同的是,CNN 有著權(quán)值共享以及局部連接的特點,減少了參數(shù)的數(shù)量,同時CNN 網(wǎng)絡(luò)具有平移不變性,符合軌道不平順預(yù)估的前提假設(shè)。CNN 網(wǎng)絡(luò)主要包含卷積層、批量歸一化(batch normalization,BN)層、激活層等結(jié)構(gòu)。
3.1.1 卷積層
在卷積層,輸入到卷積層的特征圖被一個可訓(xùn)練的卷積核進行卷積,通過一個激活函數(shù)進行激活,可以得到輸出特征圖,多個卷積核可以產(chǎn)生多個輸出特征圖。 卷積層的作用在于為網(wǎng)絡(luò)引入非線性特征,使其能夠最大概率的擬合,其正向傳播的公式如下

式中:ulj為卷積層l 的第j 個通道的卷積輸出;f 為激活函數(shù),作用在于為深度神經(jīng)網(wǎng)絡(luò)引入非線性因素;klij為卷積核矩陣;blj為卷積后特征圖的偏置;*為卷積符號。
3.1.2 批量歸一化層
在深度神經(jīng)網(wǎng)絡(luò)中,如果網(wǎng)絡(luò)的激活函數(shù)輸出很大,則相應(yīng)地其梯度就變小,單次迭代造成的學(xué)習(xí)速率慢。 因此BN 的作用就是調(diào)整網(wǎng)絡(luò)激活輸出時的分布,使經(jīng)過每層網(wǎng)絡(luò)激活后的梯度能夠到一個較大的范圍內(nèi),加快網(wǎng)絡(luò)的收斂速度。
批量歸一化主要有以下4 個步驟:
1) 求得輸出數(shù)據(jù)X 的均值μB

2) 求得輸出數(shù)據(jù)的方差σB2

3) 對輸出數(shù)據(jù)進行歸一化

4) 給定超參數(shù)γ,β 用于調(diào)節(jié)數(shù)據(jù)分布

式中:m 代表輸入批量訓(xùn)練中一個批量的樣本數(shù)量;xi代表第i 個樣本的輸入值;ò 代表偏移項, 防止分母出現(xiàn)0,一般取0.001。
通過上述步驟,使網(wǎng)絡(luò)能夠有效調(diào)整層間數(shù)據(jù)分布,加快深度神經(jīng)網(wǎng)絡(luò)的收斂速度,同時在一定程度上緩解了過擬合現(xiàn)象。
3.1.3 激活層
激活層的作用在于為卷積神經(jīng)網(wǎng)絡(luò)加入非線性因素,因此激活層選用的激活函數(shù)全部為非線性激活函數(shù),常用的激活函數(shù)有sigmoid,relu,tanh 等,為加快神經(jīng)網(wǎng)絡(luò)的收斂速度,簡化神經(jīng)網(wǎng)絡(luò)的計算流程,選用relu 激活函數(shù),其表達式如式(8)所示

從式(8)表達式可以看出,原始數(shù)據(jù)經(jīng)過relu 函數(shù)激活后,數(shù)據(jù)值的分布介于[0,+∞),與高速磁浮軌道不平順的真實數(shù)據(jù)分布相差較大,不能夠很好地擬合。 因此為使神經(jīng)網(wǎng)絡(luò)的預(yù)測值能夠更貼近于軌道不平順的真實數(shù)據(jù)分布,神經(jīng)網(wǎng)絡(luò)最后兩層采用自定義激活函數(shù)f(x)=5tanh(x),表達式如式(9)所示

通過自定義激活函數(shù)實現(xiàn)了輸出值的分布介于[-5,5]之間,符合軌道不平順的真實數(shù)據(jù)分布。
本文選用卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)理論,構(gòu)建合適的網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)輸入車輛的動態(tài)振動響應(yīng)(包含車輛的垂向加速度,橫向加速度以及速度),輸出軌道不平順(包含定子面的不平順和導(dǎo)向面的不平順)。 下面以某個1 km 長的區(qū)段為例,介紹應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)進行軌道不平順預(yù)測的4 個主要步驟。
3.2.1 建立車輛-軌道耦合動力學(xué)模型
以第二節(jié)TR08 車輛自由度分析及動力學(xué)方程為基礎(chǔ),結(jié)合TR08 型高速磁浮列車車輛參數(shù),利用SIMPACK 構(gòu)建出TR08 型高速磁浮車輛單車體模型圖,模型自由度為138,包含195 個體元、242 個力元和156個約束等元素,其中懸浮架按照彈性處理。
將實測的高低和水平不平順數(shù)據(jù)導(dǎo)入,得出車體在軌道不平順激勵下的橫向加速度序列ax和垂向加速度序列az。
3.2.2 數(shù)據(jù)預(yù)處理及數(shù)據(jù)增強
吳祥明[11]指出,由于乘客舒適度的影響,高速磁浮列車長時間運行的垂向加速度az和橫向加速度ax應(yīng)滿足式(10)要求

同時,高速磁浮列車長期運行的垂向加速度應(yīng)滿足德國AGT 的建議值0.125 g 以內(nèi)[12]。 因此,在實際建模過程中,應(yīng)取車輛振動符合實際的區(qū)間段,避免在區(qū)間段內(nèi)出現(xiàn)數(shù)據(jù)的異常值。
數(shù)據(jù)增強是深度神經(jīng)網(wǎng)絡(luò)預(yù)處理中常用的手段,用于解決數(shù)據(jù)量較少的問題,進而緩解過擬合現(xiàn)象的發(fā)生。 以本案例為例,可將1 km 的不平順線路隨機切分為小長度序列,可實現(xiàn)對樣本量的擴充。
3.2.3 卷積神經(jīng)網(wǎng)絡(luò)搭建
在充分考慮到軌道不平順與車輛振動間的非線性關(guān)系條件下, 以卷積層和批量歸一化層為基礎(chǔ)結(jié)構(gòu),分別設(shè)計了5~12 層的卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)對軌道不平順的預(yù)測。 同時亦可探究軌道不平順預(yù)測的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)。 在損失函數(shù)選擇方面,由于通過車輛振動響應(yīng)來對軌道不平順進行預(yù)測本質(zhì)是一個預(yù)測連續(xù)值的回歸問題,故采用二階均方差來衡量預(yù)測值和真實之間的差異,表達式如式(11)所示

式中:Yi為樣本i 的軌道不平順真實值;為樣本i 的軌道不平順預(yù)測值。
3.2.4 效果評估為了衡量深度神經(jīng)網(wǎng)絡(luò)的預(yù)測效果,采用相對精度來表征模型的預(yù)測能力。 其表達式如式(12)所示

由式(12)可知,R2的值介于[0,1],且R2越接近于1,模型越接近于真實值。
綜上所述,利用卷積神經(jīng)網(wǎng)絡(luò)進行軌道不平順預(yù)測的流程示意圖如圖2 所示。

圖2 CNN 預(yù)測軌道不平順流程圖Fig.2 Flow chart of CNN predicted track irregularity
案例以某地實測的高速磁浮軌道左右、高低不平順數(shù)據(jù)作為輸入,基于車輛軌道耦合動力學(xué)理論,利用SIMPACK 構(gòu)建車軌耦合動力學(xué)模型,得到不平順激勵下的車輛動力學(xué)響應(yīng)(垂向加速度,橫向加速度以及速度),最終取數(shù)據(jù)較為穩(wěn)定的區(qū)間段進行建模。
由于列車運行初期數(shù)據(jù)波動較大,導(dǎo)致測量得到的軌道不平順存在異常值,最終對數(shù)據(jù)進行合理清洗后,選取了列車運行穩(wěn)定的2 km 區(qū)間段內(nèi)約83 000 個采樣點進行建模分析,區(qū)間段內(nèi)軌道的高低不平順及水平不平順如圖3,圖4 所示。

圖3 軌道高低不平順Fig.3 Track vertical irregularity

圖4 軌道水平不平順Fig.4 Track lateral irregularity
將上述不平順輸入到SIMPACK 建立的車輛軌道耦合動力學(xué)模型中,得到軌道在高低、水平不平順激勵下車輛的垂向加速度及橫向加速度,如圖5,圖6 所示。

圖5 車體橫向加速度Fig.5 Lateral accelerationof vehicle

圖6 車體垂向加速度Fig.6 Vertical acceleration of vehicle
為實現(xiàn)對神經(jīng)網(wǎng)絡(luò)的充分訓(xùn)練,需要進行數(shù)據(jù)增強。 將上述83 000 個采樣點隨機裁剪為8 000 個區(qū)間長度為10 000 的小區(qū)間(區(qū)間允許存在重疊)。 同時,對8 000 個樣本進行隨機劃分,取6 000 個樣本作為訓(xùn)練集對深度神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,取剩余2 000 個樣本為測試集,用于表征深度神經(jīng)網(wǎng)絡(luò)對未知數(shù)據(jù)的預(yù)測能力,即模型的泛化性能。
為探究神經(jīng)網(wǎng)絡(luò)的最優(yōu)層數(shù), 利用Google Tensor Flow 結(jié)合Python 分別構(gòu)建5~12 層的卷積神經(jīng)網(wǎng)絡(luò),輸入原始數(shù)據(jù)對模型進行訓(xùn)練,利用Tensorboard 監(jiān)控模型的訓(xùn)練過程。 圖7 展示了不同層數(shù)下深度神經(jīng)網(wǎng)絡(luò)的迭代次數(shù)與訓(xùn)練集測試集精度的關(guān)系曲線,從圖中可以看出:
1) 隨著迭代次數(shù)的不斷增加, 訓(xùn)練集的相對誤差一直降低, 表明神經(jīng)網(wǎng)絡(luò)對訓(xùn)練集數(shù)據(jù)擬合越來越好;測試集的相對誤差呈現(xiàn)先升高后降低的趨勢,表明在深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練初期,隨著迭代次數(shù)的增加,模型越來越擬合數(shù)據(jù)的真實分布規(guī)律,直至測試集精度達到最高,之后隨著迭代次數(shù)的增加,模型更多關(guān)注于訓(xùn)練集的隨機誤差而使得模型對未知數(shù)據(jù)的預(yù)測能力變差,此時模型認為模型達到過擬合,應(yīng)停止繼續(xù)訓(xùn)練。 定義在測試集最高點處所對應(yīng)的迭代次數(shù)為神經(jīng)網(wǎng)絡(luò)的收斂點,用于表征不同層數(shù)下神經(jīng)網(wǎng)絡(luò)的收斂速度。
2) 隨著網(wǎng)絡(luò)層數(shù)的加深,神經(jīng)網(wǎng)絡(luò)的收斂點逐漸增加,由21 輪迭代后收斂逐步升高至59 輪迭代后收斂,神經(jīng)網(wǎng)絡(luò)的收斂速度越來越慢,隨著網(wǎng)絡(luò)層數(shù)的加深,深度神經(jīng)網(wǎng)絡(luò)表征非線性能力逐步增加,同時收斂速度變慢。

圖7 不同層數(shù)下神經(jīng)網(wǎng)絡(luò)迭代次數(shù)與相對誤差的訓(xùn)練曲線Fig.7 Training curve of iterative times and relative errors of neural network in different layers
3) 隨著網(wǎng)絡(luò)層數(shù)的加深,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集的初始相對誤差由250.31%降低至44.81%,測試集的初始相對誤差由236.90%降低至54.51%,隨著網(wǎng)絡(luò)層數(shù)的加深,深度神經(jīng)網(wǎng)絡(luò)初步迭代誤差逐步降低,但同時加深迭代次數(shù)所帶來的精度收益降低。 考慮到計算時長的限制,需合理控制深層神經(jīng)網(wǎng)絡(luò)的迭代次數(shù)。
為驗證不同層數(shù)的神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集和測試集的性能表現(xiàn), 在深度神經(jīng)網(wǎng)絡(luò)達到收斂點的前提下,隨著網(wǎng)絡(luò)層數(shù)的加深,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集和測試集的相對精度如表2 所示。

表2 不同網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練測試誤差表Tab.2 Training and testing error of different network structures
從表中可以得出以下結(jié)論:
1) 隨著網(wǎng)絡(luò)層數(shù)的加深,訓(xùn)練集的精度一直升高,說明隨著網(wǎng)絡(luò)深度的不斷增加,深度神經(jīng)網(wǎng)絡(luò)表達非線性的程度越高,使得模型能夠?qū)τ?xùn)練集最大程度的擬合;
2) 隨著網(wǎng)絡(luò)層數(shù)的加深,測試集的精度呈現(xiàn)著先升高后降低的趨勢,說明起初深度神經(jīng)網(wǎng)絡(luò)層數(shù)的加深使得模型的泛化性能和擬合程度有著明顯的提高,之后隨著深度神經(jīng)網(wǎng)絡(luò)層數(shù)的增加,擬合程度雖然進一步提高,但是模型的泛化性能變差,此時出現(xiàn)了過擬合的現(xiàn)象。
綜上所述,深度神經(jīng)網(wǎng)絡(luò)的最優(yōu)層數(shù)為8 層,在8 層神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集和測試集上的精度達到最高。 為直觀表征神經(jīng)網(wǎng)絡(luò)的泛化性能,在測試集上隨機抽取一個長度為10 000 的樣本,測試8 層深度神經(jīng)網(wǎng)絡(luò)未參與訓(xùn)練的樣本下的性能,用于驗證該結(jié)論的普遍性,作為對比,依據(jù)PANG X M[7]的結(jié)構(gòu)方案訓(xùn)練雙層BP神經(jīng)網(wǎng)絡(luò),在同等樣本下對比兩者的預(yù)測效果。
從圖8 及表3 中可以看出:
1) 從整體圖像看,雙層BP 神經(jīng)網(wǎng)絡(luò)和CNN 網(wǎng)絡(luò)均能夠較為準確地實現(xiàn)對軌道不平順的預(yù)測,精度均超過80%,均可實現(xiàn)對軌道不平順的定性預(yù)測;
2) 從局部放大圖可以看出,雙層BP 神經(jīng)網(wǎng)絡(luò)明顯存在著線性程度不夠的問題,在不平順波動較大的區(qū)間段往往會采用低階多項式曲線的策略進行處理,誤差較大。 8 層CNN 由于層數(shù)較深,能夠比雙層BP 神經(jīng)網(wǎng)絡(luò)有更強的非線性預(yù)測的能力,因此對于不平順波動較大的區(qū)間預(yù)測程度較好;
3) 從單個樣本來看,CNN 在水平不平順的預(yù)測精度略好于在高低不平順的預(yù)測精度,同時遠好于雙層BP 神經(jīng)網(wǎng)絡(luò)的擬合程度。 這與表2 所得出的結(jié)論一致。

圖8 高低不平順的真實值與預(yù)測值對比圖Fig.8 Comparison between real value and predicted value of vertical irregularity

圖9 水平不平順的真實值與預(yù)測值對比圖Fig.9 Comparison between real value and predicted value of lateral irregularity
分別計算CNN 模型預(yù)測值和BP 模型預(yù)測值的相對精度R2,如表3 所示。

表3 不同網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測精度表Tab.3 Prediction accuracy of different network structures
結(jié)合表2、 表3 以及圖9 可以看出,8 層CNN 在訓(xùn)練集的平均誤差為0.447%, 在測試集的平均誤差為0.992%,同時為了表征模型的泛化性能,在為參與訓(xùn)練的測試集中抽取一個樣本進行測試。 發(fā)現(xiàn)8 層CNN在高低不平順的測試精度為0.988 2,在水平不平順的測試精度為0.990 7,可以看出,模型在未知數(shù)據(jù)集下的訓(xùn)練效果良好,證明試驗所得出的結(jié)論具有普遍性,符合高速磁浮軌道不平順的測量精度要求。
本文的主要結(jié)論如下:
1) 本文提出了一種新型的測量軌道不平順的方案,通過測量車輛加速度,構(gòu)建CNN 實現(xiàn)對軌道不平順的檢測,克服了傳統(tǒng)的慣性基準法只能夠測量高低不平順的缺點,實現(xiàn)了對高低不平順和水平不平順的精細化測量;
2) 與目前主流的BP 神經(jīng)網(wǎng)絡(luò)測量軌道不平順方案相比, 本文提出的CNN 無論是對訓(xùn)練集的擬合程度還是對未知數(shù)據(jù)的預(yù)測能力上均表現(xiàn)較好,相較于BP 神經(jīng)網(wǎng)絡(luò)有大幅度提升;
3) 使用CNN 實現(xiàn)對軌道不平順測量的方案考慮了軌道不平順對振動加速度影響的滯后性,實現(xiàn)了對軌道不平順的精細化測量, 實驗結(jié)果證明,8 層CNN 網(wǎng)絡(luò)能夠較為合理的表征軌道不平順與車輛振動相應(yīng)的關(guān)系,測試集精度高達99%以上。