一種考慮車輪多邊形的轉(zhuǎn)向架故障診斷深度學(xué)習(xí)方法

2024-12-31 00:00:00張懿楊旭鋒*方修洋

機(jī)械 2024年9期

摘要：目前轉(zhuǎn)向架故障診斷研究僅僅考慮了較為理想的列車運(yùn)行狀態(tài)，未考慮車輪多邊形的影響，而車輪多邊形激勵的存在能顯著降低故障診斷的精度。為此，提出了一種基于LSTM網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法。該方法由LSTM以及一維卷積神經(jīng)網(wǎng)絡(luò)組成，并引入了注意力機(jī)制用于強(qiáng)調(diào)訓(xùn)練數(shù)據(jù)特征，提高轉(zhuǎn)向架故障信號識別的準(zhǔn)確率。以CRH380動車組轉(zhuǎn)向架為例，引入車輪多邊形激勵，采用所提方法對不同工況下的關(guān)鍵部件故障進(jìn)行了分類。通過與已有方法對比發(fā)現(xiàn)，所提方法由于引入了注意力機(jī)制，較大程度克服了車輪多邊形帶來的噪聲干擾，提高了轉(zhuǎn)向架故障診斷的精度。

關(guān)鍵詞：轉(zhuǎn)向架；故障診斷；深度學(xué)習(xí)；車輪多邊形；注意力機(jī)制

中圖分類號：TP306+.3 "文獻(xiàn)標(biāo)志碼：A "doi：10.3969/j.issn.1006-0316.2024.09.006

文章編號：1006-0316 （2024） 09-0037-08

Abstract：Current research on bogie fault diagnosis only considers ideal train operating"conditions， without considering the influence of wheel polygons， the"excitation of"which"significantly reduces"the accuracy of fault diagnosis."For this reason， a deep learning method based on LSTM network and convolutional neural network is proposed. The method consists of a long short-term memory network as well as a one-dimensional convolutional neural network， and introduces an attention mechanism to emphasize the features of training data， thereby improving the accuracy of bogie fault signal recognition. Taking the bogie of CRH380 rolling stock as an example， the wheel polygon excitation is introduced， and the proposed method is used to classify the key component faults under different working conditions. By comparing with the existing methods， it is found that the proposed method， due to the introduction of the attention mechanism， overcomes the noise interference caused by wheel polygons to a greater extent， and improves the accuracy of bogie fault diagnosis.

Key words：bogie；fault diagnosis；deep learning；wheel polygon；attention mechanism

隨著高速鐵路網(wǎng)絡(luò)逐步現(xiàn)代化，我國高鐵設(shè)施不斷成熟，高速鐵路運(yùn)營里程不斷增長，高速列車的安全運(yùn)維技術(shù)需要有相應(yīng)的發(fā)展。轉(zhuǎn)向架作為鐵道車輛的關(guān)鍵承載部件，其運(yùn)行狀態(tài)直接影響了列車的動力學(xué)性能以及安全性[1-2]。因此對轉(zhuǎn)向架的關(guān)鍵部件的故障診斷研究成了高速列車運(yùn)維技術(shù)發(fā)展的重要方向。

目前對高速列車轉(zhuǎn)向架故障診斷的研究一般分為傳統(tǒng)的基于解析模型的故障診斷方法和基于數(shù)據(jù)驅(qū)動的故障診斷方法。基于解析模型的故障診斷方法需要構(gòu)建較為精確的數(shù)學(xué)模型而實(shí)際過程中列車行駛信號具有較多干擾，基于解析模型的故障診斷方法有著較大的局限性[2]。

基于數(shù)據(jù)驅(qū)動的故障診斷方法在故障信號識別領(lǐng)域已有廣泛的應(yīng)用，其主要是通過信號處理、統(tǒng)計分析以及機(jī)器學(xué)習(xí)等手段挖掘轉(zhuǎn)向架振動信號蘊(yùn)含的故障特征從而實(shí)現(xiàn)對轉(zhuǎn)向架的故障診斷。Zuo等[3]提出全分解奇異值方法，使用該方法在低信噪比工況下能夠完全分解信號的奇異值，提取弱故障特征。作者將提取到的特征結(jié)合改進(jìn)的極限學(xué)習(xí)機(jī)算法結(jié)合實(shí)現(xiàn)了轉(zhuǎn)向架的故障診斷。Li等[4]則針對高速列車轉(zhuǎn)向架振動信號具有非線性、不平穩(wěn)的特點(diǎn)，提出了結(jié)合多元經(jīng)驗(yàn)?zāi)B(tài)分解和全矢本征模態(tài)函數(shù)（Intrinsic Mode Function，IMF）信息熵結(jié)合的方法，有效提高了轉(zhuǎn)向架故障診斷的準(zhǔn)確率。秦娜等[5]使用EEMD算法提取了車體、構(gòu)架以及軸箱體等通道的振動信號的模態(tài)能量矩作為支持向量機(jī)的輸入，對200"km/h車速下的空氣彈簧、抗蛇行減振器以及橫向減振器等關(guān)鍵部件的故障信號進(jìn)行故障診斷，達(dá)到了較高準(zhǔn)確率。Wang等[6]針對現(xiàn)實(shí)中正常工況數(shù)據(jù)量遠(yuǎn)大于故障數(shù)據(jù)量的情況提出了頻譜峰度熵（Spectral Kurtosis Entropy，SKE）的特征參數(shù)，同時將SKE與變異模態(tài)分解結(jié)合提出多變工況下的信號特征，并結(jié)合加權(quán)自適應(yīng)進(jìn)化極端學(xué)習(xí)機(jī)對特征進(jìn)行分類完成轉(zhuǎn)向架故障診斷。Huang等[7]提出了一種基于改進(jìn)自適應(yīng)噪聲完全集合經(jīng)驗(yàn)?zāi)B(tài)分解（ICEEMDAN）和一維卷積神經(jīng)網(wǎng)絡(luò)（1D-CNN）的列車轉(zhuǎn)向架故障診斷方法。將多個傳感器信號分解為一系列IMF分量，并選取有效的故障特征；其次將這些故障特征輸入到1D-CNN中進(jìn)行特征提取；最后通過全連接層實(shí)現(xiàn)轉(zhuǎn)向架故障診斷。

然而上述方法均未考慮在實(shí)際過程中車輪多邊形對信號帶來的影響。車輪多邊形是車輪失圓的主要表現(xiàn)形式，在車輛服役過程中普遍存在。有學(xué)者[8-11]指出，車輪多邊形會引起列車的高頻率異常振動，是車輛關(guān)鍵部件異常振動的重要原因。因此研究在考慮車輪多邊形工況下的轉(zhuǎn)向架故障信號診斷對鐵路運(yùn)維中有著重要作用。

李鳳林等[12]進(jìn)行了考慮了車輪多邊形的故障診斷，但是其方法需要設(shè)計濾波器類型、結(jié)構(gòu)元素類型等參數(shù)，需要先驗(yàn)知識。對此，本文對車輪多邊形激勵下的高速列車轉(zhuǎn)向架故障診斷進(jìn)行了研究。考慮到多邊形激勵的干擾，提出了一種融合注意力機(jī)制的深度學(xué)習(xí)方法。通過引入注意力機(jī)制并結(jié)合LSTM和1D-CNN網(wǎng)絡(luò)對輸入信號進(jìn)行故障診斷，在基于SIMPACK的仿真實(shí)驗(yàn)信號中驗(yàn)證了所提方法的有效性。

1 車輪多邊形及其對列車動力學(xué)性能的影響

車輪失圓指車輪踏面形狀發(fā)生變化不再是一個標(biāo)準(zhǔn)的圓形，是車輪常見的表面缺陷[13]，車輪失圓主要有車輪擦傷、車輪剝離以及車輪多邊形化三種類型，前兩者屬于局部失圓，而車輪多邊形化屬于全局失圓對車輛行駛影響大，更加常見。車輪多邊形也可以表述為車輪諧波磨耗、車輪諧波不圓順[14]。本文主要考慮周期性車輪多邊形工況下的轉(zhuǎn)向架故障診斷。

根據(jù)文獻(xiàn)[15-16]可知，當(dāng)通過頻率固定時，車輪多邊形階數(shù)隨著車速提高而往低階發(fā)展，而在長期的磨耗過程中，車輪多邊形一般都會發(fā)展為以20階。作為高階與低階多邊形的影響對比，本次研究考慮多邊形階數(shù)N＝2， 5， 10， 15， 20工況下的轉(zhuǎn)向架故障診斷。

理想的車輪多邊形屬于典型的諧波不平順，車輪圓周存在周期性的輪徑偏差[17]，車輪不平順為：

式中：為車輪不平順；為i階車輪多邊形幅值；v為車輛運(yùn)行速度；R為車輪名義滾動圓半徑；為i階車輪多邊形相位角。

2 神經(jīng)網(wǎng)絡(luò)基本原理

2.1 "LSTM網(wǎng)絡(luò)

長短時記憶網(wǎng)絡(luò)（Long-Short Term Memory，LSTM）是由傳統(tǒng)的遞歸神經(jīng)網(wǎng)絡(luò)（Recursive Neural Network，RNN）網(wǎng)絡(luò)改進(jìn)而來，最初由Hochreiter和Schmidhuber在1997年提出[18]，由Alex后來進(jìn)行改進(jìn)[19]。本質(zhì)上，LSTM網(wǎng)絡(luò)仍然是屬于RNN中的遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，其結(jié)構(gòu)如圖1所示。

在LSTM中，主要的信息處理單元稱為元胞，如圖1所示中的大矩陣。每個元胞內(nèi)部包含了遺忘門、輸入門以及輸出門三個門函數(shù)來控制信息的存儲和調(diào)節(jié)。這些門函數(shù)能夠幫助LSTM決定哪些信息是有效的，從而使得LSTM適用于任何時序信號處理的問題。一個LSTM元胞定義如下：

式中：x和h分別為輸入和隱藏狀態(tài)；t為當(dāng)前時間步；c為狀態(tài)量；為向量的內(nèi)積；σ為sigmoid

函數(shù)；、、及分別為當(dāng)前狀態(tài)下的代表

元胞、遺忘門、輸入門及輸出門；Wxy和bxy分別為在x門與y門之間可學(xué)習(xí)的權(quán)重、偏置。

2.2 注意力機(jī)制

注意力機(jī)制（Attention Mechanism，AM）是一種模仿人類注意力提出的模型，最初被用于手寫文本識別以及圖像標(biāo)題生成[20]。其在實(shí)際使用中有三大優(yōu)勢：①注意力機(jī)制能夠解決機(jī)器翻譯中大范圍依賴問題；②注意力機(jī)制可以提高神經(jīng)網(wǎng)絡(luò)解釋性，增強(qiáng)可視化解釋；③機(jī)器學(xué)習(xí)可以加強(qiáng)模型性能，提高準(zhǔn)確率[21]。本文采用自注意力機(jī)制，為注意力機(jī)制中的一種，其核心思想是計算不同特征之間的關(guān)聯(lián)性從而獲取樣本的大范圍依賴性，提高對特征的識別準(zhǔn)確度。自注意力機(jī)制結(jié)構(gòu)如圖2所示。

自注意力的公式定義如下：

式中：yi為第i處特征權(quán)重和；表示歸一化操作；一般為特征維度大小；

為兩個特征值之間的關(guān)聯(lián)性度量函數(shù)，一般選擇兩個特征點(diǎn)乘相似度；表示對的線性映射；Wg為權(quán)重矩陣。

3 基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型

3.1 "LS-AM-CNN網(wǎng)絡(luò)模型整體設(shè)計

本文提出一種結(jié)合了注意力機(jī)制的LS-AM-CNN網(wǎng)絡(luò)，其整體模型設(shè)計如圖3所示。其基本步驟為：

先考慮車輪多邊形的影響得到列車動力學(xué)信號，將多個通道的信號輸入到一次特征提取單元中，該單元采用雙層LSTM網(wǎng)絡(luò)，提取時序信號的總體特征；然后，使用注意力機(jī)制模塊對特征進(jìn)行權(quán)重分配，突出特征中差異更大的時間步，從而提高信號識別的精度；最后，采用1D-CNN網(wǎng)絡(luò)對特征進(jìn)行二次提取，采用全連接層得到分類結(jié)果。

3.2 卷積神經(jīng)網(wǎng)絡(luò)模塊

本文提出的基于注意力機(jī)制的LS-AM-CNN網(wǎng)絡(luò)主中，一次特征提取模塊為兩層LSTM網(wǎng)絡(luò)組成，二次提取特征單元結(jié)構(gòu)如圖4所示。在二次特征提取單元中，卷積神經(jīng)網(wǎng)絡(luò)模塊包含三層一維卷積網(wǎng)絡(luò)，每層卷積網(wǎng)絡(luò)都包含批歸一化層以及激活函數(shù)層，其中激活函數(shù)采用LeakyReLU函數(shù)。

3.3 數(shù)據(jù)預(yù)處理

本文設(shè)定每個訓(xùn)練批次樣本量Batch_size＝128，使用Adam優(yōu)化算法，學(xué)習(xí)率動態(tài)設(shè)置如下：

式中：L為學(xué)習(xí)率；E為當(dāng)前迭代次數(shù)；floor（）為向下取整函數(shù)。

迭代次數(shù)在100以內(nèi)時，學(xué)習(xí)率為0.001，當(dāng)?shù)螖?shù)在100以上時，每隔150次迭代學(xué)習(xí)率下降為之前0.1倍。

在數(shù)據(jù)預(yù)處理階段，對樣本的標(biāo)簽進(jìn)行ONE-HOT編碼，同時對樣本進(jìn)行了Z-score標(biāo)準(zhǔn)化處理。Z-score標(biāo)準(zhǔn)化方法為：

式中：為標(biāo)準(zhǔn)化得到的信號；為初始信號；為第j個通道數(shù)據(jù)的均值；為該通道的標(biāo)準(zhǔn)差。

4 實(shí)驗(yàn)驗(yàn)證

本文的故障診斷的數(shù)據(jù)樣本全部來自于SIMPACK軟件的仿真結(jié)果。仿真數(shù)據(jù)包含了列車不同位置的各方向加速度和位移等共計308個振動信號，信號的采樣頻率為1024"Hz，仿真時間48"s。本文設(shè)計的仿真實(shí)驗(yàn)方案如下：

（1）全拆故障方案：高速列車在300"km/h的速度下，考慮階數(shù)為2、5、10、15以及20的車輪多邊形下的正常工況、空氣彈簧故障、抗蛇行減振器故障以及橫向減振器故障四種工況。

（2）關(guān)鍵部件性能衰減方案：高速列車在300"km/h的速度下，車輪二十階多邊形下的抗蛇行減振器和空氣彈簧性能分別衰減為初始性能的40%、60%以及80%等工況。

在得到上述兩種方案的初始時域信號后，使用滑動窗口切割信號得到神經(jīng)網(wǎng)絡(luò)模型的數(shù)據(jù)集，窗口為長度2048個數(shù)據(jù)點(diǎn)，滑動窗口步長為205個數(shù)據(jù)點(diǎn)。

4.1 動力學(xué)仿真模型

在仿真分析中，以CRH380動車組為研究對象，列車的平面拓?fù)淠Ｐ腿鐖D5所示。模型部分動力學(xué)參數(shù)如表1所示。模型包括了一個車體、兩個構(gòu)架、四組輪對共42個自由度、四個空氣彈簧、四個抗蛇行減振器、四個橫向減振器、四個二系垂向減振器。每個轉(zhuǎn)向架左右兩側(cè)各設(shè)置了一組空氣彈簧和抗蛇行減振器，仿真過程中考慮了輪軌之間的非線性接觸關(guān)系以及非線性蠕滑力，以京—津線實(shí)測路譜為軌道激勵。

4.2 全拆故障實(shí)驗(yàn)

在全拆故障的實(shí)驗(yàn)方案中，得到的訓(xùn)練樣本數(shù)據(jù)以及標(biāo)簽ONE-HOT編碼如表2"""所示。

本次實(shí)驗(yàn)將數(shù)據(jù)集按8比2的比例分為訓(xùn)練集和測試集，測試集的樣本總數(shù)為184。將所提方法與1D-CNN網(wǎng)絡(luò)、LSTM網(wǎng)絡(luò)、LSTM-CNN（LSTM與1D-CNN網(wǎng)絡(luò)連接的網(wǎng)絡(luò)）進(jìn)行對比。圖6是LS-AM-CNN網(wǎng)絡(luò)在二十階車輪多邊形工況下的測試集分類混淆矩陣，可以看到，LS-AM-CNN的分類準(zhǔn)確率達(dá)到了100%；車輪多邊形各階數(shù)工況下的網(wǎng)絡(luò)分類準(zhǔn)確率如表3所示，其中，LS-AM-CNN網(wǎng)絡(luò)的分類準(zhǔn)確率最高，說明所提方法有效提高診斷準(zhǔn)確率。同時可以看到，隨著車輪多邊形階數(shù)的增加，其余三個模型的診斷準(zhǔn)確率明顯下降，而所提方法的預(yù)測精度基本保持在較高水平。車輪多邊形對網(wǎng)絡(luò)診斷模型存在較強(qiáng)干擾，而所提方法引入了注意力機(jī)制，能夠降低車輪多邊形的影響，提高分類準(zhǔn)確率。

4.3 關(guān)鍵部件性能衰減實(shí)驗(yàn)

實(shí)驗(yàn)數(shù)據(jù)集按照8比2比例分為訓(xùn)練集和測試集，測試集樣本總數(shù)為138。四個模型的診斷準(zhǔn)確率如圖7所示。

可以看出，在衰減實(shí)驗(yàn)中，1D-CNN網(wǎng)絡(luò)的表現(xiàn)最差，兩個工況準(zhǔn)確率不足70%；LS-AM-CNN網(wǎng)絡(luò)診斷性能相對最優(yōu)，但也受到明顯影響，兩個工況診斷準(zhǔn)確率分別為89.13%和92.75%。可以看到在衰減實(shí)驗(yàn)中，各神經(jīng)網(wǎng)絡(luò)的預(yù)測性能相比全拆實(shí)驗(yàn)有明顯退步，這是由于衰減信號在許多時間步上特征類似，并且因?yàn)檐囕啿粓A順噪聲的干擾，增加了分類的難度，但是LS-AM-CNN網(wǎng)絡(luò)中注意力機(jī)制能夠突出信號特征，在對比模型中具有更高準(zhǔn)確率。

5 結(jié)論

針對傳統(tǒng)模型在進(jìn)行轉(zhuǎn)向架故障診斷時未考慮車輪多邊形的狀況，本文提出了一種基于LSTM網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的LS-AM-CNN網(wǎng)絡(luò)模型，該模型針引入了注意力機(jī)制，提高了模型的識別精度。通過研究傳統(tǒng)模型以及LS-AM-CNN模型在全拆故障實(shí)驗(yàn)以及關(guān)鍵部件衰減實(shí)驗(yàn)得到如下結(jié)論：

（1）在全拆故障實(shí)驗(yàn)中，傳統(tǒng)神經(jīng)網(wǎng)絡(luò)如1D-CNN網(wǎng)絡(luò)、LSTM-CNN網(wǎng)絡(luò)以及LSTM網(wǎng)絡(luò)在抵抗車輪多邊形異常信號干擾的能力較弱，隨著車輪多邊形階數(shù)的增加，已有三種方法的準(zhǔn)確率有明顯降低，而本文提出的LS-AM-CNN網(wǎng)絡(luò)模型中引入的注意力機(jī)制能夠有效降低車輪多邊形異常信號的干擾，分類準(zhǔn)確率保持在高水平，最低也能達(dá)到98.69%。說明引入注意力機(jī)制能夠提高神經(jīng)網(wǎng)絡(luò)在轉(zhuǎn)向架故障診斷中的適用性。

（2）在關(guān)鍵部件的衰減實(shí)驗(yàn)中，通道信號相似性較高，對于神經(jīng)網(wǎng)絡(luò)的分類準(zhǔn)確率影響較大。在衰減實(shí)驗(yàn)中各神經(jīng)網(wǎng)絡(luò)模型的分類準(zhǔn)確率有明顯下降，但是LS-AM-CNN模型依舊能保持較高的準(zhǔn)確率，在抗蛇行減振器衰減的工況準(zhǔn)確率達(dá)到92.75%，說明該模型在轉(zhuǎn)向架關(guān)鍵部件的衰減診斷上較LSTM網(wǎng)絡(luò)、1D-CNN網(wǎng)絡(luò)等更具有應(yīng)用價值。

參考文獻(xiàn)：

[1]粟麗源. 基于卷積神經(jīng)網(wǎng)絡(luò)的高速列車轉(zhuǎn)向架故障診斷方法研究[D]. 成都：西南交通大學(xué)，2019.

[2]梁開偉. 基于多重卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的高速列車轉(zhuǎn)向架故障診斷方法研究[D]. 成都：西南交通大學(xué)，2020.

[3]ZUO Y，WANG N，JIA L，et al. Fully Decomposed Singular Value and Fixed Dictionary Extreme Learning Machine for Bogie Fault Diagnosis[J]. IEEE Transactions on Intelligent Transportation Systems，2022，23（8）：10262-10274.

[4]LI Y，JIN W. Application of Full Vector IMF Entropy in Fault Diagnosis of High Speed Train [J]. Journal of Vibration， Measurement and Diagnosis，2021，41（5）：874-879.

[5]秦娜，金煒東，黃進(jìn). 基于EEMD的高速列車轉(zhuǎn)向架故障診斷[J]. 計算機(jī)工程，2013，39（12）：1-4.

[6]WANG Z，JIA L，KOU L，et al. Spectral Kurtosis Entropy and Weighted SaE-ELM for Bogie Fault Diagnosis under Variable Conditions[J]. Sensors （Basel， Switzerland），2018，18（6）：1705.

[7]HUANG D，LI S，QIN N，et al. Fault Diagnosis of High-Speed Train Bogie Based on the Improved-CEEMDAN and 1-D CNN Algorithms[J]. IEEE Transactions on Instrumentation and Measurement，2021（70）：1-11.

[8]王憶佳，曾京，羅仁. 高速列車車輪多邊形化對車輛動力學(xué)性能的影響[J]. 四川大學(xué)學(xué)報（工程科學(xué)版），2013，45（3）：176-182.

[9]王紅兵，李國芳，王澤根. 車輪多邊形對車輛動力學(xué)性能影響分析[J]. 鐵道標(biāo)準(zhǔn)設(shè)計，2020，64（6）：165-171.

[10]尹振坤，吳越，韓健. 高速列車車輪多邊形磨耗對輪軌垂向力的影響[J]. 鐵道學(xué)報，2017，39（10）：26-32.

[11]POPP. System dynamics of railway vehicles and track[J]. ARCHIVE OF APPLIED MECHANICS，2003，72（11-12）：949-961.

[12]李鳳林，杜紅梅，樊懿葳. 基于形態(tài)學(xué)濾波的車輪多邊形故障診斷方法[J]. 機(jī)械，2023，50（8）：39-46.

[13]高潤. 列車車輪失圓動態(tài)檢測方法與技術(shù)研究[D]. 北京：北京交通大學(xué)，2021.

[14]朱海燕，胡華濤，尹必超. 軌道車輛車輪多邊形研究進(jìn)展[J]. 交通運(yùn)輸工程學(xué)報，2020，20（1）：102-119.

[15]趙新利，吳越，郭濤. 車輪多邊形磨耗統(tǒng)計規(guī)律及關(guān)鍵影響因素分析[J]. 振動測試與診斷，2020，40（1）：48-53.

[16]胡曉依. 動車組車輪多邊形磨耗形成與發(fā)展過程仿真研究[J]. 中國鐵道科學(xué)，2021，42（2）：107-115.

[17]翟婉明. 車輛－軌道耦合動力學(xué)Vehicle-track coupling dynamics[M]. 北京：科學(xué)出版社，2007.

[18]HOCHREITER S，SCHMIDHUBER J. Long Short-Term Memory[J]. Neural Computation，1997，9（8）：1735-1780.

[19]ALEX. Supervised Sequence Labelling with Recurrent Neural Networks[M]. Berlin：Springer，2012.

[20]VIET. Skin Lesion Classification on Imbalanced Data Using Deep Learning with Soft Attention[J]. SENSORS，2022，22（19）：7530.

[21]LIU J W，LIU J W，LUO X L. Research progress in attention mechanism in deep learning [J]. Chinese Journal of Engineering，2021，43（11）：1499-1511.