












摘" 要:為提高自動扶梯軸承剩余使用壽命(RUL)預測模型的預測精度和泛化能力,提出一種基于卷積神經網絡(CNN)的軸承RUL預測方法。首先基于3σ準則對原始數據進行去噪,通過快速傅里葉變換獲得其頻率特征,其次將不同于傳統時間序列數據劃分方法的分層抽樣應用于數據劃分,并構造一個由三個卷積層和兩個全連通層組成的深度卷積神經網絡DCNN模型,最后利用NASA IMS數據集對預處理方法、DCNN模型精度和泛化能力進行評估,證明了該方法的優越性。
關鍵詞:剩余壽命預測;3σ準則;分層抽樣;DCNN;泛化能力
中圖分類號:TP391;TH133.3 文獻標識碼:A 文章編號:2096-4706(2024)10-0032-06
Prediction Method for Bearing Remaining Useful Life Based on
Convolutional Neural Networks
ZHANG Hao1, ZHAO Jun1, WANG Lu1, ZHANG Yinlong2, CHENG Siyu2
(1.Nanjing Metro Construction Co., Ltd., Nanjing" 211806, China;
2.China Railway Siyuan Survey and Design Group Co., Ltd., Wuhan" 430063, China)
Abstract: To improve the prediction accuracy and generalization ability of the Remaining Useful Life (RUL) prediction model for escalator bearings, a bearing RUL prediction method based on Convolutional Neural Network (CNN) is proposed. Firstly, it denoises the original data based on 3σ criterion, obtains its frequency characteristics through fast Fourier transformation. Secondly, it applies layered sampling different from traditional time series data partitioning methods to data partitioning, and constructs a Deep Convolutional Neural Network (DCNN) model consisting of three convolutional layers and two fully connected layers. Finally, the NASA IMS dataset is used to evaluate the preprocessing method, DCNN model accuracy, and generalization ability, proving the superiority of this method.
Keywords: RUL prediction; 3σ criterion; layered sampling; DCNN; generalization ability
0" 引" 言
自動扶梯軸承剩余使用壽命(Remain Useful Life, RUL)預測對公共安全極其重要,精確的RUL預測可以減少自動扶梯的維修停梯時間,提高運營效益并降低運營成本[1-3],確保采取適當的維護決策[4],避免扶梯設備造成的人員傷亡和財產損失[5],研究和提高自動扶梯軸承RUL預測技術的準確性具有較強的現實意義[6-8]。
深度學習結合不同的神經網絡可以在RUL預測中取得優異的結果,泛化能力是評價模型預測性能的重要指標[9]。基于此,本文提出了一種用于軸承RUL預測的方法,利用3σ準則去除原始數據中的粗監測誤差,通過快速傅里葉變換從時域數據中獲得軸承的頻率特征,基于時間和頻率特征通過分層抽樣構建訓練集和測試集。如果訓練后損失函數最小,則保存訓練后的模型。如果損失函數不是最小的,則采用反向傳播法來調整卷積層和全連接層的權重W和偏置B,直到損失函數達到最小。最后使用測試數據對訓練好的模型進行測試。如果指數值是最佳的,則獲得預測的RUL。如果指數值不是最優的,則調整訓練次數、核大小和隱藏層深度,以獲得最優的指數值。
1" 數據預處理
1.1" 數據去噪
假設數據服從高斯分布,采用3σ準則來消除測量數據中的粗差,數據分布幾乎完全集中在(μ-3σ,μ+3σ)區間,超過該區間的數據比例為0.27%,區間之外的數據在此步驟被去除。
1.2" 時間和頻率特征選擇
通過快速傅里葉變換從原始時域獲取頻率特征,如表1所示。
1.3" 跟蹤度量
跟蹤度量是壽命分析的基礎,包括穩定性和準確性,反映軸承振動趨勢和可靠性。均方根值能夠反映整個數據集的變化趨勢,具有合理的穩定性,滿足跟蹤指標的要求。每組的均方根描述了數據集在相應時間點的振動,整個數據集的均方根反映了振幅的變化趨勢。均方根值表示為:
其中,xi表示第i點的監測數據。
1.4" 標準化
監測數據包括軸承運行中每個點的振幅[10]。數據中的正負信號代表振幅的方向,歸一化數據在[0,1]中變化。去噪數據被歸一化以避免過大或過小的值:
其中,xi表示第i點的監測數據,xmin和xmax表示數據去噪后同一時間點的最小值和最大值。
1.5" 數據分區
采用分層抽樣的方法對預測模型構建訓練集和測試集,學習軸承運行過程中各階段的特征。軸承運行的完整歷史數據包括時間和頻率特征,根據時間序列將其分組。每組包含5個數據點,按4:1的比例提取,即每4個數據點中提取1個數據點。提取的數據作為測試集,剩余的數據構成訓練集。
2" 預測模型構建
2.1" 預測模型結構
本文構建了一個基于DCNN的預測模型,應用ReLU作為激活函數,精確擬合數據并進行預測;表達式如式(4)所示。在DCNN正向傳播中應用了丟包來避免過擬合,提高了模型的泛化能力,丟包值被設置為0.7;應用損失函數評價模型的準確性作為反向優化的指標,表達式如式(5)所示;Adam優化算法用于改善結果。Adam函數的主要思想是通過使用梯度的一階矩估計和二階矩估計來調整每個參數的學習率。偏差修正后,學習率集中在一定范圍內穩定參數。使用Adam算法優化模型包括4個步驟:計算每個參數的梯度,如式(6)所示;計算速度更新量和修改的速度更新量,如式(7)和(8)所示,其可以根據更新的參數和梯度累積平方來動態調整速度;計算梯度累積平方和修正梯度累積平方,如式(9)和(10)所示,速度更新量和梯度累積平方是Adam優化的關鍵技術;更新參數,如式(11)所示,其中η表示步長因子,其取決于速度更新量和梯度累積平方。測試集被輸入到訓練好的模型中以預測RUL并分析其可靠性:
其中,ω表示參數,dω表示ω的一階矩,L(ω)表示ω的函數。
v = β1v + (1 - β1)dω" " " " " " " " " " "(6)
其中,β1表示一階矩估計的指數衰減率,v表示速度更新量。
其中, 表示當前時刻第一時刻估計的指數衰減率,v'表示修正的速度更新量。
Sdω = β2Sdω + (1 - β1)dω2" " " " " " " " " " " " " "(8)
其中,β2表示二階矩估計的指數衰減率,Sdω是梯度累加平方,dω2表示ω的二階矩。
其中, 表示當前時刻二階矩估計的指數衰減率,Sdω'表示修正的梯度累加平方。
輸入特征被轉換成一維向量,6個元素中的每一個在相同的時間點對應于6個特征(如表1所示),使得第一組代表第一時間點。第一個卷積層中的核大小是6×1,步長是6,這意味著核為每個操作同時計算6個特征。兩個具有1×1核的卷積層跟隨以增強特征學習的能力。第一個全連接層在卷積后集成了這些功能,第二個全連接層計算預測結果。
2.2" 模型評估
該模型由均方根誤差(Rm)、擬合優度(R2)、調整后的擬合優度(調整后的R2)進行評估。
Rm表示一個衡量預測值和實際值之間差異的指數。Rm越接近0,預測結果越準確,計算式為:
其中,yi表示實際值, 表示預測值。
R2表示統計學中用于評估回歸模型擬合度的優秀標準。R2值通常在[0,1]范圍內變化。值越接近1,模型的擬合越好。當模型擬合不好時,函數值接近于0。計算式為:
其中, 表示平均值,n表示數據中的樣本數。
根據式(12),當樣本數量相對較大時,R2增加,因此擬合優度可能不能準確地表示評估模型的性能,尤其是在大樣本量的情況下。為了克服這個問題,提出了一種調整的" 來避免數據樣本數量對模型評價的影響。計算式為:
其中,n表示數據中的樣本數量,p表示數據中的特征數量。
3" 實驗分析
本文利用NASA IMS數據集中的3個軸承運行的監測信息來進行模型驗證。每個軸承都配有一個傳感器,每次記錄20 480個點的振動。
3.1" 模型比較
選擇RNN、LSTM作為比較模型。為了使比較更有說服力和有效性,選擇每個模型的最優預測結果進行比較;因此,每個模型數據集的劃分比例是不同的:
1)RNN。為了保證比較的公平性,基于TensorFlow框架構建了RNN預測模型。將數據以8:2的比例分成訓練集和測試集,并構建4個RNN層。最后一層是全連接層。采用ReLU作為激活函數,均方誤差作為損失函數,采用Adam優化算法。每層神經元分別為33、17、6、1,丟包值設置為0.7。
2)LSTM。基于TensorFlow框架,構造了一個具有三個隱藏層的LSTM預測模型。數據集按照7:3的比例分為訓練集和測試集。最后一層應用ReLU作為激活函數。損失函數采用均方誤差,采用Adam優化算法。LSTM由四層組成;每層神經元分別為35、24、11和1,丟包值設置為0.7。
3)DCNN。對于本文提出DCNN模型,數據集按照4:1的比例分為訓練集和測試集。
3.2" 模型驗證
選擇第二組IMS數據集中軸承1的監測數據作為模型訓練數據。通過兩個實驗驗證了該方法的有效性。實驗一評估了本文提出數據去噪方法的有效性,實驗二評估了模型的泛化能力。
3.2.1" 實驗一
對于第1個軸承的運行數據,使用不同的數據預處理方法(無去噪、硬閾值去噪、軟閾值去噪和3σ準則去噪)比較3個模型(RNN、LSTM、DCNN)的預測,以確定去噪方法對預測精度的影響:
1)沒有去噪的數據。實驗結果如圖1所示,RNN和LSTM模型的預測曲線與真實曲線有很大的不同,就95%置信區間和預測誤差而言,最小波動出現在DCNN中,各模型的評價指標如表2所示。
表2中的定量分析表明,各評價指標的最優值為Rm = 0.018 18,R2 = 0.958 46,調整后的R2 = 0.958 12,均由DCNN模型實現。綜合定性和定量分析表明,當數據未去噪時,DCNN模型的預測值最接近真實值。
2)硬閾值去噪。硬閾值去噪在提高精度方面是有效的,結果如圖2所示,評價指標如表3所示。
表3中的定量分析表明,除了得分指標之外,DCNN可以實現每個評估指標的最佳值,因為得分函數對高估給出了較大的懲罰,對預測不足給出了較小的懲罰。最優值為Rm = 0.057 53,R2 = 0.993 82,調整后的R2 = 0.993 38。
綜合分析表明,DCNN可以在硬閾值去噪的情況下獲得理想的預測結果,連續卷積操作有助于提高模型的預測能力。
3)3σ準則去噪。本文提出的3σ準則去噪后模型的結果如圖3所示,評價指標如表4所示。
表5中的定量分析表明,各評價指標的最優值為Rm = 0.005 25,R2 = 0.997 62,調整后的R2 = 0.997 60,均由DCNN模型實現。
根據對三者的定量分析,用3σ準則去噪,預測值與實際值最接近。綜合比較后可知采用3σ準則去噪結合DCNN可以得到最佳的預測結果。
3.2.2" 實驗二
由于各軸承的退化趨勢不同,選擇第2、3軸承的運行數據作為實驗測試數據,以驗證模型的泛化能力,并評估模型依賴于每個數據集的性能。實驗一結果如圖4、圖5所示,3σ準則去噪最大化了DCNN模型的預測精度。為了驗證預測性能最好的模型(帶3σ去噪的DCNN)的泛化能力,實驗二仍然采用3σ準則去噪,應用3σ準則去噪時,3個模型的參數和結構與實驗一一致。通過不同的數據集驗證了模型的泛化能力。
各模型的評價統計如6表所示,不同軸承的最佳評估指標值以粗體顯示,所有這些評價指標都是通過DCNN實現的。
由表可知RNN和LSTM的評價指標值與DCNN模型存在較大差距;也就是說,預測結果是最差的,同時與軸承1的評價指標也有較大出入反映出其泛化能力也較弱。
表6的綜合分析結果表明,RNN和LSTM的預測能力較差,DCNN對于不同退化趨勢的軸承可以獲得較好的預測結果,即DCNN的泛化能力最好。
3.3" 結果分析
實驗一的結果分析,如表3至表6所示,表明DCNN模型的預測評價指標值最接近理想值;因此,DCNN模型的預測精度最高。通過3σ準則去噪預處理,提高了模型的預測評價指標值,表明3σ準則去噪效果最好。因此,結合DCNN模型的3σ準則去噪預處理方法對3個評價指標進行了優化,最優值為Rm = 0.005 25,R2 = 0.997 62, = 0.997 60。
實驗二的結果分析,如表6所示,比較了每個模型的相應評價指標值。RNN、LSTM模型的相應評價尺度變化較大,表明RNN、LSTM嚴重依賴數據集,易受數據結構的影響,泛化能力弱。對應于DCNN模型的每個評估指標的值的變化最小。這一發現表明,該模型對數據集具有很強的適應性和最好的泛化能力。DCNN模型預測的評估指數值的范圍如下:Rm (0.005 25,0.010 84)、R2 (0.993 45,0.997 62)、 (0.993 39,0.997 60),DCNN模型的變異范圍最小,泛化能力最好。
4" 結" 論
本文提出了一種基于神經網絡理論的軸承RUL預測方法,該方法預測能力強,泛化能力強。通過3σ準則法有效地去除了數據中的粗監測誤差,提高了模型預測精度,得到的評價指標值比其他去噪方法得到的結果更接近理想結果。構造了由三個卷積層和兩個全連通層組成的DCNN模型。并通過模型驗證實驗表明,基于3σ準則和分層抽樣結合DCNN的去噪方法具有最高的預測精度和最強的泛化能力。
參考文獻:
[1] 梁敏健,彭曉軍,劉德陽.基于一維卷積神經網絡的自動扶梯機械故障分類研究 [J].測控技術,2022,41(7):87-92+110.
[2] KHAN S,YAIRI T. A Review on the Application of Deep Learning in System Health Management [J].Mechanical Systems and Signal Processing,2018,107:241-265.
[3] KUNDU P,DARPE A K,KULKARNI M S. Weibull Accelerated Failure Time Regression Model for Remaining Useful Life Prediction of Bearing Working Under Multiple Operating Conditions [J].Mechanical Systems and Signal Processing,2019,134:106302[2023-06-10].https://doi.org/10.1016/j.ymssp.2019.106302.
[4] 關鵬,張毅.自動扶梯軸承健康指標提取及剩余壽命預測方法研究 [J].機電工程,2022,39(2):202-209.
[5] LEE J,WU F J,ZHAO W Y,et al. Prognostics and Health Management Design for Rotary Machinery Systems—Reviews, Methodology and Applications [J].Mechanical Systems and Signal Processing,2014,42(1-2):314-334.
[6] LEI Y G,LI N P,GONTARZ S,et al. A Model-Based Method for Remaining Useful Life Prediction of Machinery [J].IEEE Transactions on Reliability,2016,65(3):1314-1326.
[7] 杜澤厚.基于深度學習的軸承健康因子構建及壽命預測研究 [D].青島:青島科技大學,2022.
[8] QIAN Y N,YAN R Q,GAO R X. A Multi-Time Scale Approach to Remaining Useful Life Prediction in Rolling Bearing [J].Mechanical Systems and Signal Processing,2017,83:549-567.
[9] 鄭琪,趙春暉.軸承磨損階段劃分與分段剩余壽命估計方法 [J].控制工程,2022,29(4):593-599+636.
[10] LEI Y G,LI N P,GUO L,et al. Machinery Health Prognostics: A Systematic Review from Data Acquisition to RUL Prediction [J].Mechanical Systems and Signal Processing,2018,104:799-834.
作者簡介:張浩(1983—),男,漢族,江蘇南京人,高級工程師,碩士研究生,研究方向:機械設計。