陳 浩, 鄧 鵬
(1.國防科技大學 智能科學學院, 長沙 410005; 2.國防科技大學 信息通信學院, 西安 710100)
軍用直升機在現(xiàn)代軍事中已經成為一種不可或缺的武器裝備,直升機安全可靠性的研究成為一個重要課題[1]。直升機傳動系統(tǒng)故障的機械部件一般沒有冗余結構,一旦出現(xiàn)故障,將會發(fā)生嚴重的安全事故[2-3]。飛行過程中,直升機傳動系統(tǒng)中的軸承受到長期的摩擦和疲勞應力,極易產生性能退化和故障失效,對直升機軸承進行退化特征提取和故障預測,有利于提前預警,化險為夷[4-5]。傳統(tǒng)方法中,通過提取機械振動信號中的統(tǒng)計特征如均方根(Root mean square, RMS)和峭度等能較好地觀察零部件的性能退化特征[6-10]。而直升機軸承振動信號中含有大量環(huán)境噪聲,傳統(tǒng)方法提取出的特征性能較差,難以提取出軸承的準確退化特征。卷積自編碼器(Convolutional autoencoder, CAE)是深度自編碼器的一種變體,具有較強的無監(jiān)督特征學習能力和降噪功能,主要用于圖像降噪,較少應用于機械振動信號研究[11]。本文創(chuàng)新性地將CAE應用于軸承振動信號的自適應多維退化特征提取,結果證明該方法非常適合軸承的退化特征提取。
卷積自編碼器借鑒了自編碼器無監(jiān)督學習的特點,以卷積神經網(wǎng)絡(Convolutional neural network, CNN)中的卷積層和池化層代替自編碼器中的全連接層,通過較少的網(wǎng)絡參數(shù)可以實現(xiàn)特征提取[12-13]。卷積自編碼器的結構及訓練流程簡圖,如圖1所示。卷積自編碼器中的卷積核相當于濾波器,可以用來提取數(shù)據(jù)的局部區(qū)域特征。池化層一般用來進行特征選擇,保留顯著特征,減少參數(shù)量。

圖1 卷積自編碼器的結構及訓練流程
以一維卷積為例,介紹卷積運算和池化運算。
(1)卷積
定義w1,w2,…,wm為一組卷積核,深度學習里的卷積實現(xiàn)大部分都是互相關運算,即卷積核不進行翻轉操作。一維數(shù)據(jù)序列x與卷積核w的卷積操作定義為:
(1)
式中m表示卷積核長度,一般卷積核尺寸m遠遠小于數(shù)據(jù)序列尺寸n。因此,卷積相當于卷積核在數(shù)據(jù)序列上求移動平均。
(2)池化
池化是下采樣方法的一種,主要是對特征進行聚合降維。一般地,在經過卷積層之后輸入,雖然網(wǎng)絡連接數(shù)量大幅減少,但是經過不同卷積核特征映射后的網(wǎng)絡連接總量依舊很多,特征維度很高,所以在卷積之后需引入池化對特征進行降維,這樣能夠有效避免過擬合,減少網(wǎng)絡參數(shù)量,提高計算速度。
池化運算將數(shù)據(jù)劃分為若干個子區(qū)域,以子區(qū)域數(shù)據(jù)的統(tǒng)計特征作為子區(qū)域的輸出。常見的池化運算有均值池化(Mean pooling)和最大池化(Maximum pooling),兩種池化運算的數(shù)學表達式為:
均值池化:
(2)
最大池化:
(3)
式中:x表示池化運算前輸入;yj,m表示第j個特征映射第m個子區(qū)域的池化輸出;s表示移動步長;r表示子區(qū)域尺寸大小。通過調整移動步長s和子區(qū)域尺寸r的數(shù)值,子區(qū)域可以重疊,也可以不重疊。
對于輸入數(shù)據(jù)x,卷積自編碼器第k個卷積核的特征映射輸出可以表示為:
hk=s(x*Wk+bk)
(4)
式中:*表示卷積運算;Wk和bk分別表示第k個卷積核的權重矩陣和網(wǎng)絡偏置。
通過卷積后,接下來對輸出hk進行下采樣得到:
(5)

通過編碼—解碼過程后,最后的反卷積層重構輸出為:

卷積自編碼器的訓練過程一般是通過最小化損失函數(shù)對卷積核權重矩陣W和偏置b進行尋優(yōu)求解,利用誤差反向傳播(Back propagation, BP)算法進行參數(shù)學習調整,梯度下降算法更新網(wǎng)絡參數(shù),這與常用經典自編碼器的訓練過程基本一致。
基于卷積自編碼器的最優(yōu)退化特征提取方法主要思想為:將采集的原始振動數(shù)據(jù)按監(jiān)測周期裁剪成多個樣本,依次輸入到卷積自編碼器中,利用卷積和池化運算,自適應提取多組編碼特征作為候選退化特征,基于退化特征評估指標進行評估,從中挑選評估結果最優(yōu)的候選退化特征作為最終的退化特征。
基于卷積自編碼器的最優(yōu)退化特征提取流程如圖2所示,主要有以下幾個步驟:

圖2 基于卷積自編碼器的最優(yōu)退化特征提取方法流程
(1)數(shù)據(jù)采集:通過在實驗設備上安裝加速度傳感器采集振動信號,設定好采樣率、采樣間隔、每次采樣時長及停機條件,從而獲得預測對象的全壽命數(shù)據(jù)。
(2)構建數(shù)據(jù)集:對步驟1中數(shù)據(jù)取絕對值,根據(jù)單監(jiān)測周期內采樣點數(shù),將數(shù)據(jù)裁剪成等長樣本數(shù)據(jù),樣本內數(shù)據(jù)點數(shù)即單監(jiān)測周期內采樣點數(shù)。由于是無監(jiān)督訓練學習,所有數(shù)據(jù)集樣本數(shù)據(jù)均為訓練集,訓練集輸入與標簽均為原始數(shù)據(jù),數(shù)據(jù)格式為(原始數(shù)據(jù),原始數(shù)據(jù))。
(3)網(wǎng)絡模型搭建及訓練:根據(jù)數(shù)據(jù)集樣本數(shù)目及樣本內數(shù)據(jù)點數(shù)設定CAE網(wǎng)絡模型參數(shù),包括網(wǎng)絡層數(shù)、每層卷積核數(shù)量及尺寸和池化區(qū)域尺寸等。網(wǎng)絡訓練方式采用批量訓練,批量訓練尺寸在計算內存允許的情況下可以適當取較大值。通過事先設定迭代次數(shù)或者損失函數(shù)的閾值來判斷網(wǎng)絡模型是否完成訓練。初次設定的網(wǎng)絡模型參數(shù)可能達不到要求,需要根據(jù)損失函數(shù)的收斂情況來逐步調整網(wǎng)絡參數(shù),從而獲得較好的網(wǎng)絡模型。
(4)輸出候選退化特征:輸入數(shù)據(jù)集樣本數(shù)據(jù),待網(wǎng)絡模型完成訓練之后,通過編碼器輸出得到多組候選退化特征。
(5)特征評估及選擇:基于退化特征評估指標,對步驟4中得到的多組候選退化特征進行量化評價,從中選擇評價結果最好的作為最優(yōu)退化特征。
基于退化特征評估指標進行量化評價選出最優(yōu)退化特征,采用的評價指標為常用的單調性(Monotonicity)、相關性(Correlation)和魯棒性(Robustness)三個指標的加權平均[14],由于單調性是退化特征較為關鍵的屬性,設置三者權重比例為0.5∶0.25∶0.25。評估計算式為:
(7)
式中Score值越大,表明退化特征的綜合評估結果越好。
實驗數(shù)據(jù)來源為PHM 2012數(shù)據(jù)挑戰(zhàn)賽提供的軸承加速退化全壽命數(shù)據(jù)集[15],數(shù)據(jù)由軸承垂直方向和水平方向加速度計采集,傳感器采樣頻率為25.6 kHz,監(jiān)測周期為10 s,每個檢測周期采樣0.1 s,因此,每個樣本包含2 560個數(shù)據(jù)點。實驗定義:軸承振動信號超過20 g,即認為軸承出現(xiàn)故障失效。經分析,軸承水平方向振動信號時域波形普遍比垂直方向振動信號時域波形趨勢性更好,波動性更小。因此,退化特征提取僅使用軸承的水平方向振動信號。
進行特征提取的CAE網(wǎng)絡模型基本設計原則為:
(1)第一層卷積核尺寸可以適當取大。設定為32、48和64等,這樣可以獲得更大的感受野區(qū)域,使得較深層網(wǎng)絡仍能保留輸入數(shù)據(jù)的原始信息。
(2)其余層卷積核尺寸不宜過大。一般設為3或者5,在一維卷積中小尺寸卷積核能夠更有效地平滑信號噪聲。
(3)下采樣區(qū)域尺寸不宜過大。避免過度損失數(shù)據(jù)中的原始信息。
針對網(wǎng)絡層數(shù)、下采樣區(qū)域尺寸設計了多種不同的CAE網(wǎng)絡結構,卷積核和采樣層區(qū)域移動步長均設為1,最終提取出最優(yōu)退化特征,其CAE網(wǎng)絡結構模型參數(shù)如表1所示。

表1 CAE最優(yōu)退化特征提取方法的網(wǎng)絡結構模型參數(shù)
該模型所提取的CAE最優(yōu)退化特征實驗結果如圖3所示,特征結果進行了歸一化處理。可以看出,本文所提取的退化特征具有明顯的退化趨勢。

(a)軸承1-1 (b)軸承1-2
為了驗證CAE最優(yōu)退化特征方法的有效性,基于單調性等特征評估指標,將本文得到的CAE最優(yōu)退化特征與RMS特征、自組織映射融合特征進行對比。其中,RMS是一種常用的表征信號能量的特征,能較好地表征機械零部件的退化過程,但在大噪聲工況下早期趨勢不明顯,效果較差[16]。RMS的數(shù)學表達式為:
(8)
式中:n表示信號長度;xi表示振動信號的幅值。
CAE-SOM融合特征是指在數(shù)據(jù)樣本輸入CAE網(wǎng)絡模型后得到n條候選退化特征曲線,將這些候選退化特征輸入SOM網(wǎng)絡進行降維融合,計算輸入特征數(shù)據(jù)x與最佳匹配單元(Best matching unit, BMU)間的最小量化誤差(Minimum quantization error, MQE),最小量化誤差即為得到的CAE-SOM融合特征[17]。最小量化誤差的表達式為:
(9)
根據(jù)經驗,SOM網(wǎng)絡拓撲層神經元總數(shù)設為4×30,迭代次數(shù)設為100,初始學習率和學習率參數(shù)分別為0.6和1 000。
4組軸承數(shù)據(jù)的3種特征性能歸一化評估結果如表2所示,表中Mon、Corr和Rob分別表示單調性、相關性和魯棒性指標,按照0.5∶0.25∶0.25的權重比值得到綜合評價值Score。評估結果表明,通過CAE網(wǎng)絡模型提取出來的退化特征的單調性和魯棒性更好,綜合評價值也更高。

表2 3種特征的特征性能評估結果
進一步對噪聲環(huán)境下的軸承數(shù)據(jù)進行了仿真,在原始數(shù)據(jù)上添加了高斯白噪聲,加噪信號構造方法為:
Nosie_data =Data+Noise_factor×Randn(n)
(10)
式中:Nosie_date表示加噪仿真信號;Date表示原始振動信號;Noise_factor為高斯白噪聲的信號幅值,本文取1;Rand(n)是信號序列長度為n,均值為0,方差為1的高斯隨機序列。
對加噪仿真信號分別提取RMS特征、CAE-SOM融合特征和CAE最優(yōu)特征,并采用特征性能評估指標對其性能進行對比評估,結果如表3所示。可以看到,CAE-SOM和CAE最優(yōu)退化特征的單調性和魯棒性都明顯優(yōu)于RMS特征,這表明卷積具有較好的濾波作用。其中,CAE-SOM和CAE最優(yōu)退化特征的區(qū)別在于CAE-SOM是將數(shù)據(jù)輸入CAE模型后,得到的n條候選退化特征曲線進行降維融合,并計算MQE得到的數(shù)據(jù),而CAE最優(yōu)退化特征是從n條候選退化特征曲線中去提取最優(yōu)退化特征。表中CAE-SOM融合特征在某些組數(shù)據(jù)表現(xiàn)較差,這是因為通過CAE網(wǎng)絡模型得到的多組候選退化特征里有些特征并不具備表征軸承退化過程的能力,融合特征里摻雜了這些較差的特征,從而導致融合特征的評價結果較差。因此,在綜合評分上,CAE最優(yōu)退化特征性能是最優(yōu)的,本文所提取的最優(yōu)退化特征具有良好的特征表征效果,具備較好的特征性能。

表3 加噪下3種特征的特征性能評估結果
針對軸承加速退化振動數(shù)據(jù),應用卷積自編碼器開展退化特征提取方法研究,本方法提取的軸承最優(yōu)退化特征經實驗對比驗證和加噪仿真對比,表現(xiàn)出良好的特征表征效果。該方法能夠自適應提取單調性更好和更加平滑的退化特征,為狀態(tài)監(jiān)測及后續(xù)的預測工作提供幫助。