吳春志, 馮輔周, 吳守軍, 陳湯, 江鵬程
(陸軍裝甲兵學院 車輛工程系, 北京 100072)
行星傳動機構具有體積小、重量輕、傳動比大、承載能力強、傳動效率高等諸多優點,廣泛應用于直升機主減速器、艦船、自行火炮、飛機、裝甲車輛等軍用裝備中[1-2]。在實際運行過程中,行星傳動機構承受動態重載,運行環境復雜多變,導致太陽齒輪,行星齒輪,齒圈等關鍵部件容易發生故障。這些故障如果不能被及時排除,將會導致嚴重的安全事故[3]。
設計故障診斷分類模型時,各個故障狀態的樣本數量通常保持一致,而在真正的應用環境中,類別分布并不均衡,故障數據往往相對較少。當數據集不均衡時,傳統的分類器通常偏向大多數類,因此無法正確地對少數類進行分類,當訓練數據高度不平衡時,甚至可能無法檢測到少數類。處理樣本不均衡問題有3種主要方法:第1種是修改或者創建一種新的算法,加強對少數群體的學習;第2種方法是在數據或算法級別使用代價敏感算法,以便最大限度地降低誤差;第3種也是更通用的方法是通過欠采樣、過采樣或混合方法重新平衡類分布,從而在數據級別進行修改[4]。在少量故障樣本下的行星齒輪箱故障診斷中,研究人員通常采用的是第1種方法。楊宇等[5]提出了一種基于增量半監督(VPMCD)的故障診斷方法,該方法可以在小診斷樣本的情況下對齒輪故障模式進行分類。Yang等[6]應用經驗模態分解算法提取故障特征,并采用支持向量機(SVM)對小樣本情況下的齒輪故障進行分類。在故障樣本少的條件下,SVM和灰色模型常用作故障診斷算法[7-8]。然而這些方法在對特定對象進行故障特征提取的同時還要在模式識別算法上做相適應的改變,無法滿足更多更復雜情況下的診斷需求。
深度學習以其無需人工經驗選取可自動學習特征的特點逐漸成為解決此類問題的最佳選擇。2014年,Goodfellow等[9]提出了生成式對抗網絡(GAN),它可以生成高分辨率的真實感圖像,在此基礎上又逐漸演變出深度卷積生成對抗網絡(DCGAN)、Wassertein 生成對抗網絡(WGAN)、條件生成對抗網絡(CGAN)等百余種變體算法。通過這些算法可以擴展故障集,實現樣本均衡。
本文重點研究過采樣技術用以解決樣本不均衡下行星傳動機構的故障診斷問題。使用改進的Wasserstein生成式對抗網絡構造樣本生成模型,與GAN相比確保了訓練的穩定性和生成樣本的多樣性,再通過卷積神經網絡(CNN)進行故障分類識別。為了評估WGAN算法,在加州大學歐文分校(UCI)人工數據集上對所提方法和其他過采樣方法進行對比分析,然后在某型坦克行星變速箱故障試驗臺上進行驗證。
CNN是由哺乳動物視覺皮層細胞感受野啟發而建立的一種前饋神經網絡,現在已經是圖片和視頻識別領域應用最為廣泛的方法。一個傳統的CNN模型如圖1所示,由一個輸入層,兩組交替出現的卷積層和池化層,以及全連接層組成。卷積層中每一個特征圖都對應一個卷積核,這些卷積核通過一組權重來卷積前一層的輸入并組成一組特征輸出,成為下一層的輸入。與傳統濾波器需要人工設定參數不同,CNN的權值和偏置通過反向傳播(BP)算法進行訓練。池化層主要是為了實現兩個目的:一是大幅減少輸入卷積層的空間維度,使權重參數減少75%,從而降低計算成本;二是控制過擬合,使測試集準確度更接近訓練集準確度。主流的池化方式有最大值池化、平均池化、L2-norm池化。經過兩組卷積層和池化層后,會接一個全連接層。與傳統的神經網絡類似,全連接層可以應用到不同的分類模型。全連接層后接一個隱藏層,最后由Softmax回歸層完成分類。CNN以其出色的特征自動提取并分類的能力受到廣大研究人員的青睞,在機械故障診斷領域得到了廣泛的應用[10-11],本文所用模式識別方法統一采用CNN,與傳統方法對比可見文獻[10-11]。

圖1 典型卷積神經網絡結構圖Fig.1 Typical convolutional neural network structure
在GAN誕生之前,非監督學習的基本思想是根據數據集估計樣本的分布p(x),然后對p(x)進行采樣,生成與樣本分布類似的新樣本,這種方法難以解決高維樣本的生成問題。GAN作為非監督深度學習的代表,創造性地提出了生成器G和判別器D. 生成器G學習樣本x的分布pd,并從噪聲數據z中生成新樣本G(z)得到生成樣本分布pg,G(z)通過訓練自己,希望以假亂真,讓判別器D判別不出到底哪個是真、哪個是假。而判別器D獨自訓練自己,希望能分辨出真實的數據分布和生成器G(z)給的數據分布。二者進行博弈從而優化模型,GAN的目標函數loss可以描述為

(1)
式中:Ex~pd和Ex~pg是期望值;Ex~pd[lgD(x)]表示樣本x分布pd的對數損失函數,最大化這一項意味著D(x)→1;Ex~pg[lg(1-D(G(z)))]則是根據從噪聲數據z生成樣本分布pg構建的對數損失函數,最小化這一項意味著D(G(z))→0.

圖2 WGAN-CNN結構圖Fig.2 Structure of WGAN-CNN
在訓練GAN模型時,先固定G再訓練D,使得D的準確率達到最大;然后再固定D,訓練G,使得D的準確率達到最小。當且僅當pd=pg時達到全局最優解,也就是從噪聲中生成的數據分布和真實樣本分布基本達到一致。
為了解決梯度消失的問題,Arjovsky等提出了WGAN,引入了Wasserstein距離,由于其相對Kullback-Leibler散度與Jensen-Shannon散度具有優越的平滑特性,理論上可以解決梯度消失的問題。在WGAN中最后的目標函數loss可以描述為
(2)

將圖1中所示模型優化為圖2右側部分所示的一維CNN模型。優化后的模型由輸入層、CNN層組(由卷積層和池化層組成)、全連接層、輸出層組成。其中CNN層組可以根據所需分類數據的復雜度增加或減少,本模型使用2個CNN層組。第1個CNN層組中卷積核數量為N1,第2個CNN層組中卷積核數量為N2,相應卷積核的權值向量和偏置值分別為W和b,激活函數采用修正線性單元ReLU.

(3)

(4)
(5)
第2個CNN層的輸出為
(6)

CNN訓練的目的是為了使最終的損失達到最小,模型采用的損失函數為交叉熵,優化器選用AdamOptimizer. 對于不均衡樣本的分類問題,首先采用WGAN對少數類樣本進行生成(見圖2左側部分),再結合CNN進行分類識別。
為了測試WGAN在處理樣本不均衡問題中的效果,本節將使用8個經典的UCI人工數據集,人為減少某一類的樣本數量構成不同不均衡比例(IR)的數據集,并與其他傳統的過采樣方法進行對比,使用CNN方法來分類識別。通過計算調和平均值Fe、幾何平均值Gm以及AUC作為過采樣算法的評價指標。
過采樣為的是增加少數類樣本,最直接的方法是對樣本進行隨機復制,但重復的樣本會造成過擬合,為了解決這個問題,一種隨機生成無重復少數類樣本的樣本生成技術(SMOTE)方法[12]應運而生,沿著連接少數類樣本的線段生成合成樣本,數據生成過程的直接方法是使用捕獲實際數據分布的生成模型。接著一些SMOTE的變體方法也被提出來用以改進SMOTE的過生成問題。Bunkhumpornpat等[13]提出Safe-level SMOTE方法生成的少數類樣本在“安全層”以內,避免了樣本重復。Han等[14]提出Borderline-SMOTE方法識別分類邊界的少數類樣本并進行過采樣,提高了邊界樣本的識別率。對于類內有多個簇的樣本,Cieslak等[15]提出了Cluster-SMOTE,首先使用k-means算法將少數類聚類成m個子聚類,然后將SMOTE方法應用于每個子聚類。
如表1混淆矩陣所示,在二分類問題中,測試精確度Precision、召回率Recall、Fe、Gm分別為
(7)
(8)
(9)
(10)
式中:FN表示被判定為負樣本,但事實上是正樣本;FP表示被判定為正樣本,但事實上是負樣本;TN表示被判定為負樣本,事實上也是負樣本;TP表示被判定為正樣本,事實上也是正樣本;Precision表示的是預測為正的樣本中有多少是真正的樣本;Recall表示樣本中的正例有多少被預測正確了;β為調和參數,一般取1.Gm考慮了分類的正確率,如果分類器忽略少數類并且有利于多數類,則分類器將獲得較低的Gm;AUC是受試者工作特征(ROC)圖下的區域,對二類的分布不敏感,這使得它適合作為不平衡問題的分類性能指標。

表1 混淆矩陣表
通過繪制真陽性率(TPR)與假陽性率(FPR)之間的關系來獲得ROC圖,定義為
(11)
式中:Np是少數類數量;NN是多數類數量。
對于多分類情況,可以將多分類問題拆分成多個二分類問題,將所得到的多個二分類指標Fe、Gm以及AUC求幾何平均值后得到最終的分類評價指標Fa、Ga、AUCa.
從經典的UCI人工數據集中選出8個常用數據集,如表2所示。其中數據集1、6、7是多分類問題,其余是二分類問題,數據集1~3、6、7中少數類是由原樣本中隨機選出產生的,造成從1∶1.38~1∶6不同的IR. 然后采用隨機復制(Random)、SMOTE、Borderline-SMOTE、Cluster SMOTE、Safe_level SMOTE、WGAN 6種過采樣方法對少數類進行過采樣,最后經過CNN分類并計算Fa、Ga、AUCa. 對每種數據集所得到的每類評價指標進行1~6的排名,求得排名的平均值表如表3所示。從表3中可以看出,WGAN相對于其他5種過采樣方法,在UCI人工數據集上的分類表現最好。雖然WGAN模型在訓練階段學習樣本構造生成模型時用時相對較長,一旦模型訓練完畢,則可以源源不斷地帶來所需樣本,此時的樣本生成時間可忽略不計。

表2 所選UCI數據集的詳細信息表

表3 過采樣方法評價指標排名平均值表
某型坦克行星變速箱故障模擬試驗臺實物圖如圖3所示。試驗臺機械傳動裝置由變頻電動機、變頻器柜、錐齒輪傳動箱、行星變速箱、轉速轉矩儀、加載發電機等組成。電機輸出經變頻柜調節后的轉速及扭矩,動力經錐齒輪傳動箱輸入到行星變速箱內。錐齒輪傳動箱的作用是改變力的傳遞方向,使試驗臺整體合理布置。行星變速箱兩側的輸出端與轉速轉矩儀相連,使用發電機對其進行加載,液壓站負責對行星變速箱提供潤滑油壓及換擋壓力。實驗設置兩種故障狀態,分別是K3排的太陽輪斷齒故障(齒數為30的太陽輪故障,簡稱Z30)以及與太陽輪嚙合的行星輪斷齒故障(齒數為15的行星輪故障,簡稱Z15),斷齒故障設置如圖4所示。

圖3 行星變速箱故障模擬試驗臺Fig.3 Fault simulation test rig for planetary gearbox

圖4 齒輪故障設置Fig.4 Gear failure setting
測試系統裝置包括主控平臺、32通道信號采集儀、振動傳感器和相應的數據線。通過主控平臺控制行星變速箱故障模擬試驗臺的啟停、轉速調節、加載扭矩等工程,采用相應的數據采集軟件實現對信號采集儀的通道設置。采樣頻率為20 kHz,采樣時間30 s,選用的四檔、工況為轉速1 500 r/min、負載900 N·m的數據為測試數據,每種狀態的時域圖如圖5所示。由于時域信號采樣頻率高,同一周期內點數較多且規律性不明顯,因此對截取的多段時域信號樣本做傅里葉變換,用頻譜信號作為訓練集樣本。文獻[10]指出頻譜信號相較于振動信號直接作訓練樣本,在應用CNN時能得到更高的準確率。

圖5 振動信號時域圖Fig.5 Vibration signals
為了直觀地了解在不同IR下CNN對樣本的分類情況,分別取Z15訓練集數量為30、120、600組進行CNN訓練,模型結構參數如表4所示。將所有測試樣本經過CNN模型的中間層時得到的特征向量作t分布領域嵌入算法(t-SNE)計算,降維后得到3個維度的特征,分別為特征值1、特征值2、特征值3,展示如圖6所示。從圖6中可以直觀地看到,當IR為1∶20時,正常狀況和Z15斷齒基本上沒有分開,當IR逐漸降低時,3種狀況被很好地分開。

表4 訓練集數量及CNN結構參數

圖6 不同IR分類散點圖Fig.6 Different IR classification scatter plots
由于在臺架試驗中可以得到足夠多的樣本,為了模擬實際操作中某個故障樣本稀少的情況,將Z15斷齒故障樣本取30組,其余樣本取600組,而測試樣本都為400組。以30組樣本作為WGAN的訓練集(結構參數見表4),訓練生成模型,生成的樣本如圖7所示。從圖7中可以看出,生成的頻譜圖對于頻率幅值較低的部分生成得不夠細致,但是對于頻譜圖幅值較高的部分還原得較好,在整體上基本上反應了原始樣本的特征,可以作為原始樣本的擴展樣本。

圖7 WGAN生成振動信號頻譜和原信號頻譜對比圖Fig.7 Spectra of WGAN vibration signal and original signal

圖8 不同IR下評價指標變化曲線 Fig.8 Evaluation indexes of different IRs
為了證明WGAN生成頻譜樣本的有效性,全部以生成樣本構造訓練集,以原始樣本作為測試集進行實驗。不同過采樣方法對Z15的單個類別統計如表5所示。由于同一狀態不同樣本的幅值譜較為接近,因此采用Random可以得到相對較好的結果,而WGAN表現最好。選取Z15斷齒故障作為少數類,在不同IR下,分別計算Z15單個類別的Fe、Gm、AUC、Precision、Recall以及整體的Fa、Ga、AUCa、Precision、Recall,如圖8所示。隨著IR降低,除Precision外,Z15的評價指標逐漸接近平均值,并在在IR達到1∶2以上時,評價指標接近1,這說明故障樣本的不均衡嚴重影響了分類器的判斷,也說明了WGAN生成的樣本的有效性,在IR等于1時,分類各個指標達到了100%. 同時通過對比Z15的Precision和Recall隨IR的變化情況可知,對于不均衡樣本的分類評價,單純求Precision容易陷入誤區,應考慮其他評價指標做綜合評判。

表5 過采樣方法對Z15測試結果統計表
本文針對在實際運行過程中行星變速箱故障樣本不均衡的問題,提出了使用WGAN-CNN算法作為不平衡數據的故障診斷分類方法,同時將二分類評價指標擴展到多分類問題中。經過8個經典的UCI人工數據集以及樣本不均衡下行星變速箱齒輪故障實驗,得到如下結論:
1) 在8個人工數據集上采用Random、SMOTE、Borderline-SMOTE、Cluster SMOTE、Safe_level SMOTE 5種常用的過采樣算法和WGAN算法進行比較,WGAN算法在Fa、Ga、AUCa上的平均排名最高、效果最好。
2) 設置Z15故障頻譜信號為少數類樣本,采用WGAN-CNN模型對行星變速箱進行故障診斷。通過對比不同IR下行星變速箱的分類情況以及評價指標變化情況,驗證了樣本不均衡問題會嚴重影響模型的分類結果,同時表明模型生成的頻譜信號基本上反應了原始樣本的特征,可以作為原始樣本的擴展樣本,解決了故障樣本不均衡問題。