沈 濤,李舜酩,辛 玉
(南京航空航天大學 能源與動力學院,南京 210016)
隨著當代旋轉機械設備的高速,重載以及自動化程度要求不斷提高,當設備發生故障時,極易造成極大的經濟損失,甚至導致重大事故的發生,因此對故障診斷方法的速度,效率和精確性等都有著越來越高的要求。
目前的故障診斷技術是利用檢測到的信息特征來判斷系統的工作狀態。一般將故障診斷方法分為以下幾種:基于模型的方法、基于信號的方法、基于知識的方法和組合式的方法[1]。其中傳統的信號處理和模型識別的方法,依托于專家經驗的診斷方法,難以檢測出結構復雜的旋轉機械故障?;谀P偷姆椒ㄔ诠收显\斷方面有了一定的改進和成果,在一定程度上彌補了人工數據統計的不足,但由于旋轉機械的特征提取困難,數學模型復雜,在故障診斷中仍有一定的局限性,已經不能適應智能制造的趨勢。
鑒于深度學習技術強大的數據表示學習和分析能力,基于深度學習的故障診斷方法引起了各行各業的廣泛關注[2]。通過多層非線性網絡訓練,可以學習樣本的潛在特征,提高分類或預測能力。因此深度學習被認為是機械設備大數據處理和故障診斷的有力工具,不僅為旋轉機械的故障診斷提供了一條新的方法與思路,而且提高了設備的安全性和可靠性,降低設備的維護成本[3]。本文將系統的介紹典型的深度學習模型,以及它們在旋轉機械故障診斷中的應用,最后做出總結與展望。
2006年Hinton等人首次在Science[4]中提出了深度學習理論,引發了不同領域的研究浪潮。近年來,不僅是國外對深度學習在旋轉機械故障診斷中應用有所建樹,國內也越來越重視機械的智能故障診斷的發展?!笆濉笨茖W和技術發展規劃也將重大工程健康狀態的檢測、監測以及診斷和處置列為重大科學問題。
現階段在面對旋轉機械的不同故障類型時,深度學習故障診斷方法不僅能夠克服了傳統振動分析的不足,還能做到自適應提取隱藏且復雜多變的故障信息,避免了人為干預所帶來的不確定性和復雜性,增強了識別過程的智能性[5]。而在應用方面的研究,診斷對象小到簡單的電動機,大到復雜的航空發動機。其本質上是對旋轉機械中的轉子系統、齒輪箱和軸承等結構的診斷來判斷工作狀況。
基于深度學習的故障診斷技術雖然極大促進了故障診斷領域的發展,但為了進一步提高旋轉機械的安全穩定運行,仍面臨著各種挑戰,需要更多更深入的研究。
深度置信網絡(DBN) 是由Hinton[6]提出的一種概率生成模型。DBN應用于非監督學習中可對待處理的信號進行降維,從而提取特征;應用于監督學習中可作為分類器。DBN由若干個受限玻爾茲曼機(RBM)和Softmax回歸層組成如圖所示。其中V代表顯層,h代表隱層,W代表權重。其基本結構如圖1所示。

圖1 DBN基本結構示意圖
深度置信網絡在旋轉機械故障診斷中的優點在于可以適用于一維振動信號數據,而且在樣本較少的情況下也能實現不錯的性能。
卷積神經網絡(CNN)是由LeCun等人[7]提出,是受動物視覺皮層細胞感受機理啟發而建立的一種前饋神經網絡[8],最早是應用于大規模的圖像分類識別中。其基本的網絡結構和旋轉機械的故障診斷相結合如圖2所示。由一個輸入層,兩組交替出現的卷積層和池化層,以及全連接層組成。

圖2 CNN基本結構示意圖
其中卷積層中每一個特征圖都對應一個卷積核,這些卷積核通過一組權重來卷積前一層的輸入并組成一組特征輸出,成為下一層的輸入[9]。經過兩組卷積層和池化層后,會接一個全連接層。全連接層后接一個隱藏層,最后由Softmax回歸層完成分類,可有效的用于故障的診斷與識別[10]。
CNN設計之初就是為了解決大規模的圖像識別分類問題,在圖像識別分類領域的應用也最為成功。由于卷積神經網絡的局部連接、權值共享以及池化操作等形成了具有很強的特征學習能力,并且具有很強的魯棒性和容錯能力,使模型對平移、扭曲、縮放具有一定程度的不變性。它還可以用于輸入一維的數據用于語音識別[11]和自然語言的處理[12]。
在最開始的研究中,許多研究人員將CNN的模型引入旋轉機械故障診斷領域中時,采用原始的CNN結構,即構造二維的訓練網絡樣本,提取的也是二維數據的特征并完成診斷。而旋轉機械振動信號是一維信號,相對應的構建一維的卷積神經網絡也成了研究的重點。
對此,文獻[13]將采用大尺寸卷積核的一維卷積神經網絡與小尺寸卷積核的一維卷積神經網絡以及經典二維卷積神經網絡模型進行對比,最終的診斷精度結果以及可視化散點圖顯示帶有大尺寸卷積核的一維卷積核神經網絡模型(1D-CNN)的效果最優。文獻[14]提出了基于一維深度卷積神經網絡的故障診斷模型,通過和傳統診斷方法對比,分析了深度卷積模型在診斷精度和診斷魯棒性的表現,證明了該模型的優勢。
循環神經網絡(RNN)是一類處理序列數據的深度學習網絡,在自然語言處理中應用較多。由Schmidhuber提出,并經過了許多研究人員的改良[15]。與其他神經網絡不同,RNN網絡在層間的神經元也建立連接,簡單來說其神經元的輸出可以在下一個時間戳直接作用到自身。
RNN相比經典的神經網絡結構多了一個循環圈,這個圈就代表著神經元的輸出在下一個時間戳還會返回,來作為輸入的一部分。RNN可以被看作是對同一神經網絡的多次賦值,第i層神經元在t時刻的輸入,除了(i-1)層神經元在該時刻的輸出外,還包括其自身在(t-1)時刻的輸出,如果我們按時間點將RNN展開,結構圖如圖3所示。

圖3 RNN基本結構示意圖
RNN適用于處理序列數據以進行預測,但卻受到短期記憶的影響。所以就有了諸如長短期記憶(LSTM)和門控循環單元(GRU)這種使用稱為門的機制來緩解短期記憶的影響。門結構可以調節流經序列鏈的信息流。LSTM和GRU正在被用于最先進的深度學習應用,如語音識別,自然語言理解和故障診斷等。
2.4.1 自編碼器
自編碼器(AE)分為兩個部分:編碼器和解碼器。它是Rumelhart[16]提出的一個典型的三層神經網絡結構,包括輸入層、隱藏層和輸出層。文獻[17]提出自編碼網絡可看作是傳統的多層感知器的變種,其基本想法是將輸入信號經過多層神經網絡后重構原始的輸入,通過非監督學習的方式分析輸入信號的潛在結構,將中間層的響應作為潛在的特征表示。
其基本結構如圖4所示。

圖4 AE基本結構示意圖
結構中輸入信號為x,在編碼層先將其線性變化為z,然后再施加非線性變換,公式表達這一過程為式(1):
a=f(z)=f(wx+b)
(1)

(2)
自動編碼機可以通過級聯和逐層訓練的方式組成深層的結構,其中只需要將前一層中隱含層的輸出作為當前層的輸入。
在自編碼器的框架下,很多研究者通過引入正則約束的方式開發了很多變種模型。棧式自編碼正是一種由多層自編碼構成的神經網絡模型。文獻[18]就提出了一種基于棧式降噪自編碼網絡的故障診斷方法,采取逐層貪婪編碼的方式進行預訓練,實現高維深層故障特征的自適應提取和挖掘,再使用反向傳播算法對模型進行監督式微調。
2.4.2 降噪自編碼器
降噪自編碼器(DAE)是由Vincent等人[19]從魯棒性著手提出的。在日常的研究中發現對于部分被遮擋或損壞的圖像,仍然可以進行準確的識別。DAE正是受此啟發所提出的。因此,降噪自編碼器的主要研究目標是:隱層表達對被局部損壞的輸入信號的魯棒性。
通過對原始輸入信號人為的加入一些純高斯噪聲,也或者是隨機丟棄輸入層的某個特征使干凈信號發生局部損壞,再將這個損壞的信號通過傳統的自編碼得到輸出。其中干凈輸入信號x,加噪后的損壞輸入信號。降噪自編碼器的基本結構如圖5所示。

圖5 DAE基本結構示意圖
近些年,通過Vincent等人進一步努力,由深度信念網絡得到啟發,將降噪自編碼器得結構進行堆疊,提出了一種堆疊式降噪自編碼網絡(SDAE),并應用于圖像分類領域[20]。
2.4.3 稀疏自編碼器
一些研究者將稀疏表示的思想引入自編碼,提出了稀疏編碼器(SAE)[21-22]。自編碼器最初提出是基于降維的思想,但是當隱層節點比輸入節點多時,自編碼器就會失去自動學習樣本特征的能力,此時就需要對隱層節點進行一定的約束。因此在自編碼的基礎上對每層神經元做了正則化,在自編碼器隱層添加稀疏性約束函數,來增強自編碼機輸出的稀疏性,使得模型神經元數量較大時仍可以得到較好的隱層特征。
稀疏表達包含了輸入信號大部分主要特征,在保證模型重建精度的基礎上,極大地降低了數據的維度,使模型的性能得到了很大的提升。An也正是采用一種無監督的稀疏濾波學習方法[23]。即使在轉速波動情況下,該模型對旋轉機械故障診斷具有較強的魯棒性。后來An研究了權值矩陣的多重相關性[24],提出了一種更適合信號特征提取的方法,進一步提高了診斷的準確性。
隨著深度學習的進一步發展,鑒于以往的生成模型不能很好地泛化生成結果,研究者們提出了一系列新的生成模型。Goodfellow等人在2014年從“零和博弈”中受到啟發,并提出了生成式對抗網絡(GAN)[25]。


圖6 GAN基本結構示意圖
GAN中的生成器與判別器可被視作對抗博弈中的雙方。生成器的目標是生成需要的數據,但是需要注意的是這里的數據只是仿真數據。判別器再來判別生成數據的真實性,最終模型的目標則是得到一個判別器都不能判別的需要數據。這種突出的生成能力不僅可以生成各種不同類型的數據,還對各種半監督學習和無監督學習的發展起到了推動作用。
GAN模型的實質就是尋找零和博弈的一個納什均衡解,即對抗雙方的損失函數都依賴于對方的參數,卻又沒有影響到對方參數的能力,目的是為了提高判斷的準確性。
2.5.1 堆積生成對抗網絡
堆積生成對抗網絡(StackGAN)在結構上是串聯多個GAN模型來實現的,這一點和棧式自編碼的方法相似。


圖7 StackGAN基本結構示意圖
2.5.2 深度卷積對抗網絡
深度卷積對抗網絡(DCGAN)是GAN發展早期比較典型的一類改進。它是卷積神經網絡(CNN)和對抗網絡結合起來,將CNN的思想融入對抗模型中;將生成器中的全連接層用反卷積層代替,如圖8所示。

圖8 DCGAN的基本結構示意圖
在圖像生成的任務中已取得了很好的效果[26],使用GAN進行圖像生成任務時,默認的網絡結構一般都與DCGAN類似的設置。
2.5.3 條件生成對抗網絡
條件生成式對抗網絡(CGAN)是一種帶有條件約束的GAN,在GAN的網絡結構中引入條件變量c,使用變量c對模型中的生成器G和判別器D增加條件,以引導數據的生成。
生成器接收隱變量z與條件變量c,生成出的樣本G(z|c)與在條件變量c控制下的真實樣本x聯系在一起,用于判別器的訓練,具體結構如圖9所示。

圖9 CGAN的基本結構示意圖
CGAN的目標函數為:
minGmaxDV(D,G)=Ex[logD(x│c)]+Ez[log(1-D(G(z|c)))]
(3)
ACGAN是在CGAN的基礎上改進。它在判別器D的真實數據x也加入了類別c的信息,進一步告訴G網絡該類的樣本結構如何,從而生成更好的類別模擬。
旋轉機械的故障診斷是近些年來國內外研究比較廣泛的領域,是發展比較成熟的故障診斷技術,具有一定的代表性,因此旋轉機械是故障診斷的重點研究對象。本文又以旋轉機械中最基本的轉子系統、齒輪箱和軸承為對象討論基于深度學習的故障診斷方法。
滾動軸承是各種旋轉機械的支承元件,不僅使用范圍十分廣泛,而且品種繁多、要求嚴格。它的質量和性能也十分重要,是旋轉機械不可或缺的部件,其故障診斷顯得尤為重要。近期存在的幾個突出問題的研究。
1)針對如何提高滾動軸承故障診斷的準確率和算法訓練的效率問題:
對此問題有關研究提出了一種深度信念網絡(DBN)與粒子群優化支持向量機(PSO-SVM)的滾動軸承故障診斷方法[27]。該方法不僅提高了診斷準確率,而且大大縮短了訓練時間。還有在不均衡數據集下基于深度對抗網絡的故障診斷方法[28],此方法不僅建立適合軸承故障診斷的深度卷積神經網絡模型,還引入Focal損失函數增強診斷的準確性。
2)針對滾動軸承故障樣本較少的問題:
為了保持故障診斷的準確性,同時減少標簽樣本數量,研究表明動態調節學習率的SAE可以一定程度上解決該問題[29]。但在上述的傳統的監督方法中,模型訓練還是需要大量的人工標注樣本,對此有關研究提出一種基于聚類和疊層自動編碼器的滾動軸承故障診斷新方法[30],此方法不僅取消了人工標定樣本的初始步驟,也是做到了更加智能。文獻[31]則是充分利用了GAN生成模型和半監督學習的能力,將其應用于滾動軸承的故障診斷,解決了樣本數據不足和標記的問題。
3)針對滾動軸承復雜時變工況下的故障診斷問題:
為解決此類問題有關研究將變分模式分解(VMD)、希爾伯特變換(HT)和深信網絡(DBN)結合起來用于滾動軸承的故障診斷[32],取得了一定的成效。文獻[33]則利用內斯特羅夫動量(NM)對深度信念網絡(DBN)進行優化,它能穩定有效地改善模型訓練過程中的收斂性,提高DBN的泛化能力。在軸承故障類型和程度診斷方面表現出了更令人滿意的性能。
4)針對滾動軸承中復合故障的識別:
有相關的研究表明基于雙樹復小波包(DTCWPT)的自適應深信網絡(DBN)方法[34]和一種基于深層小波卷積自編碼器(DWCAE)和長短時記憶網絡(LSTM)的軸承故障診斷方法[35],能夠提取復合故障中的特征信號,并做到不同故障類型的有效識別。
5)針對大型機械中滾動軸承振動信號非線性、低信噪比和高維度的問題:
針對此問題有關研究提出將卷積降噪自編碼器和深度卷積網絡(CNN)相結合的滾動軸承故障診斷方法[36]和一種基于改進堆疊降噪自編碼器的故障診斷方法[37]。兩種方法的實驗結果都表明在故障診斷過程中,遇到振動信號非線性、低信噪比和高維度的問題時,診斷的準確度較高、時間復雜度較低。
機械設備中大部分部件都是旋轉機械,尤其是齒輪箱屬于易磨損部件,其運行狀態不僅影響該機器設備本身的安全穩定運行,故障嚴重時不僅會造成重大的經濟損失,甚至是人員傷亡,因此這要求機械的故障診斷方法更加智能高效。
近期存在的幾個突出問題的研究:
1)針對齒輪振動信號的非線性、非平穩性且數據量大等問題
有關基于ELMD能量熵與PSO-SAE的齒輪故障診斷方法[38]的研究表明能夠解決此類問題,并且考慮到了齒輪發生不同的故障,進而導致不同頻帶內的信號能量值發生改變。文獻[39]構建了1-DCNN齒輪箱診斷模型,具有很高的泛化能力,可通過增加CNN層組數量來達到較高的準確率。此外,還可以直接將時域或者頻域作為低層輸入信息構建深度學習故障診斷模型[40],可以有效地削弱人為因素的干擾,不僅能夠在保證診斷效果,還能降低計算復雜度和所需要的存儲空間。
2)針對在齒輪故障診斷時,單傳感器可靠性和容錯性不佳的問題:
齒輪箱有著的復雜結構以及故障時獲取信號的困難,單個傳感器并不能有效地獲取有效的故障振動特征,研究表明一種基于多個傳感器信息融合及堆棧降噪自編碼(SDAE)的齒輪故障診斷方法[41]在噪聲環境下準確率衰減較小,并且抗干擾能力較強。此方法在單個傳感器失效的情況下,診斷準確率還能高于正常狀態下單一信號SDAE診斷方法。
3)針對齒輪故障診斷模型建立中的樣本不均衡問題:
針對樣本不均衡的問題,文獻[42]研究了一種基于生成式對抗網絡(GAN)的故障診斷方法,并將其應用于行星齒輪箱。通過實驗表明在診斷樣本信息不足的情況下,GAN診斷模型仍可以達到診斷精度。
轉子系統種類繁多,具體到設備如電動機、發電機、壓縮機和發動機等。它們廣泛應用于電力、石化、航空和航天等重要行業。
轉子系統故障的常見形式:轉子不對中,轉子不平衡,動靜摩擦等,其中轉子不對中時引起絕大多數故障的原因。不對中故障會導致轉子系統在運轉過程中將產生一系列有害于機械的連鎖動態反應,如引起聯軸器偏轉、軸的彎曲變形和油膜失穩等。
近期對幾個典型轉子系統的故障診斷研究。
1)針對不同電機故障診斷方法的研究:
針對永磁同步中電機匝間短路和永磁體失磁故障時,存在數據處理復雜、特征獨立單一和樣本不足等因素引起的診斷偏差問題,文獻[43]提出一種基于深度學習變分自編碼網絡(VAE)及稀疏自編碼網絡(SAE)的故障診斷方法。實現構建豐富、多樣、更具魯棒性的訓練集合,更加高效的對電機匝間短路及失磁故障的診斷。
針對電機中的滾動軸承缺陷,有關研究提出的解決方法:采用創新的離散小波變換(DWT)進行特征提取,再采用正交模糊鄰域判別分析(OFNDA)進行特征約簡,最后通過動態循環神經網絡(RNN)預測元件的狀態,并在不同的運行條件下對故障進行分類[44]。文獻[45]則是構建了一個疊層自動編碼網絡,通過引入稀疏約束對輸入數據進行壓縮和約簡的方式,使網絡能夠準確提取輸入數據的故障特征,并通過引入隨機噪聲提高網絡的故障識別能力。此外,為了提高特征標簽的魯棒性,相關研究表明在SAE的輸入端加入腐敗因子,然后利用從SAE中學習到的特征訓練神經網絡分類器,最終能夠有效識別異步電動機的故障[46]。
2)針對發電機故障診斷方法的研究:
為實現風電機組發電機部件的故障診斷,文獻[47]通過分析風機監控與采集(SCADA)數據,設計了基于深度自編碼(DAE)網絡和XGBoost的故障診斷算法。故障檢測算法需要對不同風電機組設置不同參數,通過DAE獲取SCADA數據的重構值來預測故障和提取故障樣本。然后通過XGBoost模型來識別并分類故障。
3)針對發動機故障診斷方法的研究:
發動機氣路系統的故障診斷研究方面,文獻[48]在結合深度置信網絡(DBN)、采樣與集成技術的基礎上,提出了基于不均衡樣本驅動的發動機故障診斷模型。也有相關研究提出了一種基于主元分析與深度置信網絡相結合的發動機氣路系統故障診斷新方法[49]。
針對發動機故障中參數非線性強且易受噪聲影響的問題,文獻[50]提出一種改進降噪自編碼的發動機氣路診斷方法。該方法在降噪自編碼器(DAE)基礎上,采用改進螢火蟲算法(FA)優化的徑向基(RBF)神經網絡,并引入慣性權重與自適應光強因子的改進FA來優化RBF網絡從而得到螢火蟲徑向基(FRBF)網絡。通過實驗證明,此方法診斷精度高且算法性能穩定、魯棒性優。
在復雜的旋轉機械故障診斷中,傳統的故障診斷方法,往往不能滿足對高階、非線性、自適應特征提取的要求;而基于深度學習的故障診斷方法,得益于它的特征學習優勢和強大的聚類分析能力,所建立的智能故障診斷模型更加自動化和高效。不同的深度學習模型具有不同的優缺點,如表1所示。
由表1可以得知,不同種的深度學習神經網絡都有各自不完善的地方。而在對典型深度學習模型的改進上,研究者們有著各種各樣的方法。其本質就是充分發揮各神經網絡的優點,并且通過各種方法彌補或者避免不足之處。
Xu就卷積神經網絡存在的一些弊端提出了一種新的寬感受野自適應快速卷積神經網絡模型[51]。該模型在環境噪聲和工作負載變化時具有較高的診斷精度和魯棒性。文獻[52]提出一種新型DSCNN-GRU網絡,該模型降低了一維卷積結構參數,并加入門控機制以便更好地捕捉故障特征。針對堆疊式循環神經網絡梯度消失的問題,文獻[53]提出了一種改進的深度循環神經網絡(DRNN)方法,即通過門控循環單元解決該問題來提高診斷的準確率。也有相關研究就上述問題提出基于改進堆疊式循環神經網絡的軸承故障診斷模型[54]。Wang考慮到堆疊式自動編碼器(SAE)的缺點,引入了深度神經網絡(DNN)[55],可以減少訓練時間、快速提取故障特征。Xu提出了一種可再生融合故障診斷網絡(RFFDN)的深度學習模型[56],該模還能在非平衡采樣條件下提取出變速度下的域不變特征,并能準確地對新的故障進行分類。這些融合方法的目的都是為了在故障診斷中達到更好的效果。
再比如上文所說自編碼器(AE)和生成式對抗網絡(GAN)及其變體還在不停的改進中。為獲取隱層準確的稀疏度,縮減訓練時間,研究者們在稀疏自編碼器的基礎上提出k-稀疏自編碼器,此方法丟棄非線性激活函數,利用排序算法或ReLU函數選取k個最大激活值。Qian考慮到稀疏濾波(SF)實現的稀疏性是不規則的,對此提出了一種簡單,快速的監督特征提取算法,稱為監督正則稀疏濾波 (SRSF)[57]。此算法是將一種新的參數化稀疏標簽矩陣(PSLM)融合到特征矩陣中,對稀疏性進行規則化,從而實現監督特征提取。
深度學習本身有著非常迅速的發展,各種算法思想相互融合,揚長補短。未來深度學習在旋轉機械的故障診斷中的應用會越來越高效準確。
1)在信號獲取方面,向多種信息融合的趨勢發展,在故障特征提取方面也趨于多種特征提取技術融合診斷方向的研究。
2)在故障診斷模型方面,由于各方面因素的干擾,實測信號中往往包含各種噪聲干擾,從信噪比低的信號中提取需要的特征對于高效的故障診斷至關重要。然而,過度去噪或去噪不足會使原始的信號失真,降低故障診斷效率甚至準確度。因此,對于深度學習故障診斷模型的魯棒性未來將展開進一步的研究。
3)單一的深度學習模型通過增加深度來提高模型效果的方法會出現梯度消失問題、計算過于復雜、準確率不高等問題,不能進一步使得診斷更精確可靠且高效。因此融合多種模型和算法,彼此揚長補短會帶來更好的診斷效果,成為深度學習在故障診斷領域研究的重點。
旋轉機械的傳統診斷方法在速度,效率和精確性等方面都有一定的欠缺。深度學習模型可以學習樣本中的潛在特征,提供更好的表示和分類能力。因此,本文首先介紹了深度學習的幾種典型神經網絡模型,然后在此基礎上對其在旋轉機械故障診斷上的應用進行具體對比分析。最后就目前該領域的發展情況進行總結,歸納出現存的一些問題和不足,并進行合理的展望。