陳里里 ,司吉兵 ,董紹江
(1.重慶交通大學機電與車輛工程學院,重慶 400074;2.重慶交通大學城市軌道車輛系統集成與控制重點實驗室,重慶 400074)
風力機錐齒輪作為風力發電機的重要部件,其工作環境惡劣,故障率較高,在運行過程中容易出現故障,一旦發生故障,將會影響整個風力發電機系統的運行狀態以及性能,因而風力機錐齒輪的故障診斷對于風力機的安全運行非常關鍵[1]?;谡駝有盘柕凝X輪故障診斷中,提取特征以及診斷模型的建立是齒輪故障診斷的兩個主要問題。在振動特征的提取中,時域分析以及樣本熵作為常用的分析方法在很多領域都有著較為廣泛的應用[2-5]。在診斷模型的建立中,當前很多診斷模型都局限于淺層結構學習,例如臨近節點算法(KNN)[6]、支持向量機(SVM)[7-8]、極限學習機(ELM)[9]以及神經網絡等[10]。其局限性主要體現在很難能夠獲得目標數據深層本質特征以及泛化能力不足等,假如模型的輸入特征缺乏足夠的表示,將會對結果產生很大的影響。深度學習由文獻[11]在2006 年提出,能夠有效的解決這一問題。深度學習本質為構建含有多層非線性隱藏層的神經網絡,對特征信息進行逐層提取獲取目標數據深層本質信息。稀疏自編碼器(SAE)作為深度學習中的變形結構,擁有很好的學習數據集特征的能力,通過多個稀疏自編碼器堆疊形成SSAE,SSAE 能夠進一步的學習目標數據集中的特征,并降低特征維數。當前深度學習已經在很多領域取得了大量成功的應用,例如語音識別、文本語義分類以及圖像分類等,但是在齒輪故障信號的識別領域中應用非常少。因而提出了深度學習中的SSAE 模型對風力機錐齒輪數據集進行試驗,并對結果進行分析,得出結論。
所使用的風力機錐齒輪數據來自于聲學與振動數據庫,振動數據為使用加速度傳感器在功率為3MW 的風力機錐齒輪上進行測量獲得,采樣率為97656Hz,振動數據共包含24 個振動記錄,每個記錄長度約為6s,其中共有11 個故障振動記錄,13 個正常振動記錄。
在故障產生時,齒輪故障位置的剛度將會改變,從而產生振動和沖擊,進而導致振動信號的產生。常見的統計特征能夠很好的表征在故障產生時的振動信號變化。為了能夠表征時域信息,本研究中應用了7 種時域特征分別為均值、方根幅值、均方根值、最大值、標準差、裕度因子以及波形因子,這些特征使用的統計學計算方法,如表1 所示。

表1 時域特征Tab.1 Time Domain Characteristics
樣本熵是由Richman 等人提出的一種時間序列復雜性測度方法,樣本熵作為近似熵的修正,能夠克服近似熵的計算偏差,計算速度更快以及精度更高,適合做機械振動信號的分析。其具體算法如下:
(1)把N個數據構成的時間序列依照序號構建成一個維數為m的向量。
(2)定義Xm(i)與Xm(j)之間的距離d[Xm(i),Xm(j)],其是兩個對應元素最大差值的絕對值,計算公式如下:

(3)對于已經設置的閾值r,對每一個i值,記錄d[Xm(i),Xm(j)]小于r和距離總數N-m的比值,記為計算公式如下:

(5)增大維數至m+1,求取Q值,即為計算 Xm+1(i)和 Xm+1(j)≤r的個數,記作Ai。定義:
(6)樣本熵定義如下:

能夠發現,樣本熵的大小和嵌入維數m以及閾值r的數值選取有直接關系。因而m以及r的參數數值對于樣本熵的計算有重要影響。因而在計算樣本熵時需要首先確定m以及r的數值。
2.4.1 自編碼器
自編碼是一個由輸入層、隱含層以及輸出層三層神經網絡構成的對稱結構,如圖1 所示。

圖1 自編碼器結構Fig.1 Autoencoder Structure
自編碼器作為無監督特征學習算法,由編碼器以及解碼器構成,其目標函數是輸入。輸入向量x經過非線性激活函數f(z)映射到隱含層函數h(x)中,此過程稱之為編碼,可以使用式(6)進行表示:

式中:W—連接層和隱含層的權重矩陣;b1—偏置單元。
θe={W,b1}是編碼器的參數集,在自編碼器中,激活函數一般是sigmoid 或者tanh。
隱含層的特征描述經過非線性激活函數g(z)映射成輸入空間的重構向量此過程稱之為重構,可以使用式(7)進行表示:

式中:b2—偏置單元;WT—隱含層和輸出層的權重矩陣。
θd={WT,b2}是編碼器的參數集,激活函數的選擇依照實際情況可以選擇為sigmoid、tanh 或者是線性函數。
x和間的重構誤差使用式(8)進行計算,通過反向誤差船舶算法調節參數集讓誤差實現最小。在重構誤差最小時,就表明隱含單元保存了輸入中的絕大部分信息。

式中:m—訓練樣本個數;λ—代表權重衰減系數;s1—第一層的神經元數量。
2.4.2 稀疏自編碼器
只是為了讓無限的逼近x并沒有太多意義,為了能夠從輸入的數據中學習更多有用的特征,要避免自編碼器出現學習成一個恒等函數。在自編碼器隱含層神經元數量低于輸入層神經元數量時,即是欠完備自編碼器時,學習欠完備的表示能夠讓自編碼器學習到訓練特征的顯著壓縮特征。但是在h(x)和x的維度一致或者是比x大時,需要給總體代價函數增加稀疏性懲罰項,構建成稀疏自編碼器來發現數據結構特點,避免x?與x完全相等。稀疏性限制能夠讓隱含層神經元的激活度控制在一個比較小的范圍之內。增加稀疏懲罰項的總體代價函數能夠表示為如下:

式中:s2—隱含層神經元的數量;ρj—隱含神經元的平均激活度;ρ—稀疏性參數—隱含神經元j的激活度。
2.4.3 堆棧稀疏自編碼器
SSAE 由N個稀疏自編碼器堆棧而成,最后一層稀疏自編碼器的輸出之后和softmax 分類器連接,用來實現故障分類識別功能。在SSAE 訓練完成后,將N層稀疏自編碼器和softmax 分類器作為整體,用帶有標簽的樣本數據,通過隨機梯度下降法來進行監督并調節模型參數,調節過程,如式(12)、式(13)所示。

對本研究中的24 個振動記錄進行截斷處理,11 個已知故障振動記錄截斷為6281 個樣本,13 個正常振動記錄被截斷為7423個樣本,每個樣本長度為1024。在所有樣本收集完成之后,使用時域分析以及樣本熵方法進行提取特征。在本研究中共計算7 個時域特征以及1 個樣本熵特征,分別為均值、方根幅值、均方根值、最大值、標準差、裕度因子以及波形因子;在樣本熵計算中,嵌入維數m以及閾值r分別選取為2 以及0.2Std(Std 為原始數據的標準差)。
在風力機錐齒輪振動特征提取完成后,構建的SSAE 用來進行風力渦輪機故障診斷試驗。首先,故障樣本標簽設置為0,正常樣本標簽設置為1,在SSAE 構建以及訓練集訓練后,進行測試集預測,SSAE 的相關參數,如表2 所示。

表2 堆棧稀疏自編碼器相關參數Tab.2 Stacked Sparse Autoencoder Related Parameters
共有2779 個故障樣本以及2191 個正常樣本被正確預測,如圖2 所示。1 個正常樣本被錯誤預測為故障樣本,2 個故障樣本被錯誤預測為正常樣本??傮w來說,基于SSAE 的預測準確率為99.9%。

圖2 基于堆棧稀疏自編碼器的預測結果Fig.2 Prediction Result Based on SSAE
在本節中,兩種分類器(SVM、ELM)被用來和SSAE 進行對比分析。SVM 以及ELM 使用和堆棧自編碼器相同的訓練集進行訓練,使用相同的測試集進行預測,預測結果,如圖3、圖4 所示。

圖3 基于支持向量機的預測結果Fig.3 Prediction Result Based on SVM

圖4 基于極限學習機的預測結果Fig.4 Prediction Result Based on ELM
共有2749 個故障樣本以及2117 個正常樣本被成功預測,如圖3 所示。有75 個正常樣本被錯位預測為故障樣本,32 個故障樣本被錯誤分類為正常樣本??傮w來說,基于堆SVM 的預測準確率為97.8%。有2627 個故障樣本以及2056 個正常樣本被正確預測,如圖4 所示。有136 個正常樣本被錯誤預測為故障樣本,154 個故障樣本被錯誤預測為正常樣本??倎韥碚f,基于ELM 的預測準確率為94.2%。因此通過圖2、圖3 以及圖4 對比分析可以得到,SSAE 在分類性能上式要顯著優于SVM 以及ELM 的。
為了能夠進一步確定SSAE 的分類性能,這里引入了靈敏性(Sensitivity)、特異性(Specificity)以及準確率(Acuracy)三個指標,計算公式,如式(14)所示。除了上述三個指標外,還引入了受試者工作特征曲線(ROC 曲線)用來分類性能的可視化。ROC 曲線描述了靈敏性和1-特異性之間的關系,ROC 曲線下方圖形面積越大,分類性能越好。

式中:TP—被模型正確預測為正的正樣本;
TN—被模型正確預測為負的負樣本;
FP—被模型錯誤預測為正的正樣本;
FN—被模型錯誤預測為負的負樣本。
SSAE 的靈敏性、特異性、準確率均顯著優于SVM 以及ELM,如表3 所示。因此可以進一步說明,SSAE 模型和SVM 以及ELM 模型相比擁有更好的分類性能。

表 3 SSAE、SVM 以及ELM 分類性能對比Tab.3 SSAE、SVM and ELM Classification Performance Comparison
SSAE 模型ROC 曲線下方面積要顯著大于SVM 以及ELM模型的ROC 曲線面積,如圖5 所示。這表明SSAE 模型的分類性能優于SVM 以及ELM 模型。

圖 5 SSAE、SVM 以及 ELM ROC 曲線圖Fig.5 SSAE、SVM and ELM ROC Curve
隨著可再生能源產業的不斷發展,清潔可再生的風力發電技術得到了廣泛的關注。但是,風力發電技術在快速發展的同時,也產生了很多的問題,風力發電機故障頻發,造成了重大的經濟損失。因而進行風力發電機早期故障診斷是非常必要的,風力機錐齒輪作為風力發電機的重要部件,并且工作環境惡劣復雜,故障率較高,因而對其進行研究擁有很現實的意義。通過風力機錐齒輪故障診斷實驗結果表明,本研究中所提出的方法和對比模型對比得出,時域分析和樣本熵并結合SSAE 以及softmax 分類器方法在風力機錐齒輪故障預測準確率方面至少提高2%,在靈敏性方面至少提高1%,在特性方面至少提高2%,從上述幾個指標中可以發現,本研究所使用的方法在上述三個指標中上均有不同程度的提高,因而證實了本研究所提出方法在風力機錐齒輪故障診斷中的優越性。