賓世楊,張 振,唐俊杰,唐惜春
(國家電投集團廣西興安風電有限公司,廣西 桂林 541300)
隨著全球現代化工業的飛速發展,能源作為人類社會發展的重要基礎得到高度關注。但隨之產生了各種問題,如生態環境受到破壞以及氣候問題等,開發無污染的可再生資源迫在眉睫。因此,相繼出現一批可以替換傳統能源的新能源技術,如風能以及太陽能等。
隨著風力發電規模的不斷增加,帶來了運行維護任務繁重以及故障檢修成本偏高等問題,尤其是受到地理位置的制約,風電場大部分建立在高原或沿海等地區,運行環境十分惡劣,易受到極端天氣的干擾,為風電機組的維修帶來困難。隨著運行時間的不斷增加,風電機組機械傳動系統會出現不同類型的故障,造成機組無法正常運行。因此,準確診斷風電機組機械傳動系統故障具有十分重要的研究意義[1-2]。國內相關專家針對上述內容展開了大量研究,如滕偉等[3]采用Wasserstein距離準確度量預測數據和真實數據兩者之間的代價函數,分別對數據展開預處理以及篩選等相關操作,進而實現異常狀態識別,最終達到故障診斷的目的;史光宇等[4]對振動信號灰度圖展開短時傅里葉變換以及連續小波變換處理,采用卷積神經網絡完成故障診斷;孫鶴旭等[5]采用改進的模糊C-均值算法確定最佳類數,將其應用于風電機組故障診斷中。在以上幾種方法的基礎上,結合機器學習,本文提出一種全新的風電機組機械傳動系統故障診斷方法。經實驗測試結果表明,本文方法可以全面減少故障診斷時間,獲取高精度的故障檢測結果。
為了將風電機組機械傳動系統中的噪聲提出,通過經驗模態分解(empirical mode decomposition,EMD)方法分解獲取不同頻率的固有模態函數(intrinsic mode function,IMF)分量[6-7],并且在全部IMF分量中選擇可以表示故障特征頻率的IMF,同時重構故障信號,達到信號去噪的目的。
通過EMD分解信號可以獲取IMF分量和殘余信號,通過分解獲取的IMF分量可以準確描述數據的局部特征,而殘余信號主要用來描述不同信號變化量變化規律。分別對不同的IMF展開分析,通過分析結果得到各種類型數據對應的特征信息。其中,全部IMF分量必須要滿足以下約束條件,分別為:
a.如果時間序列是完整的,需要保證全部信號的極值點以及零點數量完全一致。
b.通過極大和極小值點可以確定包絡線的取值全部為0。
其中,EMD分解的詳細操作步驟如下所述。
a.確定原始信號中全部極大、極小值點以及包絡線,獲取上、下包絡線的平均值曲線nl(t),即
(1)
式中:vl(t)和sl(t)分別為上包絡線和下包絡線。
求解原始信號和包絡均值兩者之間的差值ln(t),即
ln(t)=Tl(t)-nl(t)
(2)
式中:Tl(t)為原始信號。
如果通過式(2)獲取的計算結果沒有達到上述2個約束條件,則需要將ln(t)作為原始信號,經過反復操作,得到滿足需要的信號lnn(t),即
lnn(t)=ln(t)-nll(t)
(3)
式中:nll(t)為包絡均值。
經過k次篩選之后需要將nll(t)轉換為第1個IMF分量,將其稱為第一階IMF,將其表示為
dl(t)=lnn(t)
(4)
式中:dl(t)為第一階IMF分量。
b.刪除原始信號中存在的全部dl(t),獲取第一階剩余的信號。
經過分析可知,在第一階信號中仍然包含周期更長的分量,因此需要對剩余信號rl(t)展開相同操作,進而獲取不同階次的剩余信號,對應的表達式為
(5)
當rl(t)逐漸轉換為一個單調函數,則說明篩選結束,進而可以獲取
(6)
通過輸入信號可以獲取信號對應的自相關函數,即
(7)
Ny(t)為信號對應的自相關函數;τ為短時噪聲干擾;T1(t)、T2(t)和Tn(t)為矩陣的不同元素。
由于短時噪聲干擾、信號以及白噪聲之間不存在任何關聯,并且信號對應的自相關函數占據十分重要的比例,因此,需要對輸入信號展開自相關分析處理,對應的計算式為
(8)
式中:U(t)為輸入信號的自相關處理結果。
在上述分析的基礎上,獲取風電機組機械傳動系統去噪流程如圖1所示[8-9],具體如下所述。

圖1 風電機組機械傳動系統去噪流程
a.對采集到的風電機組機械傳動系統原始振動信號實行EMD分解處理,獲取IMF分量。
b.通過對比分析,獲取可以準確描述風電機組機械傳動系統故障特征的IMF分量,同時提取對應的故障信號。
c.對原始信號展開無偏的自相關分析,有效消除噪聲,降低短時噪聲干擾產生的影響。
d.重構信號,最終達到風電機組機械傳動系統信號去噪的目的[10-11]。
自編碼神經網絡在機器學習中占據重要地位[12-13],被廣泛應用于特征提取中。自編碼神經網絡是一種結構對稱的神經網絡,因此網絡的輸入和輸出節點是完全相同的。
其中,自編碼神經網絡的編碼和解碼可以表示為:
a.編碼階段。
k=(ω1x+b1)
(9)
式中:k為在隱藏層提取到的特征;ω1為編碼階段的權值;b1為編碼階段的閾值;x為網絡的輸入數據。
b.解碼階段。
y=g(ω2x+b2)
(10)
式中:y為網絡的輸出數據;g為激活函數;ω2為解碼階段的權值;b2為解碼階段的閾值。
通常情況下,自編碼的訓練過程是通過優化算法計算最小化輸入和輸出數據差值,將其作為自編碼損失函數,對應的計算式為
(11)
式中:J(w,b)為自編碼損失函數;L(x,y)為輸入層中神經元數量。
在機器學習中[14-15],希望可以采用比較簡單的模型獲取更加簡單的學習特征。但在訓練過程中,由于設定的損失函數取值十分小,因此在測試過程中得到的結果無法達到預期目標。為了有效避免上述情況的產生,不僅需要比較小的訓練誤差,同時還需要保證模型足夠簡單,模型的簡化可以利用懲罰函數實現。分析編碼過程,獲取給定輸入矩陣,即
(12)
式中:Xm×n為輸入矩陣;xm×n為輸入子矩陣。
在經過編碼處理之后,輸出的特征為低維特征向量,將提取到的低維特征向量展開解碼處理,獲取輸出向量。
將以上所述的特征提取方法應用于風電機組機械傳動系統故障診斷中,完成特征提取之后需要對提取的數據展開分類處理,獲取故障類型。其中,采用粒子群優化算法對最小二乘支持向量機參數優化處理,詳細的操作步驟如下所述:
a.隨機形成多個粒子,將其組合構建一個全新的粒子群,對種群中的全部參數初始化處理。
b.根據相關公式更新不同粒子的速度以及位置。
c.通過計算得到不同粒子的具體位置鄰域范圍,并且分別計算各粒子的適應度取值,其中最佳適應度取值即為粒子的實際坐標位置。
d.重復步驟a~步驟c,直至滿足設定的條件則停止操作。
e.通過優化得到的參數構建基于最小二乘支持向量機的分類器。
通過上述分析,利用自編碼神經網絡以及構建完成的分類器共同實現風電機組機械傳動系統故障診斷,詳細的操作流程如圖2所示,具體描述如下:

圖2 基于機器學習的風電機組機械傳動系統故障診斷流程
a.選擇故障特征數據,對全部故障數據歸一化處理,同時還需要降噪處理。
b.在故障數據完成預處理之后,由于數據規模龐大,需要全面提升數據訓練速度,同時對其展開降采樣處理。
c.組建基于機器學習的Lasso自編碼神經網絡,采用已經構建完成的模型提取風電機組機械傳動系統故障特征。
d.將提取到的風電機組機械傳動系統故障特征數據劃分為測試集和數據集,進而制定對應的標簽。
e.通過改進的PSO算法對最小二乘支持向量機中的全部參數展開優化處理,以此為依據建立分類器。
f.將提取到的特征輸入到分類器中分類處理,最終實現風電機組機械傳動系統故障診斷。
為驗證本文方法的有效性,以文獻[3]方法和文獻[4]方法作為對比方法,展開具體的實驗測試和分析。風電機組機械傳動實驗平臺如圖3所示,同時設定采樣頻率為24 kHz。風電機組機械傳動系統的實驗參數如表1所示。

表1 風電機組機械傳動系統實驗參數

圖3 風電機組機械傳動實驗平臺
風電機組機械傳動系統在不同故障狀態下的時域波形如圖4所示。

圖4 風電機組機械傳動系統故障信號的時域波形
分析圖4可知,由于產生故障的原因和類型存在差異,因此獲取的故障信號時域波形也存在比較明顯的差異。尤其在沖擊成分存在的狀態下,信號大小總幅值也存在十分明顯的差異。
測試數據集分為3組,分別為:001、002和003,搜集不同故障的相關數據,4種故障每種故障搜集81條,將4種故障每27條合成1組,001包含4種故障數據,每種故障數據27條,合計108條;002、003均為108條。在設定測試數據集的情況下,分別對各方法的故障診斷性能進行測試分析,實驗結果如圖5所示。

圖5 不同數據集下各方法的故障診斷結果準確率對比分析
由圖5可知,在不同測試數據集下,各故障診斷方法獲取的故障診斷結果準確率也存在比較明顯的差異。其中,本文方法的故障診斷結果準確率一直在90%以上,而文獻[3]方法和文獻[4]方法均低于本文方法。由此可見,本文方法可以更加準確診斷風電機組機械傳動系統故障。
進一步測試不同數據集下各方法的風電機組機械傳動系統診斷時間變化結果,詳細的實驗測試結果如圖6所示。

圖6 不同方法的風電機組機械傳動系統故障診斷時間對比分析
由圖6可知,由于測試數據集不同,各方法的風電機組機械傳動系統故障診斷時間也存在比較大的差異。但是,本文方法所用的時間明顯更短,說明本文方法可以更快地完成故障診斷。
針對故障診斷方法存在的不足,本文提出一種基于機器學習的風電機組機械傳動系統故障診斷方法。經實驗測試結果表明,本文方法可以更快更準確地完成風電機組機械傳動系統故障診斷。