張玉蘭,張宏偉,王新環
(河南理工大學 電氣學院,河南 焦作 454003)
隨著我國風力發電行業的發展,風電并網份額不斷增大,風力發電機組故障輕則影響自身安全,重則引起電網動蕩。據研究數據表明,風力發電機系統的故障中20%來源于齒輪箱,其中多數為軸承故障[1]。齒輪箱內部包含包括軸、齒輪以及軸承等零件,其中滾動軸承高速軸通常工作轉速在每分鐘千轉以上,故障隱患較大,且其故障直接影響風力發電機的電能質量,使得并網難度提升。為此,針對風力發電機齒輪箱高速軸承進行故障診斷研究。
滾動軸承振動信號具有非線性、非周期性等特征,傳統的時域、頻域分析算法對此類非線性、非周期信號的分析效果不理想,因此非線性分析算法得到大量關注。Huang 等提出了經驗模態分解(Empirical Mode Decomposition,EMD),它降低了由于人為因素造成的算法分解誤差[2]。大量學者的研究發現,由于EMD理論存在缺陷,使得所分解信號存在模態混疊現象。集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)是EMD的改進算法[3]。該算法通過在原始信號中添加一個白噪聲的方式來消除EMD 分解過程中的模態混疊現象,但是在EEND 的重構信號中卻存在著大量的噪聲殘余。Torres 等提出一種新的改進算法CEEMDAN,該算法克服了EMD模態混疊問題,降低了EEMD的重構誤差,是目前非線性信號分析中的研究熱點之一[4]。
文獻[5]中提出一種基于CEEMDAN 排列熵與支持向量機的螺旋錐齒輪故障識別方法。文獻[6]中提出一種基于CEEMDAN 聯合樣本熵、自適應閾值的降噪方法。文獻[7]中將原始振動信號通過CEEMDAN 分解,利用峭度值聯合多尺度排列熵(Multiscale Permutation Entropy,MPE)進行故障特征提取,實現故障智能識別。CEEMDAN 算法克服了模態混疊問題,在非線性信號降噪方面取得了較好的效果,但依舊存在虛假分量與噪聲殘留問題。MPE 是一種評價時間序列隨機性突變行為的有效方法,具有計算速度快、抗干擾性強的優點,適用于軸承故障信號特征向量提取,但隨尺度因子增加,MPE算法中粗粒化時間序列會變得越來越短,使得時間序列信息損失。
針對以上問題,本文提出了一種基于CEEMDAN、峭度值-相關系數準則、TSMPE、PCA 的故障敏感特征提取方法。該方法利用CEEMDAN 的自適應降噪分解優勢,結合TSMPE能有效反映多尺度時間序列突變特性的特長,實現故障信號特征提取,再經過PCA算法降維后得到故障特征向量。最后,采用IAFSA-SVM 多分類故障分類器,實現風力發電機齒輪箱高速軸承的故障診斷。
1.1.1 CEEMDAN算法原理
CEEMDAN算法利用自適應噪聲在保證數據的準確性和完整性的前提下,克服了模態混疊的問題,提高了運行效率,節省了計算成本[4]。具體描述如下:
(1)將滿足N(0,1)分布的白噪聲wi(t)添加到原始信號y(t)中,則第i次的信號可表示為

其中:t為添加高斯白噪聲的次數,其中i=1,2,…,N。對信號yi(t)進行EMD分解,只保留第1階模態分量IMFi1,其他為殘余分量r1(t)。

(2)將白噪聲添加到殘余分量r1(t)中:

對ri1(t)進行EMD分解,得到第一個IMFi2,1。

(3)重復以上分解過程m次,直至殘差余量不適合被分解時停止分解,結束運算,信號y(t)可表示為:

1.1.2 相關系數-峭度值準則信號重構
CEEMDAN算法通過添加自適應噪聲克服了模態混疊現象,但在IMF 分量中仍然存在虛假分量及殘余噪聲問題。
相關系數是反映分解后的分量信號與原信號之間相關性的特征量,包含有主要故障信息的IMF 分量應與原信號的相關性較高,而虛假分量則相關性較差[8]。另外,文獻[9]中的研究表明相關系數還體現了降噪信號與原信號的相似程度,相關系數越大,原信號所含噪聲越小。為此,可以選擇合理的相關系數參數,對虛假分量以及殘余分量進行篩選。
軸承工作狀態通常滿足正態分布,峭度值反映隨機變量分布特性的數值統計量,在正常工作狀態,峭度值約為3,當含有沖擊成分時,峭度值遠大于3,峭度值越大,沖擊信號越明顯,包含故障信號越多。為此,通過相關系數-峭度值準則對IMF信號進行重構。
TSMPE 是PE 和MPE 的優化方法[10-12]。TSMPE對數據長度的依賴性更小且魯棒性更好,它可以更有效地分析時間序列,克服PE只能在單一尺度上描述信號復雜性這一缺點,同時也解決了MPE隨尺度因子增加,粗?;瘯r間序列變得越來越短,導致時間序列信息損失的問題,具體算法如下。
(1)給定尺度因子τ,原始時間序列X={x1,x2,…,xn}可以根據式(6)進行定義:

式中:k表示時間序列的起點,β表示時間序列的區間,Δ(k,β)表示上邊界,0<k<τ,β=τ,Δ(k,β)=(N-β)/k,且k、β、Δ(k,β)都為整數。
(2)計算每個時移粗粒度時間序列的概率密度函數,其中尺度因子τ≥2。每個時移粗粒度時間序列的不同概率密度函數的平均值為:

其中:m是嵌入維數,λ是延遲時間。
支持向量機算法在解決小樣本、非線性、高維模式識別中具有許多特有優勢[13]。SVM 算法中懲罰因子C、RBF 核參數G兩個參數的大小對模型的預測效果有很大影響,選擇合適的(C,G)組合至關重要。為此,通過改進人工魚群算法對(C,G)尋優,提高故障診斷模型識別率。
人工魚群算法(AFSA)是一種基于魚群覓食的仿生智能算法[14]。傳統人工魚群算法選用固定步長,較大的步長會導致在尋優后期最優解的精度低,較小的步長會導致收斂速度較慢。因此,引入了調整函數來優化人工魚的步長參數[15]。人工魚步長參數如下。

式中:δ為調整函數,Step 為人工魚初始步長,t為迭代次數,s為正整數,且本文中s=6。改進人工魚群優化SVM算法步驟如下。
(1)導入故障向量。提取各狀態40 組故障數據,隨機分成兩部分,每部分為20組,其中一部分為模型訓練數據,另一部分為測試數據。
(2)初始化參數。確定SVM 參數組合(C、G)的范圍,并設置人工魚群參數,包括種群數量N、最大迭代次數Trynumber、視野Visual和步長Step。
(3)計算初始魚類種群的食物濃度。選用SVM返回的均方根誤差作為模型的目標函數,將其最小值選定為最佳組合,將最優值保存至公告牌。
(4)根據式(8)更新步長,每條人工魚的行為隨之更新。計算食物濃度,若當前濃度高于公告牌中的食物濃度,則進行替換,否則保持不變。
(5)判斷Trynumber 的大小,若當前迭代次數達到最大值,則將公告牌上最優參數組合(C、G)保存并輸出;否則在迭代次數中添加1,然后跳轉到第(4)步。
(6)輸出最大準確率及其對應的(C、G)值。
本文提出的基于CEEMDAN-TSMPE-PCA聯合IAFSA_SVM 的風力發電機軸承故障診斷方法流程如圖1所示。

圖1 風力發電機軸承故障診斷流程圖
具體步驟如下:
(1)信號分解。對風力發電機軸承振動信號進行CEEMDAN分解得到N個IMF分量。
(2)信號重組。分別計算各個IMF 分量的相關系數、峭度值,基于相關系數-峭度值準則篩選符合要求的IMF分量進行信號重組。
(3)特征提取。對重組信號進行TSMPE 計算,獲得維度為τ的排列熵值,對排列熵值進行PCA 降維,得到n維故障特征向量,其中τ和n均為正整數,且τ>n。
(4)故障診斷。將故障特征向量作為IAFSASVM故障分類器的輸入,實現風力發電機軸承故障診斷。
葉片捕捉風能通過轉子軸心把能量傳遞給低速軸,低速軸經提速齒輪箱將能量傳遞到高速軸,高速軸連接著齒輪箱和發電機。高速軸采用一套圓柱滾子軸承和兩套配對的圓錐滾子軸進行支承,在承受徑向負荷時還承受不大的軸向負載,其始終保持在高速狀態,轉數區間為1 269 r/min~1 802 r/min,原理如圖2所示[16]。

圖2 風力發電機高速軸軸承布置
在凱斯西儲大學軸承試驗中,其待測的軸承位于電動機的兩端,驅動端軸承型號為6205-2RS JEM SKF深溝球滾動軸承,風扇端軸承型號為SKF6203,其工作原理與風力發電機驅動鏈相似;另外,風力發電機高速軸轉數區間為1 269 r/min~1 802 r/min,凱斯西儲大學軸承數據集對應的轉數分別為1 797 r/min、1 772 r/min、1 750 r/min、1 730 r/min。凱斯西儲大學軸承試驗臺的驅動特性、轉速都與風力發電機高速軸軸承相似,為此選用凱斯西儲大學軸承數據對本文所提算法進行驗證[17]。

表1 故障類型與故障代碼
為驗證本文算法在微弱故障診斷中的應用效果,選取軸承最小損傷直徑為0.177 8 mm(0.007 英寸),故轉速為1 730 r/min,采樣頻率為12 kHz,獲得正常、滾動體故障、內圈故障、外圈故障這4 種狀態下故障信號各40組,每組信號長度為2 048。
為更直觀理解特征提取的過程,以軸承內圈故障為例進行詳細論述。隨機選取一組內圈故障振動信號進行CEEMDAN 分解,分解之后得到一系列的IMF,階數越大其頻率越低,即包含的故障信息越少,具體如圖3所示。

圖3 CEEMDAN信號分解圖
為準確提取故障信號較多的IMF 分量,選用峭度值-相關系數準則對各模態分量進行篩選。分別計算各個IMF的峭度值、相關系數,將峭度值大于3且相關系數大于0.1 的IMF 分量進行信號重組,各IMF分量峭度值、相關系數計算結果如表2所示。
從表2中可以清楚地看出,IMF1、IMF2、IMF3這3個信號分量都符合峭度值-相關系數準則的篩選條件。因此,選取這3個信號分量進行信號重構。此外,對原始信號和重構后的信號進行頻譜分析,軸承內圈故障的重構信號時域圖如圖4所示,頻譜分析如圖5所示。

圖4 CEEMDAN降噪后時域信號

圖5 CEEMDAN降噪前、后頻譜對比圖

表2 各IMF分量峭度值-相關系數
從頻譜圖可以看出,重組信號保留了敏感故障特征,有效消除了噪聲的干擾。為此,將重構后的信號作為后續分析的樣本信號。同理,對其他狀態下的故障數據進行上述降噪處理。
利用TSMPE對上述過程的重組信號進行分析,在計算TSMPE 敏感值時,需要考慮兩個參數:嵌入維數m和時間延遲λ,針對這兩個參數的選擇其他學者已經做了大量分析[18],由于篇幅原因不再贅述,在本文中嵌入維數m為6,延遲λ為1,尺度因子τ為20,數據長度n為2 048。4種狀態下的TSMPE值如圖6所示。

圖6 4種狀態下的TSMPE值
從圖6可以看出,4 種狀態下TSMPE 值的變換趨勢大致相同,隨著尺度因子的增加而降低,在尺度因子4~20區間內TSMPE值具有交叉重合的現象,故不能直接將TSMPE 值作為特征向量進行故障分類。為解決上述問題,對TSMPE 值進行降維,通過PCA 計算各個元素的貢獻率,前3 個元素的累計貢獻率達到99.02%,說明前3個元素包含了各狀態下的大部信息特征。因此,選取這3 個元素作為特征向量,將原始20維特征值降到3維,有效減少了后續故障分類的計算量,實現數據去冗余,其貢獻率如圖7所示。

圖7 主元素貢獻率
用IAFSA 算法對SVM 的懲罰因子C及核函數G進行尋優。每種狀態有40 組特征向量,將其隨機分為兩部分,每部分含20 組特征向量,其中一部分用于IAFSA_SVM 故障診斷模型訓練,另一部分特征值被用于故障診斷,其中故障診斷模型訓練時長為11 s,故障診斷時長為5 s,故障診斷準確率為97.5%,結果如圖8所示。

圖8 CEEMDAN-TSMPE-PCA-IAFSA_SVM故障診斷結果示意圖
為驗證本文所提故障診斷方法的優劣,從多個維度對算法進行對比驗證。
3.3.1 特征提取維度進行對比驗證
將本文所提CEEMDAN-TSMPE-PCA故障特征提取算法分別與EEMD-TSMPE-PCA故障特征提取算法以及CEEMDAN-TSMPE 故障特征提取算法進行對比驗證。
將故障信號分別采用上述3種故障特征提取算法進行故障特征提取,將故障特征輸入到IAFSA_SVM 故障診斷模型中進行識別,基于EEMDTSMPE-PCA 診斷結果如圖9所示,基于CEEMDAN-TSMPE 診斷結果如圖10所示,其故障診斷準確率如表3所示。

圖9 基于EEMD-TSMPE-PCA故障診斷結果示意圖

圖10 基于CEEMDAN-TSMPE故障診斷結果示意圖
由表3可知,經CEEMDAN-TSMPE-PCA 處理后的特征信號故障診斷準確率比經EEMD-TSMPEPCA 處理后的故障診斷準確率高,CEEMDAN 算法相較于EEMD算法在軸承故障信號特征提取方面效果更好,導致該結果的原因是經EEMD 提取的特征向量含有沒有完全消除的噪聲。此外,從表3可以看出由CEEMDAN-TSMPE-PCA特征提取算法處理后的故障診斷準確率為97.5%,高于由CEEMDANTSMPE 特征提取算法提取后的91.25%,從結果是可以看出經PCA 降維后的故障信息有效去除了信息冗余,故障信息更加明顯,故障診斷的效果更好。

表3 基于3種特征提取算法故障診斷結果對比
3.3.2 故障訓練模型維度對比驗證
為證明IAFSA-SVM 故障診斷算法更有優勢,將IAFSA_SVM 故障診斷算法、AFSA-SVM 故障診斷算法及PSO-SVM 故障診斷算法進行對比。選一組故障數據,經CEEMDAN-TSMPE-PCA 特征提取后,將特征向量分別輸入到IAFSA-SVM、AFSA_SVM 和PSO_SVM 故障診斷模型中,其故障診斷結果如圖8、圖11、圖12所示,具體故障診斷信息如表4所示。

圖12 基于CEEMDAN-TSMPE-PCA-PSO_SVM故障診斷結果示意圖
由表4可知,相比于AFSA 和PSO,基于采用IAFSA 算法優化SVM 故障診斷算法故障診斷準確率更高,故障診斷耗時更短,可以說明IAFSA 對于懲罰因子C、核函數G尋優效果更好,基于IAFSA_SVM故障診斷算法在滾動軸承故障診斷中更有優勢。

表4 故障診斷結果對比
通過多維度對比分析的結果可以看出,本文提出的方法要優于其他組合診斷的方法,在滾動軸承故障診斷方面具有一定的優越性。
為驗證算法在實際中的效果,特對某公司在張家口市滿井風電場1.5 MW 風電機組齒輪箱上采集的振動數據進行分析[19]。在運行過程中,發現齒輪箱高速側出現振動變大的不良現象,通過內窺鏡發現軸承高速端外環存在細小剝落點,2011年5月對故障部件進行更換,更換后發現軸承內環有一面積約50 mm×5 mm 大的剝落點,確定為內環故障。將部件更換前的振動數據看作故障數據,將部件更換后振動信號看作正常信號,某時段故障振動信號如圖13所示。

圖13 風電場故障數據
根據本文所提出故障診斷方法的步驟對所有采集到的樣本進行分析,首先對振動信號進行CEEMDAN分解得到9個IMF分量,其中IMF2、IMF3、IMF4分量峭度值大于3 且相關性系數大于0.1,將IMF2、IMF3、IMF4進行信號重組,實現初步降噪。接著對重組信號進行STMPE初始特征值提取,對提取后初始特征值進行PCA 降維,提取到40×3 的故障特征向量。
將特征向量輸入到IAFSA-SVM 故障分類器中,其診斷結果如圖14所示,其中軸承內圈故障狀態編碼為1,正常狀態編碼為2。

圖14 基于風電場實際數據故障診斷結果
結果顯示,故障診斷率為97.5%,說明本文提出的將CEEMDAN、TSMPE、PCA 相結合的降噪方法有效提高了風力發電機軸承故障診斷的準確率。
綜上所述,本文提出一種將CEEMDAN、TSMPE、PCA、IAFSA_SVM 相結合的軸承故障診斷方法,在風力發電機故障診斷中具有一定優勢。
(1)利用CEEMDAN 算法對于非線性信號的分解優勢,結合峭度值-相關系數準則實現故障振動信號的降噪、重構。采用凱斯西儲大學軸承數據對算法進行驗證,故障診斷率為97.5%。為進一步驗證本文所提算法的實際應用效果,使用風電場實際故障信號進行再次驗證,其故障診斷結果也為97.5%。說明了本文提出的將CEEMDAN、TSMPE、PCA 相結合的降噪方法在風力發電機故障診斷中的有效性。
(2)通過IAFSA 優化SVM 的懲罰因子C、RBF核參數G,減少了故障診斷模型的訓練時長,提高了故障診斷準確率,最后故障診斷模型訓練時長為11 s,故障診斷時長為5 s,故障診斷準確率為97.5%。
(3)由于故障發生的隨機性,目前僅采集到正常狀態及內圈故障狀態的風力發電機齒輪箱高速軸振動信號。在用風電場實際數據對算法進行驗證時,未能對除正常信號、內圈故障狀態信號外的其他信號進行驗證,待后期各故障數據量擴充后,可對其進行補充驗證。
通過多維度的對比分析,說明了本文提出的方法要優于其他組合的診斷方法,在滾動軸承故障診斷方面具有一定的優越性。