劉紅艷,劉華新,朱霄珣
(1.河北軟件職業技術學院信息基礎教學部,河北 保定 071000;2.華北電力大學能源動力與機械工程學院,河北 保定 071003)
發電機軸承作為風力發電機組中重要的部件之一,需要重點關注其運行狀態,對其進行故障診斷以及實時的狀態監測。目前,許多針對風電機組發電機的故障診斷方法通常以高頻振動信號作為分析對象。然而,直驅式風電機組發電機轉速較低,且多數配備在線的狀態監測系統(condition monitoring system,CMS),無法直接采集記錄高頻的振動信號進行信號分析。兆瓦級的風電機組通常配備監控與數據采集(supervisory control and data acquisition,SCADA)系統?;赟CADA數據對發電機軸承進行狀態監測和故障預警,能降低預警的部署成本。
尹詩等[1]將SCADA數據和風電機組發電機前軸承振動信號相結合,提出了一種時頻域建模方法。該方法結合了溫度殘差特征和振動頻域特征,以識別風電機組發電機軸承故障。李輝等[2]提出改進局部均值分解(local mean decomposition,LMD)方法,對風機機組齒輪箱的振動信號進行特征提取。魏樂等[3]基于貝葉斯優化的XGBoost算法,構建風電機組發電機前軸承溫度預測模型,并通過預測值和實際值間的差別進行故障診斷。董興輝[4]應用最小二乘曲面擬合算法和集合經驗模態分解(ensemble empirical mode decomposition,EEMD)方法,分析軸承惡化狀態。
本文提出了一種基于膠囊網絡的風電機組發電機軸承狀態監測方法。該方法首先建立能夠反映風速、功率、溫度間動態關系的模型;其次,使用發電機軸承溫度動態模型獲得仿真的軸承溫度;然后,將仿真的軸承溫度、實際軸承溫度、轉速、機艙溫度等多個向量組成輸入矩陣;最后,基于膠囊網絡對輸入矩陣進行特征提取和狀態識別,以實現遠程診斷、監測直驅式風電機組發電機軸承狀態目的。
風電機組的SCADA數據是10 min或者7 s的聚合數據。一些振動、電流電壓等高頻信號只能以特征值的形式保持在數據庫中,信息量丟失較多。而風電機組上的溫度、位置信號變化頻率較低,信息保留完整。因此,基于SCADA的風機狀態檢測重點關注這些信號[5]。
一些早期基于SCADA數據的風電機組狀態監測方法通常會判斷一些信號值是否超過閾值、其趨勢是否存在變化、是否發生波動,以及同一風場相近同型號風機的顯著性差異,從而發現設備異常。
實際上,發電機軸承的彎曲、松動、損傷均會導致軸承載荷增大,使其在長時間工作時溫升較高。而風電機組的發電機軸承的溫度是和機艙溫度、發電機功率、設備散熱狀態等因素密切相關的動態量。因此,僅用閾值和相近風機對比難以提前發現軸承損傷,但是可以通過監測發電機軸承設備產熱和散熱速率。
為了提取發電機軸承的產熱和散熱速率的特征,本文建立了一種能夠短時預測發電機軸承溫度的動態模型,通過模型的參數間接反映設備的產熱和散熱速率特征。發電機軸承溫度動態模型如圖1所示。

圖1 發電機軸承溫度動態模型Fig.1 Dynamic model of generator bearing temperature
圖1中:RG為發電機轉速,是設備機械能輸入;TE為機艙溫度,表示設備的散熱環境;TG為設備本身溫度。圖1中的f()可以利用傳熱學原理推導。
式(1)為發電機軸承溫度變化和熱量關系公式。
Q=Cg[TG(k)-TG(k-s)]
(1)
式中:Q為發電機軸承變化的熱量;Cg為發電機軸承比熱容;TG(k)為k時刻發電機軸承溫度;TG(k-s)為(k-s)時刻的發電機軸承溫度。
Q=QIN-QOUT
(2)
式中:QIN為發電機軸承輸入熱量;QOUT為發電機軸承向外部輸出熱量。
由于發電機軸承輸入熱量主要來源于發電機轉動機械能,因此可將QIN化簡為發電機轉速的函數,并將發電機轉速的三次函數作為軸承在s時間間隔內輸入熱量QIN。
(3)
式中:ks為常數;RGs為時間間隔s內發電機平均轉速;a、b、c為常數。
發電機軸承散熱QOUT為:
(4)
式中:ks為常數;TG(k)為k時刻發電機軸承溫度;TE(k)為k時刻機艙環境溫度;RTG為熱阻。

(5)
綜合式(1)~式(5),合并多項式參數,可得:
TGs(k)=f[TGs(k-s),RGs,TE]=
(6)
式中:u1~u10為常數;RGs發電機平均轉速;TE為機艙內平均溫度;TGs(k-s)為(k-s)時刻的發電機軸承溫度。
采用10 min顆粒度SCADA數據,設置時間間隔s為3 h,RG取3 h內發電機平均轉速,TE取3 h內機艙平均溫度。采用某風場A20#、A21#風電機組2020年3月29日之前60日內數據作為訓練數據,采用Levenberg-Marquardt(LM)法[6]尋求最優的u1~u10值,并以得到訓練數據之后6日的數據作為測試數據。
A20#、A21#機組均在2020年1月進行了前軸承潤滑油添加置換。在2020年3月20日前,機組長時間滿發時的前軸承溫度在50 ℃以下,而A20#、A21#機組每5日函數f()計算的軸承溫度均值和實際溫度不存在明顯差異。由此可以推斷機組軸承狀態良好。
A20#和A21#發電機軸承溫度和如圖2所示。

圖2 A20#和A21#機組發電機前軸承溫度Fig.2 A20# and A21# unit generator front bearing temperature
從2020年3月20日開始,A20#機組的軸承實際溫度長時間高于函數f()計算值。因此,在2020年4月27日分別采集A20#、A21#機組的前軸承潤滑油進行檢測。A20#機組前軸承潤滑油呈現黑紅色,含鐵量為14 875 mg/kg。A21#機組前軸承潤滑油鐵含量為524 mg/kg。根據檢測報告結論,A20#機組前軸承存在滾動體、滾道磨損或腐蝕及粉塵污染。但由于機組在質保期內,因此只進行了加強監測。從2020年4月27日到2020年5月23日,A20#機組前軸承溫度最高溫度逐漸升至72 ℃,經過返廠拆解發現A20#機組前軸承存在偏心且磨損嚴重。
由圖2可知,通過對比發電機真實軸承溫度和函數f()計算結果,能夠在一定程度上發現軸承狀態異常。但在實際工作中,由于風速的波動造成的參數差異[7]、故障風機樣本數量較少、需要監測的風機設備數量多等因素,使得逐一比對發現問題的工作量巨大,難以實際應用。故本文引入機器學習技術,以提高狀態監測的實時性、準確性,并盡可能在故障早期識別出軸承狀態異常。
針對風電機組發電機軸承的狀態識別任務中,由于識別對象為源自機組溫度和轉速傳感器信息組成的多個向量,且故障樣本由于設備損壞概率低,正負樣本不均衡。所以卷積神經網絡(convolutional neural network,CNN)、長短期記憶人工神經網絡(long and short term memory,LSTM)這類神經網絡在處理這類任務時,存在訓練集不足、難以識別輸入向量間關系等困難[8-9]。膠囊網絡作為識別模型,是2017年由Hinton等[10]提出的一種新型神經網絡。膠囊網絡的特征提取方式、結構特點和軸承狀態識別任務間有很好的契合度。
膠囊網絡模型如圖3所示。

圖3 膠囊網絡模型Fig.3 Capsule network model
膠囊網絡結構和文獻[7]保持一致,僅在卷積核的大小、卷積方式、輸出特征向量數量上有所區別。膠囊網絡和CNN最大的不同就是取消了池化層,采用了膠囊層。這將避免輸入向量的空間特征丟失,同時使神經網絡感知輸入向量間的空間位置關系。這也是膠囊網絡作為識別模型的優勢所在。
由于Hinton設計了獨特的膠囊神經元,使膠囊網絡能夠感知輸入向量空間位置。這與其他神經網絡使用的標量神經元、向量神經元具有明顯的差異。
膠囊神經元的輸入不是標量的集合,而是一組向量的集合。因此,在模型訓練得到的權重中,實際上包含了能夠提取輸入向量和向量間空間位置關系的“知識”。CNN、遞歸神經網絡(recurrent neural network,RNN)由于使用的神經元處理的是標量神經元,難以提取輸入向量和向量間的位置關系。它們獲得的模型權重往往能夠識別輸入信號的不同“部分”特征,而對輸入信號不同“部分”特征之間的“角度”等位置關系[11]。
針對發電機軸承信號輸入源是表征設備時間域上的特征向量。特征向量在不同位置表現設備不同時間上的狀態。因此,本文選擇能夠識別輸入向量間空間位置信息的膠囊網絡,并將其作為識別模型。
本試驗選取西南某風場共100臺同型號風機2020年度運行數據作為數據源。該風場在2019年10~12月對風場全部機組軸承潤滑油進行加注,并在2020年4~6月對風場全部機組進行油樣送檢。風電機組的軸承狀態如表1所示。

表1 風電機組的軸承狀態Tab.1 Bearing condition of wind turbine
①選取前軸承狀態為優機組、時間為送檢前20日內顆粒度為10 min的運行數據(包括發電機轉速R、機艙溫度TE、前軸承溫度傳感器1#TG1、前軸承溫度傳感器2#TG2),并隨機選擇2個任意連續的4日作為正常狀態下樣本,共得152個正常樣本。
②選擇前軸承狀態為中機組的送檢前20日運行數據,每4日數據作為1個樣本,每臺機組可得5個樣本,共90個重點監測狀態樣本。
③選擇前軸承狀態為差機組的送檢前28日運行數據,每4日數據作為1個樣本,每臺機組可得7個樣本,共42個損傷樣本狀態樣本。
④選取存在軸承溫度傳感器異常(溫度突增、靜止、傳感器溫度過大等)4日數據,共36個。
⑤對320個樣本,首先,選取其開始時間之前60日運行數據,尋求發電機軸承溫度的動態模型函數f()的最優參數;然后,利用該模型計算樣本區間內機組軸承溫度,將真實軸承溫度TG減去模型計算值得到1#傳感器的Tdiff1和2#傳感器的Tdiff2;最后將TG1、Tdiff1、TG2、Tdiff2、R、TE分別歸一化后組成的輸入矩陣Vinput。將320個樣本隨機分為訓練集樣本220個、測試集樣本100個。
使用相同方法獲得發電機后軸承樣本160個(油樣正常樣本70個、中等樣本35個、嚴重樣本14個、傳感器異常41個)。其中,110個樣本作為訓練集,50個樣本作為訓練集。
本文采用Keras框架搭建神經網絡,設初始權重Glorot均勻分布、學習率為0.001、迭代次數為5 000、前軸承網絡模型設置處理數據的batch_size為220、后軸承為batch_size為70。膠囊網絡結構如表2所示。

表2 膠囊網絡結構Tab.2 Capsule network structure
首先,將樣本輸入膠囊網絡中。其中,首層卷積核大小為1×12,次層卷積核大小為2×6。這是由于輸入矩陣Vinput的尺寸為6×576,即矩陣不同列表示4天內不同時刻的數據。因此,盡可能寬的卷積核能夠提取較長時間段內的特征信息,以防止卷積核只提取輸入信息和局部特征。取訓練后loss穩定收斂的膠囊網絡橫型作為最終訓練結果。膠囊模型對軸承的識別結果如表3所示。

表3 膠囊網絡對軸承的識別結果Tab.3 Recognition results of bearings by capsule network
如表3所示:除了軸承狀態為中(即油樣檢測結果為Fe含量1 000~4 000 mg/kg)的樣本出現識別錯誤,其他狀態下全部識別正確。這是因為軸承狀態為中的其軸承溫度狀態變化較小,識別難度相對較大。
使用CNN、反向傳播(back proporgation,BP)神經網絡、支持向量機(support vector machine,SVM)對3.2節的測試集1(即前后軸承測試集合并)進行識別,并按照3.1節數據預處理方式建立不含發電機軸承溫度的動態模型計算參數Tdiff1、Tdiff2的測試集2(前后軸承集合并)。同時,選取北方某2014年投運的2.0 MW風電場(52臺),按照3.2節方法預處理后組成數據集3。由于該風場機組發電機前軸承存在設計載荷不足的缺陷,自投運到2021年期間,因故障和缺陷更換了18臺發電機,正樣本和負樣本均衡。對3個數據集進行測試,以驗證膠囊網絡和其他算法在均衡樣本下的學習能力。
不同算法識別準確率如表4所示。

表4 不同算法識別準確率Tab.4 Different algorithm recognition accuracy %
表4所示的結果表明:提供軸承產熱散熱特征,能夠有效提升機器學習算法識別軸承狀態能力;同時,基于膠囊網絡的模型能夠在樣本數量少且正負樣本不均衡的數據前提下,更準確地識別風電機組發電機軸承狀態。而在正負樣本均衡的樣本數量多的情況下,CNN和膠囊網絡表現出較為一致的識別效果,BP神經網絡和SVM則表現較差。
為了對不具備振動監測功能的直驅式風電機組主軸承進行遠程故障診斷和狀態監測,通過傳熱學建立風電機組主軸承動態模型,提取設備的產熱和散熱狀態特征,再結合風電機組運行狀態組成狀態矩陣,通過膠囊網絡識別風電機組主軸承狀態。通過試驗,膠囊網絡能夠在正負樣本不均衡的數據集下取得較高的診斷精度,為缺乏故障樣本的風電場的直驅式機組主軸承的故障診斷提供參考。