趙文清,孔文軒,王繼發
(1.華北電力大學 控制與計算機工程學院,河北 保定 071003;2.復雜能源系統智能計算教育部工程研究中心(華北電力大學),河北 保定 071003)
對于雙饋式風電機組,其主軸承的劣化程度將直接影響機組的運行狀態。主軸的狀態監測及評估,對于風電機組安全運行具有重要意義。
軸承的故障診斷可通過測量并分析振動或溫度信號實現。文獻[1-3]利用振動信號對軸承的剝落、壓痕、銹蝕等損傷進行檢測并提出預測方案。這種方法的優點是,在使用時溫度信號的獲取簡單,不需考慮高精準儀器的矯正;但是對于振動信號,由于軸承的使用條件和傳感器安裝位置不同,方法在應用時需要對采集的振動信號進行分析比較以確定判斷標準,故此消耗的計算成本較高。
受摩擦、擠壓及外界環境的影響,軸承會發生變形、基礎螺絲松動、潤滑油不干凈、滾珠或滾柱損壞等情況,進而導致軸承溫度升高、偏離正常范圍[4,5]。文獻[6]結合數據采集與監視控制系統數據,將輪轂溫度、發電機定子繞組溫度、葉片電機溫度以及相電壓作為相關參數,提出了基于深度信念網絡模型的狀態監測方法。文獻[7]提出根據動態劣化閾值來劃分關鍵部件的基于溫度特征量的劣化程度。
深度學習在故障診斷領域的應用研究呈現出多樣化的局面;同時,故障診斷相關研究,也體現出向高效精準化發展的趨勢[8]。文獻[9]采用置信度計算分析了多工況下溫度對軸承的影響;通過設置高斯溫度閾值討論了齒輪箱和主軸溫度對故障預警的置信度。
設備溫度的變化通常具有時序性。在深度學習領域,用循環神經網絡對時序關系進行處理的方法得到了廣泛的應用。文獻[10]以雙饋風力發電機主軸承為對象,在利用隨機森林決策降低人工閾值設定的主觀影響基礎上,采用雙向神經網絡對軸承工況溫度進行預警分析。文獻[11]采用長短時記憶(long short-term,LSTM)網絡自編碼算法對齒輪箱高溫降容狀態進行了評估。文獻[12]基于高斯過程回歸和雙滑動窗口殘差處理,討論了風電機組主軸監測。
上述文獻對軸承溫度的預警預測提供了不同的研究思路,但是忽略了對軸承溫度本身的評價,且存在以下問題:基于溫度故障預測偏向于模擬升溫,忽略了軸承自然狀態下的溫升預警;數據缺失問題未進行討論;監測模型對于數據時空兼并考慮略有不足。
本文以標準軸溫為閾值,對主軸軸承的狀態進行評估:以溫度為研究對象,根據主軸歷史運行數據預測主軸故障。首先,采用線性插值和貝葉斯-高斯CP混合模型對缺失數據進行擴增;然后,利用ConvLSTM對主軸溫度實現時空預測,確定監測模型;最后,設置閾值并驗證。
以某風電場雙饋型風力發電機組主軸某年10—12月共3個月的數據為原始數據。數據采樣間隔時間為10 min。參數包含主軸轉速、功率、機艙溫度和主軸后軸承溫度。
考慮軸承溫度與機艙環境溫度差值相關,因此給數據增加“主軸前軸承溫度與機艙溫度差”“后軸承溫度與機艙溫度差”2個維度。
圖 1為通過原始數據繪制的功率-轉速分布圖。由圖1可以看出,原始數據存在異常值。

圖1 主軸功率-轉速分布Fig.1 Spindle power-speed distribution
由于異常值可能是傳感器異常產生的數據,所以首先需要對數據進行清洗。考慮本文研究的是主軸溫度狀態監測,因此需要保留正常停機數據,即轉速為0的數據。
數據的清洗,首先是刪除離群點,其次是刪除故障停機維護數據。考慮轉速和功率的曲線相關,采用DBSCAN(density-based spatial clustering of applications with noise)方法[13]刪除離群點。該算法的原理是:遞歸遍歷數據集,將具有足夠密度的區域劃分為簇;在有噪聲的空間,按照指定核心區域半徑發現簇。
設置核心區域半徑為 0.15,最小樣本個數為7;然后確定離群點,并刪除離群值。數據清洗最終結果如圖2所示。

圖2 數據清洗后功率-轉速分布圖Fig.2 Power-speed distribution diagram after data cleaning
由圖2可以看出,經過數據清洗,數據量減少。考慮原始數據本身也存在一定缺失值,這種情況不利于對時間序列數據的分析。因此,需要對數據進行擴增。
常用的數據擴增方法包括臨近值、平均值、線性差值法。這些方法雖然能補齊數據,但是不適用于數據丟失區間大且存在數據關聯的情況。
根據圖像生成對抗網絡進而擴增數據的方法,主要有 INfoGAN(information maximizing generative adversarial nets)[14]、SeqGAN(sequence generative adversarial nets)[15]、DTW(dynamic time warping)[16]等。這些算法在圖像和文本之間的跨度仍需進一步研究與論證。
文獻[17]針對交通時序數據缺失,使用貝葉斯-高斯CP模型對缺失數據進行擴增;該方法對時間序列擴增有較高的泛化性。
在本文所用的主軸溫度數據集中,部分數據丟失區間較大。所以,若使用貝葉斯-高斯CP模型對原有數據擴增,則會存在較大誤差。出于應用性考量,本文采用線性插值法和貝葉斯-高斯CP模型混合方式對數據擴增。
步驟如下:
(1)將時間序列補充擴增,以空值插入序列。
(2)采用線性插值法,將缺失部分的空值按缺失量多少取平均補齊。
(3)利用DBSCAN算法剔除離群值。
(4)訓練貝葉斯-高斯CP模型并擴增數據。
根據上述步驟,得到擴增數據集,含樣本13 249條。
對以下參數值進行歸一化:主軸轉速、功率、機艙溫度、主軸前軸承溫度、主軸后軸承溫度、前軸承溫度與機艙溫度差、后軸承溫度與機艙溫度差。歸一化后的各樣本參數隨時間變化曲線如圖3所示。

圖3 歸一化擴增后的數據樣本Fig.3 Normalized amplified data samples
LSTM 神經網絡通過輸入門、遺忘門和輸出門對長短記憶信息進行篩選,實現對時序數據時間相關性的處理。但是,對于長序列數據,LSTM神經網絡不能很好地處理序列間的關聯。
ConvLSTM模型如圖4所示。圖4中,it、ft、ot分別為輸入門、遺忘門和輸出門,ct-1和ct分別表示上一時刻和當前時刻細胞狀態。

圖4 ConvLSTM神經網絡結構圖Fig.4 Diagram of ConvLSTM neural network structure
對上一時刻的輸出ht-1和當前時刻的輸入Xt增加卷積計算,然后進行門運算;這使得計算時既考慮了時序信息,又掌握了空間信息之間的關聯。
自注意力機制的核心思想是,將注意力機制編碼器和解碼器之間序列的“信息權重挖掘”更新為“文本內部挖掘”[18]。自注意力機制能建立序列內部關聯關系,動態生成不同連接權重。
本文將ConvLSTM網絡輸出的結果作為自注意力機制的輸入,進行特征權重計算。
預測模型的搭建要充分發揮ConvLSTM網絡和自注意力機制的數據挖掘優勢。根據二者語義挖掘優勢,構建如圖5所示的預測模型訓練流程:數據Xt在ConvLSTM網絡層進行卷積時序運算,實現數據時空信息處理→將處理結果送入自注意力機制層中,分析數據內部的關聯信息→全連接層對數據進行線性處理→將運算結果ht作為上一時刻的輸出載入ConvLSTM網絡再次計算,最后輸出預測結果。

圖5 預測模型訓練流程圖Fig.5 Flow chart of prediction model training
2.4.1 實驗設置
將經擴增處理得到的數據按照8:2比例劃分,得到訓練集和測試集。設定訓練輪次為100次。學習率設定為10-4。優化器采用自適應矩估計。
采用平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)作為模型評價指標。
2.4.2 消融實驗
設置梯度下降時每個批處理樣本大小分別為10、30、50和 100。分析讀入不同大小的樣本在評價指標中反映出來的差值,進而選擇模型讀取的最優值。同時,為研究自注意力機制在主軸溫度預測中對預測結果優化的有效性,分別設置融合自注意力機制和沒有融合自注意力機制下每批讀取用于訓練的數據量(batch size)。
主軸溫度預測評價指標如表1所示。

表1 參數訓練評價指標Tab.1 Parameter training evaluation index
表1反映了反歸一化后主軸溫度的預測值和真實值的評價結果。
從表 1中可以看出,性能評價值隨著 batch size的增大而降低,在batch size為50時達到最低值,之后呈現上升趨勢。融合自注意力機制后,性能評價值依舊呈現上述規律。
對比相同batch size下,考察有、無融合自注意力機制時的性能評價值,發現:除batch size為10時外,融合自注意力機制后的其余評價值均低于沒有融合自注意力機制的值。融合自注意力機制后,在batch size為50時,性能評價值達到最優點,評價指標值比沒有融合自注意力機制時至少低0.2;整體準確率有明顯提升。
由此可以認為,batch size為50時,融合自注意力機制的預測性能最優。
2.4.3 對比實驗
在同一數據集上,將LSTM、CNN-LSTM[19]、Bi-RNN(bi-recurrent neural network)與本文模型進行對比驗證。
考慮LSTM的空間信息處理劣勢,將LSTM的輸入先進行卷積計算。這樣可以有利于增強LSTM 對前后文信息的提取,提高模型的預測準確度。利用CNN-LSTM對數據集進行卷積計算,然后再將計算結果送入 LSTM 中。因此,可將CNN-LSTM模型作為同類型計算模型進行對比。
Bi-RNN模型是文獻[10]46-47提出的主軸軸承溫度模型,有4層隱藏層記憶細胞,神經單元分別設置為100、60、35、15個。
模型對比實驗結果如表2所示。

表2 不同模型的評價結果Tab.2 Evaluation results of different models
表2結果表明,本文提出的將卷積貫穿LSTM輸入輸出全過程并融合自注意力機制的ConvLSTM模型,比CNN-LSTM的預測結果更準確。Bi-RNN的雙向語義分析雖然有利于時間數據特征挖掘,但相對于CNN的層疊卷積略遜。因此,融合自注意力機制的ConvLSTM在主軸軸承溫度預測上性能最佳。
軸彎曲變形、基礎螺絲松動或潤滑油不干凈均會導致軸承溫度升高。所以,主軸溫度變化可以反映設備故障情況。主軸溫度監測需要從主軸及其環境出發,考慮實際運行中主軸溫度預警情況。
取數據集中11月4—11日數據對本文模型進行實驗驗證。設置滑動窗口時長為10 min。基于溫度測量的主軸狀態監測評價流程如圖6所示。

圖6 主軸溫度狀態監測流程Fig.6 Spindle temperature status monitoring process
根據滾動軸承標準溫升規定,軸承溫度不能超過環境溫度 35℃,軸承本身溫度不能超過80 ℃。本文預警閾值按照該軸承標準設定。根據主軸溫度監測模型預測的前軸承溫度與機艙溫度的差值進行閾值判斷,輸出監測結果如圖7所示。

圖7 溫度狀態監測結果Fig.7 Temperature status monitoring results
圖7中,第44個點與閾值重合,第58個點超過閾值。在溫差連續超過閾值后,監測模型發出溫度過高報警,在一段時間后下降。在第 44點時,機艙溫度為32 ℃,此時前軸承溫度為67 ℃,遠未達到軸承最大承受溫度。
從圖7中可以看到,溫度后期又連續2次出現超過閾值的情況,經過短暫預警后恢復正常運行。
結合主軸軸承故障原因,推測可能是潤滑油過多或過少導致。
查該機組運行日志:11月4日18:30,系統發出主軸軸承溫度超限的警告;11月6日19:50停機補充潤滑油。
日志信息與本文狀態監測結果基本吻合。
由此可見,本文方法能有效監測主軸軸承狀態。
本文提出融合自注意力機制的風電機組主軸溫度狀態監測方法,并結合具體實測數據通過實驗對算法進行了驗證。
結果表明:本文提出的方法對主軸溫度的預測準確度較高,能夠有效地對主軸溫度狀態進行監測,從而保證風電機組主軸處于健康正常的狀態。
在后續的研究中,將收集并分析更多不同類型風電機組主軸數據,提升本文提出方法的泛化性,更好地與實際應用相結合;同時,試圖將此方法推廣到風電機組健康狀態評估研究中去。