蘇連成,朱嬌嬌,郭高鑫,李英偉,姜浪朗
(1.燕山大學 電氣工程學院,河北 秦皇島 066004;2.中國重型機械研究院股份公司,陜西 西安 710018;3.燕山大學 信息科學與工程學院,河北 秦皇島 066004)
近年來,風能作為一種清潔的可再生能源迅速發展,風電機組裝機規模不斷擴大。塔架作為風力發電機組的主要支撐裝置,它將機艙和風輪托舉到所需的高度,使機組更充分地吸收風能。隨著風電機組單機容量的提升,塔架的高度也不斷增加。在風電機組的整個壽命周期內,塔架受到風輪、機艙、自身重量以及各種風況引起的復雜動載荷作用[1]。如果塔架發生過度傾斜、振動異常等問題,易出現機組輸出功率減少,還可能引起極端載荷,甚至發生倒塔等安全事故[2]。因此發展有效的塔架振動狀態監測技術,及早發現風電機組早期故障隱患,對提高風電場運行的安全性和經濟性具有重要意義。
國內外許多學者對塔架振動信號和結構響應等方面進行了研究。郭鵬等[3]采用非線性狀態估計的方法建立塔架振動預測模型,以預測值與真實值的殘差作為評判標準,對塔架振動狀態進行監測。房寧等[4]采用主元分析的方法建立塔架與其相關變量之間的關系模型,通過計算霍特林統計量和平方預測誤差實現對塔架振動狀態的監測。文獻[5]建立高斯回歸過程塔架振動預測模型實現對葉輪槳距角不對稱的故障診斷。成立峰等[6]通過實驗說明風速和湍流是風機振動最主要的激勵源。文獻[7]使用概率密度演化的方法獲得隨機載荷下風機結構的可靠性。文獻[8]將風機的運行工況按風速、轉速和槳距角分為7種情況,分析指出風電機組塔架振動狀態受風電機組運行工況影響。文獻[9]研究了海上高大單樁鋼風力發電機塔架在風、浪、流作用下在架設階段的動力響應。文獻[10]提出了一種改進的基于逐步辨識的海上風電機組塔架結構損傷預測方法。
上述不具有時間記憶能力的算法不能充分挖掘風電機組監督控制和數據采集(Supervisory control and data acquisition,SCADA)系統數據的復雜時序信息,導致風電機組塔架振動狀態預測精度不高。長短期記憶(Long short-term memory,LSTM)網絡可以結合當前和過去的信息很好地學習SCADA數據中的依賴關系,因此本文提出了一種基于LSTM網絡的塔架振動狀態監測方法,提高了預測精度。
遞歸神經網絡(Recurrent neural network,RNN)與LSTM網絡都是具備長期記憶能力的時間序列模型,RNN在計算的過程中會記憶網絡之前的狀態,這使得計算量和模型的計算時間大幅度增加。為克服這一缺點,LSTM在RNN的基礎上,增加了遺忘門、輸入門和輸出門3個門結構有選擇地記憶網絡之前的狀態,提升了模型計算速度。其中,遺忘門是選擇地記憶部分時刻的輸出,輸入門是結合當前時刻的輸入和上一時刻的輸出改變當前狀態,輸出門是當前神經網絡的狀態改變后通過激活函數得到當前神經網絡的輸出。LSTM基本單元結構如圖1所示[11]。

圖1 LSTM基本結構單元Fig.1 The basic structural unit of LSTM
圖1中,it為輸入門,ft為遺忘門,Ct為細胞狀態,Ot為輸出門,ht為下一時刻的隱層函數,yt為下一時刻的輸出。計算公式為

式中:Wxi,Whi,Wxf,Whf,WxC,WhC,WxO,WhO,Wy,分別為輸入層到輸入門,隱含層到輸入門,輸入層到遺忘門,隱含層到遺忘門,輸入層到細胞狀態,隱含層到細胞狀態,輸入層到輸出層,隱含層到輸出層,輸出層對應的權重矩陣[12];bi,bf,bc,bo,by分別為輸入門,遺忘門,細胞狀態,輸出門,輸出層對應的偏置項。
由于直接比較不能定量地描述模型的預測效果優劣,為更加準確地評價模型的預測精度,本文使用可以體現模型預測值與真實值殘差大小的誤差平方和(Sum of the squared errors,SSE)、均方誤差(Mean-square error,MSE)和平均絕對誤差(Mean absolute error,MAE)作為模型的評價指標,公式如下。

式中,yi和分別表示樣本真實值和樣本預測值[13]。誤差平方和的大小表明模型擬合的好壞,均方誤差是反映預測值與真實值之間差異程度的一種度量,平均絕對誤差表示所有單個預測值與算術平均值的偏差的絕對值的平均,可以避免誤差相互抵消的問題,準確地反映實際預測誤差的大小。這3種誤差函數作為模型的評價指標,可以定量地評估模型預測效果。
使用正常數據訓練LSTM模型后,設塔架振動預測值與真實值的殘差為E,計算公式為

風電機組正常運行時,將選取的狀態參量輸入模型,得到預測值與實際值的殘差較小[14]。當風電機組處于異常運行狀態,如發生槳距角不對稱、變流器等故障時,由于風機內部控制動作的激勵導致塔架處于異常振動狀態,此時輸入變量與目標參量之間的關系將發生變化,使殘差增大。根據模型訓練得到的預測值與真實值的殘差為隨機變量,滿足正態分布的原則,設置合適的置信度得出塔架正常振動時殘差的上下閾值限。
SCADA系統作為風電機組的監測基礎,采集了大量與風機運行特性相關的變量[15-16],如風速、功率、機艙溫度、環境溫度、葉輪轉速,齒輪箱轉速、發電機轉速、槳距角、電流、電壓等上百個參數。其中包括風電機組正常運行的數據和異常運行的數據,還有一些空數據,通常不能直接使用。在對SCADA數據進行建模之前,需要對數據進行預處理,剔除風機運行的產生的空值和異常值。本文以某風電場雙饋異步風電機組為研究對象,對該風電場26號機組1月~7月SCADA數據進行預處理。如圖2所示,其中圖2(a)為原始SCADA數據的風速-功率圖,(1)區域為機組限功率數據;(2)區域為機組故障或傳感器異常測得的數據;(3)區域為機組停機數據。圖2(b)為預處理(即刪除限功率數據、停機數據、空數據和故障數據)后的風速-功率圖。

圖2 26號風電機組風速-功率圖Fig.2 Wind speed-power diagram of No.26 wind turbine
SCADA采集數據變量種類繁多,若采用全部SCADA變量建立模型,不僅降低了數據的計算速度,也降低了模型預測的準確性。為提高模型的運算速度和預測精度,需要選取對目標變量影響較大的參數,本文引入了灰色關聯度系數和最小角回歸(Least angle regression,LAR)算法。
2.2.1 灰色關聯度系數
灰色關聯度是描述數據變化趨勢的一種方法,數據曲線越平行,其灰色關聯度系數越大。公式如下[17]:

式中,x0(k)為母序列,xi(k)為子序列,ζi(k)為每個子序列與母序列之間的關聯程度系數,大小從0到1,子序列與母序列的關聯程度逐漸升高。
根據數據曲線間的一致性計算出的灰色關聯度系數總為正值,而SCADA參數與塔架振動量之間不一定是正相關,因此結合LARS算法進一步明確塔架振動量的影響因素。
2.2.2 LARS算法
LARS算法是一種適合高維數據的回歸算法[18],基于線性平方誤差最小的原則,選擇出與目標變量相關性較強的參量。給定數據{X,y},X∈Rn×m,y∈Rn其中xi∈Rn(i=1,2,…,m),找出最少的變量x1,…,xr,(r≤m)∈Rn,使其線性組合最大程度地接近y,約束條件為

其中,(xi1,xi2,…,xim),yi分別為第i個樣本的m個自變量和因變量,為第j個自變量的回歸系數。LARS算法就是調節使上述公式的平方誤差和最小。當t取較小值時,與因變量相關性較低的自變量回歸系數將為0。
為監測塔架振動的狀態,將塔架振動加速度作為目標變量。由于該機組的SCADA系統每30 s記錄一次傳感器測量的塔架振動數據,振動量的變化頻率較高,采樣頻率較低,使用原始記錄的瞬時值數據難以描述振動變化的真實情況,所以本文求取塔架振動數據10個值的滑動平均值,將節點100X方向滑動均值作為模型的目標參量。各參數與目標參量的灰色關聯度系數與回歸系數如表1所示,LARS回歸系數β與算法迭代步數之間的關系如圖3所示。

表1 各參數與輸出參數灰色關聯度系數與回歸系數表Tab.1 Table of gray correlation coefficient and regression coefficient between each parameter and output parameter

圖3 LARS回歸系數與迭代步數關系圖Fig.3 The relationship between LARS regression coefficient and the number of iteration steps
選擇LARS回歸系數不為0的參數,即選擇節點100Y方向振動滑動均值、風速、葉片2B編碼器值、風速1分鐘平均值、發電機轉速滑動方差、起停階段、軸1變槳速度滑動均值、轉矩三步差分、轉矩給定、功率1 min平均值、絕對風向、轉矩二次差分、絕對風向差分、葉片2B編碼值差分、發電機轉速滑動均值作為模型的輸入特征,由表1可以看出,選擇這些參數與節點100X方向振動滑動均值的灰色關聯度系數均大于0.5,本文還添加輸出參量的前一個時刻值作為模型的輸入參數[16]。
基于LSTM的塔架振動狀態監測流程圖如圖4所示。
選取風電場26號機組數據建立塔架振動狀態監測模型,使用1月~3月的數據作為LSTM模型的訓練集,選取5月和6月的數據作為模型的測試集。建立LSTM模型時,采用三層LSTM網絡相連接,并在網絡后連接兩層全連接層,根據SCADA的數據的輸入量和輸出量對網絡參數進行設置。LSTM兩層神經元的個數分別為60、55、40,全連接層的神經元個數分別為40,1。輸入數據的時間步數timesteps設置為2,選擇Adma作為模型的優化器,設置學習率為0.001,batch_size為400,epochs為150,選擇均方誤差函數來檢驗預測值和真實值之間的偏差。
為與提出的模型進行對比,本文還建立了BP網絡模型和極限梯度提升(XGBoost)網絡模型,使用同樣的訓練集分別對BP網絡和XGBoost網絡進行訓練,建立塔架振動預測模型,并對相同的測試集進行預測。其中BP網絡層數設為3層,神經元個數分別設為60、55、40,激活函數采用sigmoid函數,優化算法采用RMSprop,使用均方誤差計算訓練集和測試集的損失值,batch_size為1 000,epochs為 300。
為更加準確地評估模型的預測精度,使用可以體現模型預測值與真實值殘差大小的平方和誤差、均方誤差和平均絕對誤差作為模型的評價指標,計算結果如表2所示。

表2 不同模型精度評價指標Tab.2 Accuracy evaluation indexes of different models
由表2得出的結果可知,LSTM模型的2個測試集的3個評價指標SSE、MSE、MAE的值均小于XGBoost模型和 BP網絡模型。針對測試集1,LSTM網絡、XGBoost算法、BP網絡建立的塔架振動預測模型的預測誤差依次增大,且 LSTM和XGBoost模型誤差相差不大,即塔架振動量較低時LSTM和XGBoost模型預測精度較高;針對測試集2,3種預測模型的預測誤差相差較大,且LSTM模型的預測誤差表現為最小,即振動量較高時后兩種方法預測效果不如LSTM網絡。總體表現為LSTM模型預測效果優于XGBoost模型預測效果,XGBoost模型預測效果優于 BP網絡模型預測效果。
通過上述3種模型對2個測試集的預測誤差的比較可以得出,基于LSTM的塔架振動狀態預測模型能較好地預測塔架振動狀態變化趨勢,該模型很好地學習了風力發電機組正常運行過程中各狀態變量與塔架振動量之間的關系,為下一步塔架異常振動識別及監測提供了基礎。
3.2.1 實例分析1
為驗證提出方法的有有效性,選取和上述26號機組同一風電場48號機組進行驗證。其中選取7月15日~8月15日的數據作為訓練集,選取8月20日~8月24日、8月26日~8月27日的數據分別作為兩組測試集。由于訓練集殘差為隨機變量,一般滿足正態分布,將訓練集殘差的置信度設為99.9%,滿足99.9%以上的殘差數據在閾值限以內,經過計算得出殘差下限為-0.089,殘差上限為0.099,即塔架正常振動狀態下的殘差應滿足[-0.089,0.099]。LSTM、XGBoost、BP 網絡 3種模型對兩個測試集的預測結果如圖5所示,LSTM模型訓練集預測值與實際值的殘差分布直方圖和兩個測試集的殘差分別如圖6和圖7所示。

圖5 48號機組3種模型預測結果圖Fig.5 The prediction results of the three models of No.48 wind turbine

圖6 48號風電機組訓練集殘差分布直方圖Fig.6 Histogram of residual distribution of the training set of No.48 wind turbine

圖7 48號風電機組預測結果和殘差Fig.7 Forecast results and residuals of the No.48 wind turbine
由圖7看出測試集1的預測值與真實值殘差全部在上下閾值限之內。測試集2預測值與真實值的殘差在1 000點初次越限,即8月26日出現第一次越限,之后出現多次越限,且越限值遠超出閾值上下限,可以判定風電機組塔架出現異常振動。查詢歷史紀錄,如表3機組編號為48的故障記錄,該風電機組在8月31日,00:28:47時出現變流器故障報警,監測結果與歷史記錄一致,由于變流器故障,導致機組給定轉矩迅速下降為0,發電機轉速隨之下降為0,導致機組緊急停機出現塔架振動異常。結果表明,該方法可提前5天對風電機組變流器故障發出警報,若在殘差第一次超出閾值時對機組進行停機檢查,可降低機組緊急停機給風電機組帶來的損害。

表3 故障記錄表Tab.3 Table of fault record
3.2.2 實例分析2
選取與26號機組和48號機組同一風電場的49號機組對本文提出的模型進行驗證和分析,將7月20至8月21日24900組樣本作為模型的訓練集,8月22日~8月24日、8月25~8月27日兩組數據作為兩組測試集,三種塔架振動預測模型對兩組測試集的預測結果如圖8所示。LSTM模型訓練集殘差頻數分布直方圖9所示,計算得到閾值范圍為[-0.114,0.118],兩個測試集的殘差如圖10所示。

圖8 49號機組三種模型預測結果圖Fig.8 The prediction results of the three models of No.49 wind turbine

圖9 49號風電機組訓練集殘差分布直方圖Fig.9 The histogram of the residual distribution of the training set of the No.49 wind turbine

圖10 49號風電機組預測結果和殘差Fig.10 Forecast results and residuals of No.49 wind turbine
由圖10可以看出,測試集1的殘差基本都在閾值范圍內,由于風向或風速波動較大導致殘差偶爾超出閾值,在短時間內又恢復到閾值限以內。測試集2的殘差在316點即8月25日出現第一次越限,在接下來的兩天內出現多次越限,可以判定塔架為異常振動狀態。查詢歷史紀錄,該風電機組在8月28日11:24:46出現發電功率過高。在風電機組記錄故障之前,為限制風機運行功率,變槳系統使槳距角在短時間內增大較大的角度,產生較大的氣動載荷,激勵塔架產生異常振動,故障記錄如表4所示。結果表明,該方法可提前3天對風電機組發電功率過高發出警報,若在殘差第一次超出閾值時對機組進行停機檢查,可降低甚至避免機組因發電功率過高而導致的頻繁緊急停機給風電機組帶來進一步的損害。
針對風電機組塔架振動問題,本文結合某風電場實際SCADA運行數據,對比分析了基于BP神經網絡、XGboost算法和LSTM神經網絡的塔架振動預測模型精度,使用風電場實際SCADA數據進行測試,結果表明,基于LSTM的塔架振動預測建模精度優于BP神經網絡和XGboost算法。利用同一風電場兩個機組的實際運行數據對所提方法進行驗證,測試結果顯示所提方法較SCADA系統能分別提早5天和3天對由變流器故障和發電功率過高導致的塔架異常振動做出預警,可以有效避免故障惡化引發的緊急停機對機組造成進一步的損害,降低了運維成本,提高了風電機組運行的可靠性。