熊昌全,何澤其,張宇寧,黃 勝
(1.國家電投集團四川電力有限公司,四川 成都 610065;2.國家電投集團四川電力有限公司涼山分公司,四川 西昌 615000)
隨著化石能源短缺以及環境污染等問題的出現,風力資源作為綠色可再生能源受到科學與工業界的高度重視[1]。為充分有效地利用風力資源,風電場一般建于高海拔山區或沿海區域,這些地區往往具有晝夜溫差大、濕度大、風力強等特點。在低溫季節,長期處于潮濕寒冷環境下的風電場面臨嚴重的風機葉片覆冰問題。風機葉片覆冰將加劇葉片的疲勞載荷以及影響風機產能,嚴重時會導致設備故障和風機壽命縮短。極端情況下,過度積冰甚至可能發生風機塔筒坍塌[2-3],嚴重影響風電場安全經濟運行。因此亟需開展對風機葉片覆冰狀態預測研究,提前采取防范措施以預防可能發生的覆冰危害,確保風電場安全高效運行。
針對風機葉片覆冰狀況研究,文獻[4]利用天氣數據進行預測研究,將預測結果輸入基于物理機理的iceBlade模型中,實現對風機葉片的覆冰監測。文獻[5]基于壓電陶瓷應力波測量,提出了風機葉片覆冰主動監測方法,結果表明,壓電陶瓷電壓測量信號與覆冰厚度存在顯著的相關性,方法偏向實驗分析。以上覆冰檢測研究以覆冰產生機理和過程數值作為重點研究對象,缺少對風機自身運行數據的考量。文獻[6]基于數據分析的風機狀態監測方法,提出一種基于數據采集與監控系統(supervisory control and data acquisition, SCADA)數據變量相關性的監測方法,實現在不同工況下對風機健康狀況的定量評估。文獻[7]基于SCADA數據,提出了一種主動診斷式的覆冰監測方法,分別從機組整體性能、葉槳吸能效率、機組塔架振動對風機覆冰開展精細化研究,并進行了相互驗證,但忽略了指標整體關聯性。文獻[8]通過SCADA系統收集的基礎數據作為模型輸入,提出了一種基于長短期記憶網絡的葉片覆冰故障檢測模型,但LSTM模型存在精確性不足等問題。文獻[9]提出了一種基于BP神經網絡的風機葉片故障預測方法,先根據行業經驗,從SCADA監測數據集選出與風力發電機葉片結冰關聯度高的數據,通過多源融合的方法利用BP神經網絡自聚類算法進行葉片結冰故障預測,但對數據選擇和處理較為粗糙,導致預測精度欠缺,且BP自聚類算法存在分類數據需求大的問題。支持向量機(support vector machine,SVM)在學習樣本數較少的情況下比人工智能方法有更強的適應性、更好的分類能力[10]。
綜上所述,傳統的覆冰狀態監測方法不能精確判斷風機葉片覆冰狀態,且風機覆冰狀態監測數據冗余,處理較為困難。針對這個問題,提出一種基于雙向傳播長短期記憶網絡(bidirectional long short-term memory, Bi-LSTM)和SVM的風機葉片覆冰狀態預測模型。首先,基于主成分分析法對SCADA數據進行降維處理,得到與風力發電機葉片覆冰關聯度較高的數據特征;其次,對篩選的數據特征歷史數據進行數據分析與預處理,并作為訓練集輸入Bi-LSTM神經網絡進行訓練,Bi-LSTM可以有效解決傳統LSTM網絡對長關聯數據點信息識別能力較差的問題,經過測試表明預測模型精確度良好;最后,基于大量歷史數據集訓練好的SVM模型,對Bi-LSTM數據特征輸出的預測數據進行覆冰狀態判別,最終確定風機葉片是否會出現覆冰故障。
基于SCADA監測系統得到的數據指標集維數較多,在此情況下,往往會使得計算量增大引發維數災難,因此需要對數據指標集進行降維。主成分分析法[11](principal component analysis,PCA)是一種廣泛使用的數據指標降維方法,其目的是對能反映風機葉片覆冰狀態特性的數據特征進行降維,同時對具有較高的原始變量信息量的數據特征進行排序,因此可利用該方法篩選影響風機葉片覆冰的關鍵指標。其步驟如下:
1)對數據進行標準化處理
2)計算標準化矩陣的相關系數矩陣
R=(Sij)p×p,i,j=1,2,…p
(1)
式中:R為協方差矩陣;Sij為協方差矩陣中第i行和第j列所對應的數。
3)計算相關系數矩陣的特征值和相應的特征向量
4)選擇主成分
每個特征根對應的特征向量為a1,a2…,ap,通過特征向量將標準化的數據指標轉化為主成分
yi=a′iβ
(2)
式中:yi為主成分;β為預處理后的原變量值。
主成分的信息量大小由方差貢獻率決定,其表達式為
(3)
式中:αi為方差貢獻率;λi為特征值;m為選取協方差矩陣特征值的個數。
累積方差貢獻率表達式為
(4)
式中:G(m)為累積方差貢獻率;λk為第k個主成分的特征值。
5)計算主成分載荷
主成分載荷的表達式為
(5)
式中:lij為主成分載荷;aij為各變量間的相關系數矩陣。
6)主成分得分表達式
Gi=α1y1+α2y2+…+αpyp
(6)
式中,Gi為最終所提取的主成分得分。
最后,將原始數據集帶入主成分表達式中即可計算出主成分得分,通過篩選主成分得分高的構成新的數據特征集,通常當累計方差貢獻率大于85%時,所確定的主成分可以反映相關變量特性。
為使數據特征形式符合Bi-LSTM風機葉片覆冰預測模型的輸入規范,采用歸一化和標準化對數據進行預處理[12]。針對范圍有限的數據特征,采用歸一化統一不同數據特征的取值范圍,即將數據特征的上限設為1,下限設為0,其表達式為
(7)
式中:X′為預處理后的數據特征;X為原始數據;Xmax、Xmin分別為數據特征中的最大值和最小值。
對于范圍不確定的數據,采用標準化降低異常數據帶來的影響,即將數據特征的均值轉化為0,方差轉化為1,其表達式為
(8)
式中,δ、ζ分別為數據特征的均值和標準差。
為解決一般的循環神經網絡(recurrent neural network, RNN)存在的無法記憶長時間段信息和對內存與計算時間要求高的局限性,LSTM作為一種時間循環神經網絡被設計提出[13-14]。且雙向機制可以提供給輸出層輸入序列中每一個點完整的過去和未來的上下文信息,進一步提高網絡對長關聯信息的識別能力[15]。
LSTM單元包含3個門控:輸入門、遺忘門和輸出門。此外,每個序列索引位置t有向前傳播的隱藏狀態h(t),同時還有一個用于描述前后時間耦合的細胞狀態,記為C(t)。具體模型結構如圖1所示。

圖1 LSTM內部結構
LSTM的3個門控具體運作流程如下所述:
1)遺忘門
遺忘門決定前一個時間步內部狀態對當前時間步內部狀態的更新。首先,在遺忘門輸入端輸入上一序列的隱藏狀態ht-1和本序列數據Xt;其次,通過激活函數σ,得到遺忘門的輸出pt;最后,輸出值pt賦值給對應細胞狀態變量Ct-1,表達式為
pt=σ(Wpht-1+UpXt+bp)
(9)
式中:Wp、Up為線性關系的系數;bp為t-1時刻到達t時刻的神經元所對應輸入門的偏置;σ、pt分別為sigmoid的激活函數和輸出結果,其中pt∈(0,1)。
2)輸入門
輸入門決定當前時間步的輸入和前一個時間步的系統狀態對內部狀態的更新。具體為將過去的記憶與現在的記憶合并:首先,由sigmoid激活函數得到it;其次,由tanh激活函數得到at;然后,將it與at進行相乘;最后,用所乘結果對細胞狀態進行更新,其表達式為
(10)
式中,Wi、bi分別為t-1時刻到達t時刻的神經元所對應的輸入門的權重函數和偏置;Wa、ba分別為t-1時刻到達t時刻的神經元所對應的輸入數據的權重函數和偏置;Ui、Ua為輸入門線性關系的系數。
細胞狀態更新過程由Ct-1與遺忘門輸出pt的乘積和輸入門it與at的乘積構成。此過程表達式為
Ct=Ct-1⊙pt+it⊙at
(11)
式中:Ct為新細胞狀態;⊙為哈達瑪積。
3)輸出門
輸出門決定內部狀態對系統狀態的更新。輸出基于細胞狀態,但最終輸出結果會被過濾。首先,運行一個sigmoid層來確定細胞狀態的輸出部分;其次,把細胞狀態通過tanh進行處理(得到一個在-1~1之間的值)并將它和sigmoid門的輸出相乘,最終輸出結果。
ot=σ[Wo(ht-1,xt)+bo]
(12)
ht=ottanh(Ct)
(13)
式中:ot為輸出門系數;Wo和bo分別為t-1時刻到達t時刻的神經元所對應的輸出門的權重函數和偏置。
Bi-LSTM網絡的基本思想是對于一個訓練序列進行向前和向后兩次LSTM訓練,并連接著同一個輸出層,從而提供給輸出層輸入序列中每一個點完整的過去和未來的上下文信息,如圖2所示。其公式為:

圖2 Bi-LSTM
1)正向計算LSTM隱藏層狀態
st=f(U·xt+W·st-1)
(14)
2)反向計算LSTM隱藏層狀態
(15)
3)最終輸出取決于s和s′
(16)
式中:U、V、W為各個權重矩陣;f、g為LSTM激活函數。
Bi-LSTM網絡擁有的特殊門結構和記憶功能,具有良好的時序數據處理能力。風機覆冰預測所需基礎數據冗雜且都與時間序有關,所以Bi-LSTM網絡適用于所提的風機葉片覆冰狀態預測。
支持向量機是由Vapnik等人提出[10]。SVM可用于高維模式的識別,即分類問題研究。其基本思想是,基于在數據集里找到支持向量,在特征空間上找到最佳分離超平面使得訓練集上的不同樣本間隔最大。
腕表搭載的機心Movement RR-01在時間指示上僅為簡單的小三針,但是十分有心地加入了停秒機制和秒針歸零機制,方便腕表精準調校(大部分的腕表在調整時間時秒針會繼續走)。這款機心還仿制了舊式懷表的上鏈機制,令表主在上發條時能夠聽到非常復古的機械聲。這些細節處的用心,大概就是這匹黑馬得以登頂的原因。機心提供100小時動力儲存,時分秒顯示。
對于二分類問題,最優分類超平面的表達式可設為
wφ(x)+b=0
(17)
式中,w、b分別為權重和閾值偏差。
進一步地,原樣本空間的二分類問題可表示為
yi(wφ(x)+b)≥1
(18)
式中,yi∈[-1,1],為輸出狀態類別。
同時引入松弛變量εi、懲罰因子C以及Lagrange乘子αi應對可能產生的樣本分錯問題,將原問題轉換為對偶問題,即
(19)
根據Kuhn-Tucker條件,αi須滿足
(20)
求解上述問題,可得到最優分類函數
(21)
式中:sgn(u)為符號函數,若u>0,則sgn(u)=1,u<0,則sgn(u)=-1;xi為是樣本變量數據;yi為樣本類標;x為待分類樣本;m為支持向量個數;K(x,xi)為核函數。
根據專家的先驗知識預先選用核函數為
K(x,xi)=exp(-γ|u-v|2)
(22)
式中,u、v為數據集的樣本。
采用MATLAB軟件平臺,對所建立的基于Bi-LSTM和SVM的風機葉片覆冰狀態預測模型進行求解。系統硬件環境為Intel Core I5 CPU,3.30 GHz,8 GB內存,操作系統為Win10 64 bit。求解流程如圖3所示,具體步驟如下:

圖3 模型求解流程
1)采用PCA對原始指標數據集進行降維處理,降維得到與覆冰關聯度貢獻最大的特征指標。
2)基于降維得到的特征指標選擇所對應的歷史數據,進行數據標準化預處理,用于Bi-LSTM預測模型的訓練及測試評估。
3)選擇降維得到特征指標對應的覆冰及未覆冰狀態的歷史數據,對SVM分類進行訓練。
4)將實際數據輸入Bi-LSTM預測模型,輸出得到特征指標預測數據,再輸入SVM分類模型對風機葉片覆冰狀態進行判斷。
基于PCA對SCADA特征指標集降維得到13個特征指標。根據主成分得分對葉片覆冰影響的重要程度由大到小的排序如表1所示。由于主成分艙內溫度、環境溫度及偏航位置的累積方差貢獻率達到了85%以上,具有較高的原始變量信息量,可以反映葉片覆冰狀態之間的相關性,因此選擇上述3個特征指標作為所提模型的輸入量。

表1 13個數據特征排序
對覆冰和正常狀態的數據集添加標記以區分,總共采集2000組數據,其中后400組數據為覆冰狀態數據。根據模型經驗[16],并對比在不同訓練樣本和測試樣本下的預測精度,如圖4所示,可知訓練數據和測試數據的數量之比為1600∶400時能收獲較好的預測精度,且再增加訓練樣本時,模型的預測精度基本保持不變。因此選用1600組數據用于模型訓練,400組數據用于模型測試。通過多次試驗,Bi-LSTM預測模型的參數為:2層隱藏層,每層神經元數依次為64、128個;訓練1000輪;激活函數為adma;批大小為32。

圖4 不同訓練樣本/測試樣本比例下模型預測效果對比
選取主成分得分前三的數據特征的艙內溫度、環境溫度及偏航位置3組指標,通過可視化視圖顯示Bi-LSTM訓練集數據的預測結果。圖5、圖6和圖7分別展示了預處理后的機艙溫度、環境溫度及偏航位置預測值和實際值走勢。從圖中可看出,預測值和實際值具有較高的重合度,說明所提方法Bi-LSTM預測模型有效性。

圖5 艙內溫度真實值與預測值對比

圖6 環境溫度真實值與預測值對比

圖7 偏航位置真實值與預測值對比
為進一步說明采用Bi-LSTM預測模型的準確性,采用表2中的3種誤差函數作為模型評價指標[17]。

表2 誤差函數
誤差函數的公式如下:
1)平均絕對誤差(mean absolute error, MAE)
(23)
2)平均絕對百分比誤差(mean absolute percentage error,MAPE)
(24)
3)均方根誤差(root mean square error,RMSE)
(25)

通過測試集數據預測結果,選取艙內溫度為例,對比Bi-LSTM與其他3種預測模型的MAE、MAPE和RMSE評價指標,如表3所示。所采用的Bi-LSTM模型評價指標均優于其他兩種模型,由此可見Bi-LSTM預測準確性更好。

表3 4種預測模型的性能指標結果
基于Bi-LSTM和SVM的風機葉片短期覆冰狀態預測模型,自動判斷未來一段時間內是否會出現風機葉片覆冰故障。首先,分別從2000組正常工況和覆冰工況預測數據集中各挑選300組標簽數據,將標簽數據輸入SVM模型進行深度訓練,將覆冰工況下每組數據的訓練值標記為1,正常工況下每組數據的訓練值標記為0。當SVM模型訓練完成后,通過將真實數據輸入Bi-LSTM預測模型,再將預測輸出值輸入SVM模型,對應可得到一個在0.5左右的聚類輸出值,若輸出值大于0.5,則判斷1,狀態為覆冰;若輸出值小于0.5,則判斷為0,狀態為正常。
從實際數據集中各挑選40組正常和覆冰工況下的數據輸入Bi-LSTM狀態預測模型,得到艙內溫度、環境溫度及偏航位置的預測值,將其輸入SVM分類模型,最后根據預測輸出值判斷風機葉片覆冰狀態,基于Bi-LSTM和SVM狀態預測模型輸出結果最終只有4組數據發生誤判,76組預測輸出為正確。通過此實驗可以得出,所提的預測方法準確率為95.0%。
以某風電場風電機組SCADA數據為基礎,提出了一種基于Bi-LSTM和SVM的風機葉片覆冰狀態預測模型,通過大量歷史數據對Bi-LSTM預測模型及SVM模型進行訓練,Bi-LSTM預測可以得到更好的預測效果。此外,結合實際數據,對風機葉片未來一段時間是否會出現覆冰故障進行預測,預測結果表明所提的方法正確率可以達到95.0%,在準確性和時效性上要強于其他傳統方法。進一步地,當獲得新的實際數據后,預測模型可以繼續對訓練集進行擴展,進而提高預測準確率。同時可以為風機葉片覆冰狀態預測提供可靠的決策依據,確保風電場在嚴寒季節能安全經濟運行。