(東方電氣新能科技(成都)有限公司,四川德陽 618000)
隨著我國風力發電的大力推廣和平價上網的逐步推行,風電行業尤其是各主機廠,不得不開始關注成本。降本,除了降低制造成本,運行和維護(以下簡稱運維)成本也是不得不考慮的點。其中,大部件更換成本從幾萬到上百萬不等。受設計、制造工藝以及后期運維質量影響,實際上,大部件的更換頻率并不低。
為了降低這部分費用,各大主機廠家、諸多高校和一些業主都在進行故障早期預警相關的研究。如,劉軒的《風力發電機溫升故障預警方法研究》[6]、陸超的《基于EEMD-PCA的風電軸承故障預警方法》[7]等。在基于SCADA數據進行的研究方面,大數據、神經網絡等技術均得到相關應用,如文獻[2,8]。劉軒的《風力發電機溫升故障預警方法研究》提出了一種加權主成分分析法,解決了傳統主成分分析法沒有考慮各主成分的權重問題。但沒有考慮到,溫度轉速等模擬量并非0-1這樣的狀態量,即沒有考慮時間累加效應。此外,分類算法在故障識別中也得到大量應用,如文獻[9-10]。然而,分類算法依賴大量可靠的標記樣本,這樣的樣本并不容易大量獲取。這無疑增加了實現的難度。因此,本研究將在已有研究基礎上,從實際應用的角度,提出一種結合相關性分析、長短期記憶及正態分布思想的風力發電機故障預測解決方案,并進行實際應用。
為方便驗證預測方案的有效性,應選擇發生過主要部件(如主軸承)溫度異常機組從故障時刻(包含)往前一個月的數據以及該機組此前穩定運行期間至少一年的數據。數據的粒度為10分鐘一個點。
SCADA數據在產生和存儲過程中均可能異常。如,傳感器松動極易產生瞬間極大值。因此,必須對極端數據進行清洗。首先求得每一維數據的上下四分位數,再通過四分位數求得上下邊界,完成對異常數據的清洗。公式如下:

其中,k∈[1.5,3],與數據的集中程度有關,這里我們取k=1.5。upq,lowq分別是排序后的上下四分位數。uplimit,lowlimit是求出的上下邊界,即合理的數據應在上下邊界內。對邊界外的數據進行剔除。
一臺機組上的傳感器有幾十到上百個,數據就可能達到上百維。輸入維度過大不僅會導致模型過大,同時還會造成精度下降。因此,必須進行有效的特征選擇。首先,基于經驗[11]選取針對具體部件溫度的相關性較大的若干維度數據。假設要監測的部位是主軸后軸承,根據經驗,我們可以大致選出風速、功率、環境溫度、機艙溫度、轉速、主軸前軸承溫度這些相關量。
再利用相關性分析對上一步選取的經驗維度進行進一步的分析,實現進一步降維。相關性計算采用的是皮爾遜相關系數。

圖1中,區域顏色越藍,表示兩兩相關性越強。由圖1可知,與主軸后軸承溫度相關性由強到弱的量分別是前軸承溫度->機艙溫度->環境溫度->轉速->功率->風速。顯然,我們應首先剔除風速這個最不相關的變量。

圖1 輸入數據各維度相關性Fig.1 Correlation of various dimensions of input data
此外,環境溫度和機艙溫度存在很強的相關性,并且,軸承的直接外環境是機艙,因此,我們可以進一步剔除環境溫度這一變量。最后,基于實際應用場景,我們對前后軸承均需要實施監測。因此,前后軸承溫度不宜作為彼此輸入參數。針對主軸后軸承溫度,我們最終使用機艙溫度,功率和轉速作為輸入數據。
由于各輸入數據的數值范圍差異較大,因此,有必要進行歸一化處理。歸一化能加快收斂速度,在一定程度上能提高模型精度。由于數據基本滿足正態分布,本項目采用的是均值方差歸一化。

圖2 LSTM 網絡結構示意圖Fig.2 Schematic diagram of LSTM network structure

長短期記憶(Long Short-Term Memory),簡稱LSTM。是在循環神經網絡(Recurrent neural Network)的基礎上,增加了時間序列上各時刻數據的不同權重。解決傳統循環神經網絡梯度可能會消失的問題。(如圖2)
本文使用多層LSTM,輸入為前文確定的機艙溫度、功率、轉速,輸出為主軸后軸承溫度。使用數據為貴州遵義某風場11#機組歷史運行數據,選擇2019年全年數據作為訓練和測試樣本。使用參數搜索算法,設定網絡層數在2~12層之間,初始學習率0.0005~0.01之間,優化控制器采用Adam和SGD,隨機生成8組參數組合。最終發現,在本問題下,最佳網絡層數為4層,最佳學習率為0.001,優化器Adam比SGD更容易收斂。
該機組在7月14日由監控系統發出主軸后軸承高溫報警信號,溫度超過設定限制50℃。因此,選擇2020年5月至7月16日數據作為驗證集。
理論上,在給定工況下,部件溫度應該符合某一正態分布。進而,實際值與預測值(理論值)的差值(以下簡稱殘差)也應符合正態分布。圖3為訓練集上殘差分布直方圖。
由圖3可知,實際殘差基本符合均值為0的某一正態分布。基于小概率事件基本思想[3],通過查概率表可知,殘差落在(μ-3σ,μ+3σ)以外的概率小于千分之三,殘差落在(μ-2σ,μ+2σ)以外的概率小于百分之三。這里,我們只關心溫升,即實際值超過理論值。因此,將μ+2σ作為初級預警線,將μ+3σ作為嚴重警告線。

圖3 訓練集上殘差分布直方圖Fig.3 Histogram of residual distribution on the training set
使用訓練好的模型預測理論溫度值,并計算實際值與健康值之間的殘差。繪制殘差曲線,如圖4。

圖4 測試集上殘差隨時間變化曲線Fig.4 The residuals on the test set change with time
從圖中可以明顯看出故障發展的趨勢。早期殘差基本處在“初級預警”線下,即實際數據和理論健康數據很接近。后期逐漸突破“初級預警線”(黃色),直至突破“嚴重警告線”(紅色)。同時,可以看到,使用此模型可以讓我們提前兩三個月發現故障趨勢。(圖中紅色箭頭所指位置為實際故障報警時刻)
基于此方法,我們快速搭建了模型批量訓練的平臺。開發了基于實時數據采集、預警的軟件,并配套開發了可視化界面。目前已在超過5個風場部署運行,界面示如圖5。

圖5 產品應用某界面Fig.5 A certain interface of product application
提出了一種基于經驗和相關性分析的特征選擇方法,一種結合循環神經網絡和正態分布的小概率事件思想的故障早期預測方法。并在此基礎上,對方法進行了實際應用。
本項目未針對時間序列的長度對預測準確性的影響展開研究。在兼顧高效性能的前提下,尋找這一長度值。
此外,在理論上,訓練集為機組健康狀況下運行數據。相近環境中的相同機型應可以共用模型。以上兩點值得進一步研究。