黃 昊, 易靈芝, 詹 俊
1(湘潭大學, 湘潭 411105)
2(湖南優利泰克自動化系統有限公司, 長沙 410205)
風力發電是目前技術最成熟、最具規模化開發條件的新能源發電方式之一, 因其清潔、高效、可再生等優點, 受到世界各國的重視. 風電機組是制約風電發展的主要因素之一, 其良好的發電性能是保證風力發電企業生產運行管理和發展戰略規劃的決定因素[1].
在風電迅猛發展的同時, 風機高額的運行維護成本影響了業內的經濟效益.風場一般地處偏遠、環境惡劣, 并且機艙位于50~80 m以上的高空, 給機組的維護維修工作造成了困難, 增加了機組的運行維護成本. 對于20年工作壽命的機組, 運行維護成本估計占整個風場收入的10%~15%; 對于海上風場, 用于風機運行維護的成本高達風場收入的20%~25%[2,3]. 高額的運行維護費用增加了業內的運營成本, 大大降低了風力發電的實際經濟效益.
目前很多企業通常使用SCADA系統采集多臺風電機組各部件的狀態、屬性數據, 不同機型記錄的信號范圍和類型可以相差很大, 這樣的SCADA系統融入到整個風電場中為降低損失、提高效益提供幫助[4].考慮到SCADA系統實際采集到的數據復雜化的特點,傳統數據預處理的清洗方法普遍缺乏通用性, 且當存在多輸入參數多維度或者缺少歷史訓練數據時, 大部分用于數據預處理的清洗方法失效[5,6]. 定子溫度的實測曲線分布雜亂無序, 無法直接用于風機部件的狀態分析. 在國內外風電領域中, 應用較為廣泛的聚類、統計分析等數據方法, 但其清洗過程較為繁瑣且條件苛刻, 且仍需要針對風機機組具體的分部件進行數據處理, 會顯得力不從心, 加上風電機組所處的環境導致各種因素的變化無常, SCADA系統所采集的相關數據并不能直接用來進行曲線分析, 需要一種有效且通用性強的預處理算法對其進行清洗.
發電機是風力發電機組的核心部件, 負責將經由風速導致的旋轉的機械能轉化為電能, 并為電氣系統供電. 發電機長期運行于環境變化不定和電磁環繞中,容易發生故障. 常見的故障有發電機振動過大、發電機過熱、軸承過熱、轉子/定子線圈短路、定子溫度過高等. 據統計, 在發電機所有故障中, 軸承故障率為40%, 定子的故障率為38%, 轉子的故障率為10%, 其他故障占12%[7,8].
只有經歷過清洗預處理之后的曲線方能準確地反應發電機定子溫度的狀態, 因此在風電機組性能分析中, 對原始的SCADA數據進行清洗預處理極其重要.固為了提高對發電機定子的溫度狀態研究的可靠性,本文提出了一種用于曲線分析的改進最優組方差算法.該算法只需要對發電機定子溫度和定子溫度的相關參數進行分析, 不僅僅改變了傳統算法對多維度參數的依賴性, 還能夠準確的發現定子溫度的非正常點, 為發電機的維護提供了準確的數據支持.
本文主要針對部件為發電機定子的溫度, 必然需要定子溫度的相關參數和定子溫度形成曲線進行分析.據了解[9], 發電機定子溫度與電流、線圈繞組及銅耗有關:

其中, ω為該發電機的相數(單相或三相), I為發電機電流, R為定子電阻, 發熱量Q≈P.
根據式(1)得知, 發電機電流I是SCADA系統能夠采集的數據, 而R即繞組在本文默認為固定值, ω為三相. 由此得知, 銅耗P銅與發電機電流密切相關, 而定子溫度與銅耗保持絕對的關系, 即發電機定子溫度的狀態與發電機電流I直接相關.
而作為定子溫度的主要相關因素的發電機電流,將和定子溫度形成的數據集通過預處理算法進行數據清洗. 只需分別將定子溫度與發電機電流等相關參數通過改進的最優組方差算法[10]和神經網絡[11–13]工具箱進行分析, 不僅改變了傳統分析方法對繁雜數據的依賴性, 而且通過現有SCADA采集的數據能夠準確識別出發電機定子非正常溫度, 為發電機定子溫度的狀態監測提供可靠的數據支持. 實例分析表明, 使用該方法能夠對定子溫度的相關參數進行清洗預處理, 具有很好的通用性, 有助于實現風力發電機定子溫度的狀態監測及后期的準確診斷與評估, 同時增強風電機組運行穩定性、降低維護成本、提高發電量和經濟效益,均有重要意義.
最優組內方差(Optimal Interclass Variance, OIV)算法要解決的問題就是如何快速、準確地對數據集U進行清洗, 識別出發電機定子溫度正常和非正常的數據集, 再進一步保留正常、剔除非正常, 這實際上是個數據預處理的問題.

原最優組方差(OIV)算法公式為:

其中,yj為j個點的定子溫度為第1到第γ個點的定子溫度平均數,γ為常數;為定子溫度平均滑差值,S為方差閾值.
令發電機電流區間t=0, 1, 2,…,W, 其中W是發電機電流區間總數, 電流區間間隔T默認取5A; 在某個電流區間內, 當且僅當滿足式(3)時認為定子溫度正常, 則有:

式中,Un(t)是第t個發電機電流區間的正常數據集;U1(t)是第t個發電機電流區間的非正常數據集.
最后, 對每個電流區間的數據處理結果進行歸類整理, 得到發電機定子總的正常數據集和非正常數據集:

輸出曲線反應了定子的狀態, 為形象說明OIV算法的思想和求解特點, 下面以一臺風電機組中發電機定子的實測溫度曲線單月份的數據集為例來進一步說明. 發電機定子實測溫度曲線分布如圖1所示.
取電流區間間隔T=5 A, 暫時實驗以方差閾值根據電流區間可將原始數據集劃分為37個狀態量, 有由于每個狀態量的求解過程相似, 這里僅以10號狀態量為例進行詳細說明, 同時結合5號、20號區間繪制散點分布圖供輔助說明.

圖1 定子溫度曲線圖

表1 區間10處理后的部分數據
根據式(3)計算小于閾值S的最大γ, 通過定義的公式(4)得到10號區間的閾值S為13.8504, 即計算小于13.8504的最大γ=84, 對應S為13.885 86, 從而由此得到以(84, 13.885 86)為臨界點, 可劃分兩個數據集.如圖2所示, 由5、10、20區間分別通過這種方法共同繪制的散點圖, 可以清晰地看到兩種數據集的劃分.
通過分析大量的測試數據后, 如圖3所示, 是結合全部區間進行OIV算法的散點圖, 可以通過灰度值的不同直觀由S閾值劃分的兩種數據集.
根據上述的式(3)、(4), 發電機電流范圍0~183 A,以每5 A進行區域分隔, 其中I≥180為U(36)區域, 通過定義再對正常與非正常進行劃分.

圖2 定子溫度5、10、20號分區圖

圖3 時候定子溫度曲線圖
為了得到閾值S在這些數據中最合適的值, 結合圖3發現圖中散點的上限和下限都存在較為分散的數據點, 方差閾值S在原來OIV算法的基礎上進行改進,設n1、n2為波動的百分比, 方差閾值S則定義為:

并對OIV算法式(3)改進為:

通過以上推論得到主要改進的公式:

其中,i=1或2,ni∈(–1, 1),S1與S2即為整個數據集的方差閾值上下限.yj為j個點的定子溫度為第1到第γ個點的定子溫度平均數,γ為常數.
根據SCADA系統所采集的數據, 發電機電流是最能影響發電機定子溫度的參數, 在未進行數據清洗的情況下, 輸入參數只有發電機電流所測試的MSE結果為21.6341左右, 這時考慮到發電機外界因素環境溫度的影響, 進行一次輸入參數為發電機電流和環境溫度所測試的MSE結果為12.5506左右, 相比單輸入參數, 數據集在精度上得到了明顯的提升.
根據上文中提到的方法和方差閾值S, 首先通過式(10)、式(11)和式(12)調整整個方差閾值上限S2,同時暫時將S1定為0, 再根據為了確定最佳上下限幅值, 通過表2實驗的結果可以看出,上下限幅值不宜過高, 按照原定的0~1(100%)為最優上下限幅值.

表2 設定上下限幅值后方差閾值實驗結果
為了更進一步地降低MSE值, 開始表3的實驗.

表3 調整方差閾值S下限后的實驗結果
由表3可見當確定了方差閾值的下限, 整體的MSE得到了明顯的下降, 該數據集的精度和使用可靠性也提高了不少.
接下來需要對本文中的改進OIV算法進行測試,首先從SCADA系統采集的數據進行算法數據清洗,采用神經網絡, 輸入參數為清洗之后的相關特征量和前一時段的發電機定子溫度, 輸出為清洗之后的發電機溫度參數.

圖4 所得到的發電機定子溫度曲線圖
根據式(9)、(10)、(11)、(12)和表3所提供的信息, 為了建立神經網絡模型, 設n1=n2=0.5, 經過改進OIV算法, 得到圖4所示, 提取正常數據集.
為了驗證本文所提到的數據清洗方法OIV算法的精確度, 從風電場SCADA系統中下載了2016年1月1日00時00分00秒至6月31日23時59分59秒的數據進行實驗驗證, 其中包含了發電機電流、環境溫度、發電機定子溫度. 由于數據量過于龐大, 在使用前先按照IEC61400-12的標準進行十分鐘平均化, 所得結果如表4所示, 并結合定子溫度曲線來評估發電機定子的狀態.

表4 風電場SCADA數據經10 min平均化后的數據
將2015年5月的數據作為測試量使用原OIV算法和使用改進OIV算法的兩種情況分別進行的模型測試實驗結果見圖5, 見圖6.
對比圖5和圖6可以看出, 改進OIV清洗后得到的數據集所建立的模型在預測過程中, 可見改進OIV算法的清洗功能的精度高且可靠.
為了確定該模型的可行性, 將此模型進行實時預測, 實時使用的數據量為2017年4月到6月, 如圖7可以看出, 預測值和真實值整體的趨勢非常相似, 再通過如圖8的誤差值可以看出, 這實時三個月期間, 存在那么多處誤差高于2℃的時刻, 并通過SCADA系統實時報備的信息對應, 溫度偏高、定子異常、溫度數據讀取錯誤等異常點信息基本上一一對應, 可見該方法可行.

圖5 進行原OIV清洗直接做的測試結果

圖6 進行改進OIV清洗之后做的測試結果

圖7 實時2017年4月至6月進行的預測波形圖

圖8 實時預測誤差結果圖
為解決發電機定子溫度的預測前期數據預處理復雜的問題, 利用SCADA系統采集相關數據, 結合發電機理論中有關定子的溫度參數, 提出了一種基于風電場SCADA數據定子溫度的預處理算法, 并通過實驗和改進得到了一個較為理想的方法, 得到以下結論.
原有的最優組方差(OIV)算法可以清洗非正常數據集, 提取正常數據集, 但通過實驗表明原有的方差閾值單向區域的定義和實驗結果發現該算法在精度上還不夠, 故將此進行了雙向改進, 定義了S1和S2, 且通過實驗證明了改進OIV更適用于定子溫度預測數據預處理. 對于現有的風電場的條件, 結合SCADA系統采集的數據, 本文所提到的改進最優組內方差算法(OIV),計算過程簡單易懂, 通用性強. 很好的解決了對于龐大的SCADA數據去差取優困難的問題, 加快了整個數據預處理的過程, 結合神經網絡工具箱的測試功能, 為之后的預測及故障診斷工作作出一個很好的基礎.