傅曉駿 孫海龍 章珈寧



摘?要:發電風機葉片結冰故障診斷在國際上現在依舊在研發過程,大多數風力發電廠都是葉片結冰影響運行后進停止發電,用各種方法去冰。針對這一現象,本文設想了一種采用數據驅動型的結冰檢測方法,通過分析SCADA系統采集現場數據,建立結冰預測模型。首先根據工業大數據的特點,在預處理環節,進行剔除奇異值等操作;再通過機理分析,選擇合適特征;最后將特征數據帶入使用粒子群算法優化參數的支持向量機中。實驗表明對葉片結冰預測取得了顯著成果,這可能成為風機葉片結冰狀態預測的新方法。
關鍵詞:風機故障診斷;風力發電;工業大數據;支持向量機
葉片結冰是風電領域的一個全球范圍難題。目前對風力機結冰問題研究上集中在及時發現葉片的結冰情況并在產生影響前除去冰,如果能對葉片結冰進行早期預測,也是防止葉片結冰對風力發電產生影響的重要手段,現在也有通過紅外線檢測葉片溫度數據預測結冰狀態。然而上述這些方法,都需要對葉片進行改造,裝設額外設備,降低了風力發電效率。
SCADA系統在風電行業已廣泛使用,系統每天產生大量的監測數據,而葉片結冰的信息往往蘊含其中,本文設想通過數據驅動角度,對SCADA系統監視數據進行處理,以實現對葉片結冰狀態的檢測和判斷,從過去被動維護轉變為主動維護,且不過分依賴于專業知識。
1 數據預處理
首先刪去訓練集中的已知的無效樣本。
然后采用箱型圖方法可以剔除部分奇異點:
(1)樣本被從小到大排列,按照某個變量;
(2)計算該變量的上四分位數Q2,下四分位數Q1,中位數;
(3)計算上下限:
式中:Δ=Q2-Q1,k為控制限,但k=1.5時得到的奇異值是溫和的,當k=3時得到的奇異值是極端的,這里我們需要極端奇異值;
(4)該變量奇異點所在的樣本被全部刪除;
(5)繼續以上方法計算,直到檢驗完畢所有變量。
2 平衡數據集
通過一般的學習算法所獲得的分類效果經常不夠理想。因此我們嘗試通過在數據層面和算法層面進行創新改進來提升效果。數據層面主要是重采樣技術,比如EasyEnsemble和BalanceCascade兩種知情欠采樣方式,合成少類過采樣技術(SMOTE)技術等等。在算法層面的方法有基于代價敏感(Cost-Sensitive)、基于單類學習(One-Class)、基于主動學習(Active Learning)、基于集成分類算法等幾個方法。
大樣本定長欠采樣和小樣本Smote算法過采樣方法都在本文中被使用,從大數據中摘取有效數據,把結冰和未結冰的樣本數據控制在20000以內,且基本相等。由于從大數據欠采樣到2萬組,任何采樣方法失去很多有價值的樣本,本文結合風力發電機運行實際情況,總結出幾條規則,可以將樣本中明顯不結冰的數據先剔除。
經過上述方法篩選后,去除了約5萬條正常數據的樣本,14萬樣本數量依舊太過龐大,進一步分析,許多樣本之間的表征信息幾乎一致,下一步刪除冗余部分,該過程算法為:
具體過程為:
(1)原始樣本標準化,計算δ值;
(2)計算$x_{i}$和$x_{j}$(j>i)的相似度$R_{ij}$;
(3)定義一合適閾值ε,如果$R_{ij}>\\varepsilon$,刪去樣本$x_{j}$;
(4)重復以上步驟,直到所有樣本檢查完畢。
經過上述步驟后,最后摘取到約2萬組正常有效的樣本。
接下來處理非正常樣本,即我們得到的約1萬結冰樣本數據,為使樣本量增加一倍,我們采用了Smote算法。為達到平衡樣本的目的,在一些位置接近的數量較少的樣本中插入新樣本即是Smote算法的中心思想,以上方法不同于隨機過采樣的將樣本數據簡單復制,而是為避免分類器的過度擬合,通過增加創造出來的樣例。
經過上述一系列操作,訓練集兩類數據一共約4萬組樣本,且數量相等。
3 選擇特征
運行中的風力發電機葉片表面結冰,這是復雜的過程,這一過程受到許多環境因素影響的,想要建立精準的預測風機葉片結冰狀態的數學模型具有很大難度,而采用數據驅動的方法,數量眾多的樣本還有檢測變量,都會使得運算過程十分復雜,并且不能快速確定葉片的結冰狀態。所以,結合風力發電原理以及葉片表面凍結過程,對風機結冰整個過程的特征狀態進行分析,并與機器學習的能力相結合,方可進行有效預測。
所謂風力發電,即風力推動葉片轉動,葉片帶動發電機轉動,利用電磁感應現象產生電能。但是葉片結冰后會改變運動特性,降低風能到電能的轉化效率,雖然電能的產生效率不全依賴風速,但風能與電能的轉化效率在一定程度上可以反映葉片的結冰狀態,結合正常情況和異常結冰數據功率散點和通過數據擬合正常數據獲得理論功率曲線,將該理論功率曲線作為葉片未凍結的理論曲線,把風力發電機實際輸出功率與理論功率的殘差作為特征,通過分析,若兩者的殘差非常大,或者殘差不穩定,表示葉片很大可能已出現結冰故障,需要處理。
從另一方面講,運行中的風機葉片表面出現凍結故障勢必會對風能與電能的轉化效率造成不利影響,以上述方法,第二特征選擇擬合正常轉速曲線計算出的每組數據的轉速殘差。
另外,周圍溫度肯定也是十分重要的因素,溫度這一變量要被著重考慮,通過分析外部溫度與風機內部溫度的差別,我們發現這一差別與風機葉片的是否結冰有著很大的關聯。
通過主成分分析技術,我們可以分析樣本在主成分和非主成分方向的投影,通過這一技術可以進一步構造敏感特征的方法,分析風速和實際功率在非主成分方向的投影。
最終經過分析,把外部溫度,外部溫度,風速,實際功率以及4個衍生變量作為選擇特征。
4 分類器構建及參數優化
本文采用機器學習模型為支持向量機,同時為了尋找最優參數,又引入粒子群算法,借以提高故障識別的性能。以下是計算過程:
在統計學中提出的機器學習方法即是SVM算法,這一算法的基礎是VC維理論和結構最小化原理,通過超強的學習能力克服復雜的數學模型,為有效的解決線性不可分的這一難題引入核函數,這一方法的效果非常顯著。過程可簡單描述為:
我們按照要求取w,b的值。這一過程使該超平面到兩類支持向量的幾何間隔最大,從而目標函數及約束條件寫作:
核函數類型確定之后,結合粒子群算法進行參數C和g尋優。
5 結語
數據驅動學習方法在工業領域有廣泛的應用前景,本文在發電風機葉片結冰領域,針對過去單純依靠機理分析或監控可視化等手段,使用機器學習的方法,首先對現場實際數據進行預處理,然后結合機理分析進行特征提取,最后通過粒子群支持向量機模型實現對葉片結冰的預測。
參考文獻:
[1]田鵬輝,羅衡強,湯亞男.風力機組葉片防覆冰技術發展現狀[J].電器工業,2013,14(5):62-65.
[2]東喬天,金哲巖,楊志剛.風力機結冰問題研究綜述[J].機械設計與制造,2014,52(10):269-272.
[3]梁穎,方瑞明.基于SCADA和支持向量回歸的風電機組狀態在線評估方法[J].電力系統自動化,2013,37(14):7-12.
[4]劉強,秦泗釗.過程工業大數據建模研究展望[J].自動化學報,2016,42(2):161-171.
作者簡介:傅曉駿(1990—?),男,漢族,浙江桐廬人,本科,中級工程師,研究方向:自動化。