郭玉立,文澤軍
(湖南科技大學 機械設備健康維護湖南省重點實驗室,湘潭 411201)
開發利用清潔無污染的風能是當今趨勢所在。風電場往往選址在環境復雜多變的高海拔區域,受環境的不確定性因素影響導致風力機產能低下甚至事故頻發。分析影響風力機性能的不確定性因素并依據短期歷史運行數據實現功率的精準預測對風力機狀態預警具有重要意義。
國內外學者圍繞風力機運行狀態的不確定性進行了大量研究:Jordan等[1]采用人工網格機器學習方法,將風切作為輸入參數進行風電機月發電量的預測;張帆等[2]提出一種基于SCADA參數關系的風電機組運行狀態識別方法,采用時間滑動窗口模型進行輸入輸出參數的多項式回歸擬合進行風力機運行狀態識別;梁穎等[3]利用數據挖掘技術考慮風電機組各部分與子系統之間的相互作用與耦合關系,建立風電機組整體運行狀態的評估模型;謝研等[4]利用MATLAB對測風數據進行擬合并驗證了ZephlrLider實時監測數據的實效性;Tinghui等[5]將風向數據轉換成正弦值和余弦值時間序列參數,提出一種風力機偏航范圍最大風能的提??;Luis等[6]利用神經網格建立監測系統進行風力機疲勞載荷預測用于成本效益的替代方案;Yu等[7]提出一種描述時空變化過程特性的時空特征,將風力機采集的數據映射到飛機上根據相對位置行測場景圖并通過深卷積網格應用于風力機發電量的預測;肖桂雨等[8]利用風力機SCADA數據提出一種基于小波分析和神經網格的智能算法通過分析風力機故障信號的特性,從而實現風力機故障診斷與預測;Fouzi等[9]采用決策樹的套袋方法進行風力機發電量預測,此方法具有合并多個模型減少總體誤差的優點;張毅等[10]提出了基于灰色模型的風電功率預測方法,適用于風電系統在線預測;張滕等[11]通過我國西北地區某風場近三年風機失效情況采用貝葉斯估計建立大型風電機可靠性變化模型。以上研究主要是依據風力機SCADA數據的實時運行數據進行在線狀態識別;依據風電場歷史故障數據采用概率統計的方法進行故障率分析與預測。在采用機器學習的方法分析風力機主要輸入因素、基于風力機SCADA系統的歷史小樣本數據實現功率的精準預測方面有待進一步研究。
針對以上不足,本文提出一種基于孿生支持向量回歸的風力機功率預測方法。首先在孿生支持向量回歸中分別采用線性核函數與多項式核函數建立預測模型,參數尋優上采用遺傳算法,并以平均預測精度作為評價指標;基于SCADA數據分析了風力機運行環境的不確定性并確定影響其運行狀態的輸入因素,分析風力機工作原理進行數據預處理并選取能夠直觀的表示風力機性能的輸出因素;以2MW風力機為研究對象分別采用線性核函數與多項式核函數孿生支持向量回歸方法進行功率預測。通過比較平均預測精度得出多項式核函數孿生支持向量回歸預測方法的預測精度較高。實現了依據風力機SCADA系統中歷史小樣本數據對功率的精準預測,對風力機運行狀態預警方面具有重要作用。
孿生支持向量回歸是在孿生支持向量機的基礎上提出的。孿生支持向量機基本思想是在兩類別中產生兩個不平行的超平面,使得每一個超平面盡可能地接近兩類中的一個,并盡可能地遠離另一類;Peng[12]在孿生支持向量機的基礎上提出將兩個不平行的超平面進行分類并構建一對不敏感的上下界函數,使得每個界函數求解過程中計算量大大減小。該方法不僅計算速度快,且具有良好的泛化性。
將風力機的輸入與輸出分別定義為x和y,則樣本集可表示為:(x1,y1),…,(x1,y1),假設樣本是一個n維向量,樣本數為l,將輸入定義為矩陣A=[x1,…xl]T,輸出為Y=[y1,…yl]T;向量e=[1,…,1]T為適應樣本維度的單位向量。其表達式為:

其中:C1,C2是影響因子,ε1,ε2是參數;C1,C2≥0;ε1,ε2≥0;ξ,η是松弛變量。
考慮到樣本可能存在非線性關系,將K定義為非線性核函數,令K(A,AT)是維數為l的核矩陣,其中第(i,j)個元素(i,j=1,2,…l)為式(3)所示。

核函數有線性核函數和多項式核函數表達式分別為式(4)與式(5):

其中:α>0,c>0,d∈N。
利用拉格朗日函數KKT約束條件,將式(1)與式(2)轉化為對偶關系如式(6)和式(7)所示[12]:

其中:H=[K(A,AT),e];f=Y-ε1e;h=Y+ε2e。經計算得式(8)和式(9):

構建風力機輸入的回歸函數如式(10)所示:

孿生支持向量回歸方法中核函數參數尋優上可利用遺傳算法來解決。
遺傳算法是模仿自然界生物進化和遺傳機制發展起來的隨機全局搜索方法,并自適應得控制搜索過程并提供最優的解決方案,首先從目標問題的可能潛在解集的一個種群開始,通過選擇、交叉和相互變異產生新的具有代表解的種群[12]。調取R語言中的GA(Genetic Algorithm)包,設置種群數目為50,迭代次數為100,選取均方差作為迭代過程中的適應度值。
風力機功率作為預測模型的輸出因素。分析孿生支持向量回歸方法的預測功率值與實際功率值的偏差,偏差量占實際功率的比重為預測功率的偏差率。將平均預測精度作為評價兩種預測方法精準度的指標。如式(11)所示:

式中,M為預測功率的平均精度;yt為風力機實際功率值,為預測功率值,N是預測樣本總數。
風力機的工作原理是通過捕獲的風能促使葉輪的旋轉,由旋轉的機械能轉化為電能的能量轉換過程。本文采取的研究對象是我國南方某風電場2MW直驅式風力機。風力機SCADA數據是通過設置在風力機各個重要部位上的傳感器進行在線監測并數據儲存的系統。數據記錄周期從1s~n min,本文采取的SCADA數據是我國南方某風電場秒級記錄的10min內的平均值。風力機SCADA數據記錄的主要參數有:風速、風向、功率、主軸溫度、輪轂轉矩、機艙溫度等。
風力機的自由狀態是指完全不受人為控制的工作狀態。停機狀態是因風力機所處的環境條件不適合工作或其他原因引起的停機;風力機限功率狀態分兩種:1)由于電力系統儲存接近飽滿不能夠接納風力機產生的電能;2)風力機的最高功率為2000W。風力機SCADA數據中以下情況記錄的數據應去除:
1)標準風速3m/s~22m/s以外;
2)停機、維修時的數據。
風力機的輸入因素有風速、風向、環境溫度共3個變量;輸出為功率。選取風力機SCADA系統連續記錄的500組數據,采用機器學習的方法訓練前300組數據,依據后200組數據的輸入并預測其輸出。預測時將輸入作為影響因素,輸出為功率。風力機SCADA數據預處理后選取的500組連續數據中時序-功率折線圖如圖1所示:

圖1 數據篩選后的時序-功率折線圖
歸一化處理是機器學習常用的方法,可以提升計算結果的精度以及減少計算量加快計算速度。功率歸一化如式(12)所示:

其中:yt為風力機功率實際值;ymax為功率最大值;yi為功率歸一化值。歸一化的風力機時序-功率折線圖如圖2所示。

圖2 數據篩選后的時間-功率歸一化折線圖
以R語言為計算工具,抓取風力機SCADA數據中輸入因素:風速、風向和環境溫度;輸出為功率。調取GA包和Psoptim包分別采用遺傳算法進行參數尋優。選取風力機預處理過的SCADA數據中500組數據,訓練前300組預測后200組。預測結果如圖3、圖4所示。

圖3 實際功率與線性核函數預測功率對比圖

圖4 實際功率與多項式核函數預測功率對比圖
由此可知:多項式核函數孿生支持向量回歸方法的預測功率折線與實際功率折線重合度較高,且線性核函數孿生支持向量回歸方法的功率預測精準度與實際功率相比明顯偏低。

圖5 時間-線性核函數與多項式核函數預測功率偏差折線圖
由圖6、圖7可知,隨著環境溫度與風速的增大,多項式核函數孿生支持向量回歸方法預測功率值的偏差量相對于線性核函數孿生支持向量回歸預測方法偏小且總體趨勢較為穩定。

圖6 風速-線性核函數、多項式核函數預測功率偏差散點圖

圖7 環境溫度-線性核函數、多項式核函數預測功率偏差散點圖
分別對比實際功率值與線性核函數、多項式核函數孿生支持向量回歸的預測功率值,以平均預測精度作為評判預測功率精度高低的標準。圖8為線性核函數與多項式核函數孿生支持向量回歸預測方法的預測精度折線圖;表1為兩種預測方法的平均預測精度:

圖8 線性核與多項式核預測精度折線圖

表1 線性核函數與多項式核函數預測精度
以上分析可以看出,線性核函數與多項式核函數孿生支持向量回歸方法并運用遺傳算法進行參數尋優對風力機功率預測的可行性。通過對比平均預測精度得出多項式核函數孿生支持向量回歸預測方法的精準度較高。實現了依據風力機SCADA系統歷史小樣本數據對功率的精準預測。對風力機性能退化、狀態預警等方面帶來幫助。
1)在孿生支持向量機的基礎上選用孿生支持向量回歸,分別采用線性核函數對多項式核函數孿生支持向量回歸預測,參數尋優上運用遺傳算法進行風力機功率預測。
2)分析風力機的性能特性與運行環境,選取SCADA數據中影響風力機運行狀態的輸入因素、能夠直觀的展現出風力機運行狀態的輸出因素。進行數據預處理并提取有效的連續數據。驗證了基于孿生支持向量回歸方法對風力機功率預測可行性,其中多項式核函數孿生支持向量回歸方法預測精度較高。
3)提取風力機SCADA系統中歷史小樣本數據采用機器學習方法實現了對風力機功率的精準預測。將風電場氣象信息作為輸入因素可精準預測風力機的輸出功率。對風力機狀態預警、性能退化等方面具有重要意義。