周尚珺璽,馬立新
( 上海理工大學 光電信息與計算機工程學院,上海200093)
基于入侵雜草優化算法的支持向量機負荷預測
周尚珺璽,馬立新
( 上海理工大學 光電信息與計算機工程學院,上海200093)
針對支持向量機(Support Vector Machine, SVM)預測方法中的參數選取主要依靠經驗試算實驗比對的方法導致難以快速選擇合適參數從而影響負荷預測精度的問題,研究了將入侵雜草優化算法(Invasive Weed Optimization,IWO)與支持向量機算法相結合的改進算法。提出控制誤差ε的取值,采用入侵雜草尋優算法對懲罰參數C和核函數參數σ進行優化選取,將自動尋優的結果賦給支持向量機,從而實現支持向量機自動尋優。用某市的歷史負荷及相關天氣等信息數據,通過仿真實驗證明了IWO-SVM算法用于短期負荷預測的可行性,以及IWO算法對改善SVM的參數選擇的有效性。平均預測誤差在3%以內,滿足行業要求。
短期負荷預測;支持向量機;入侵雜草優化
電力系統短期負荷預測是維護電網經濟、穩定運行的基礎,是制訂供電計劃、調度計劃和交易計劃的重要依據,基于人工智能技術的神經網絡預測模型和模糊系統預測模型是目前研究較為廣泛的負荷預測模型,但對改善這類模型的泛化能力方面理論進展較慢,因此很多學者開始對具有更好泛化能力的預測技術進行研究。
由 Vanpik 在1995年提出的建立在統計學習理論的VC維理論和結構風險最小原理的基礎上發展出的支持向量機方法,它在解決小樣本、非線性、高維數模式識別等實際問題中有許多優勢。支持向量機方法是根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折中,以獲得最好的泛化能力。近年來基于支持向量機的負荷預測方法被重點關注,文獻[1]全面總結了支持向量機在短期負荷預測中的應用情況,對比了常用的人工神經網絡預測方法,從原理上證明了支持向量機方法的優越性。
在對支持向量機預測方法的研究中發現,該方法的預測性能主要依賴于模型中的參數選擇,而目前對于模型中的參數選擇主要依靠經驗或通過大量實驗比對給定,文獻[2]提出的參數選取方法大多采用交叉驗證(Cross Validation, CV)的方法或憑借經驗給出,總體上具有一定的盲目性,不容易找到函數全局最優值,達不到預期的精度和滿意的效果。因此為了提高支持向量機方法的預測性能,其參數選擇及優化成為了研究的新方向,文獻[3]介紹了支持向量機模型的傳統參數選取方法及優化方法,并在此基礎上提出了基于高斯核函數的參數選取及優化方法,避免了基于交叉檢驗的試探法的盲目性,提高了建模效率。文獻[4-6]分別提出了基于粒子群、遺傳算法優化算法的模型參數選擇方法,克服了傳統參數選擇的缺點,較大地提高了支持向量機的尋優能力,但粒子群容易陷入局部最優解,遺傳算法收斂速度較慢等問題都有待改進。
本文針對SVM傳統的參數選取方法效率較低、影響性能等缺陷,將入侵雜草算法用于支持向量機參數的選取,提出控制誤差ε的取值,采用入侵雜草尋優算法對懲罰參數C和核函數參數σ進行優化選取。入侵雜草算法收斂速度大于粒子群、遺傳算法等,采用子父代競爭排斥機制,避免早熟與陷入局部最優解,該方法將入侵雜草算法自動尋優的結果賦給支持向量機,提高了支持向量機預測精度,為優化支持向量機參數提供了一種新方法。
支持向量機是基于SRM和VC維理論的一種訓練機器學習的算法,其核心包括:(1)通過非線性映射,將低維空間中線性不可分的樣本映射到高維空間中[7],該空間中存在能將樣本的非線性特征進行分割的超平面;(2)基于架構風險最小化原則,尋找一個最優超平面,使得該超平面到不同類的數據點的間隔最大。
支持向量機回歸理論是建立在支持向量機分類問題的基礎上的,通過引入不敏感損失函數ε,將支持向量機分類理論中的結果推廣,使其用于函數回歸。
設有訓練樣本:{xi,di},(i=1,...,n,xi∈Rn,di∈R)。x是輸入向量,d是期望值,采用回歸函數:

式中:φ(x)是從輸入空間映射到高為特征空間的非線性函數。
系數w,b由最小化下式來估計:
(1)
(2)

此時最小化問題為:
(3)
約束條件為:
(4)
由于特征空間維數較高,甚至到無窮維,所以直接求解并不現實,回歸支持向量機通過建立核函數k(xi,xj)來解決維數災難。

(5)

(6)
對拉格朗日函數式求偏導可解得:
(7)
將w表達式代入得:
(8)

根據KKT條件,在最優處滿足拉格朗日乘子與約束式的乘積為零,故有:
(9)
求解可得:
(10)
用支持向量便可求解出b的值,求解出回歸函數。
2.1 雜草特性
大自然中雜草是以細胞繁殖生成種子,通過風、水及動物等形式攜帶種子隨機的散布在田地內,田地里的資源分別被每個種子獨立的使用,并找到合適自己生長的機會空間。由于雜草的生長和繁殖受土地的肥沃營養程度、雜草的聚集密度和雜草群對環境適應性的影響,在雜草繁殖進化的過程中,能更好適應周圍環境的種子會使用更多的土地資源和營養,并能更好更快的成長,結籽(種子)更多,不能很好地適應環境的種子,在長成為植株后結籽(種子)較少,因而植株群落對環境的適應性的提高能夠讓植株的生存能力更頑強,存活的時間更長。植株的自然繁殖進化選擇方式多種多樣,r選擇和k選擇尤為重要,r選擇即是從植物群落中挑選出生命力旺盛、適應性強、成長快速、枯萎塊、競爭力極強的植物,并讓它們擁有占據更多的新領地和新環境;k選擇即是選擇生長和繁殖緩慢、堅韌性強、并讓其去占據有限的環境和資源營養空間。r選擇就是IWO算法的全局搜索方式,k選擇就是IWO算法的局部搜索方式。
2.2 入侵雜草基本理論
入侵雜草優化算法是2006年由Mehrabian和Lucas提出的模擬大自然野草繁殖進化的一種隨機搜索仿生學優化算法。該算法具有收斂性好、魯棒性強、結構簡單、易于編程實現等優點。
該算法以適應度為基準的繁殖機制,繁殖過程中按自然界的繁殖法則,給予不可行的個體生存和繁殖的機會以保留更多有用信息;該算法采用正態分布的擴散機制,同時進行全局搜索和局部搜索,使其具有一定深度同時也不失廣度,并能根據迭代次數不同對二者強度進行調節,同時采用子父代競爭排斥機制,最大限度保留有用信息,避免早熟和陷入局部最優[8-9],算法基本步驟:
第一步:種群初始化。確定種群初始化數量N0和最大種群規模Nmax、最大迭代次數itermax等基本參數。
第二步:生長繁殖。 每個雜草種子根據式中適應度(繁殖能力)產生種子,父代雜草產生的種子個數與母體雜草的適應度成正比,適應度越好,種子繁殖數越多:
(11)
式中:f為當前雜草的適應度值;fmax及fmin分別是當前種群中雜草的最大及最小適應度值;smax及smin分別代表一個雜草能產生的最大及最小種子的數量。
第三步:空間分布。 以父代為均值,子代個體以σ為標準差正態分布擴散在父代個體周圍。迭代過程中,每一代的標準差按如下規律進行變化:
(12)
式中:iter為當前進化的迭代次數;itermax為最大進化迭代次數;σcur為當前的標準差;σinit和σfinal分別是標準差的初始值和最終值;n為非線性調和因子。該式對于iter是遞減的,確定了雜草算法前期是全局搜索為重、后期以局部搜索為重的基本特性。
第四步:競爭淘汰。 經過數代的繁殖后,產生的后代雜草和種子數目將達到預先設定的最大種群數目,然后將父代和子代一起進行排列,按適應值大小進行優勝劣汰。
第五步:重復步驟直至滿足設定的最優解條件或達到最大迭代次數。
入侵雜草-支持向量機是使用入侵雜草優化算法求解支持向量機的參數,解決選擇支持向量機參數選擇沒有理論依據可循的問題,提高支持向量機的學習和推廣能力。用入侵雜草優化算法優化支持向量機的核心思想是:將參數選擇問題視為雜草種群在給定空間的全局搜索問題,入侵雜草優化算法將支持向量機的參數(C,σ)看作是雜草和種子的適應度值,將測試樣本集的平均誤差作為算法結束的判斷條件,實現支持向量機參數的自動優化選取。具體的算法流程圖如圖1所示。

圖1 入侵雜草-支持向量機算法步驟
4.1 輸入樣本選取
文獻[10]對電力負荷周期性的分析可知,預測日前1周及前幾天同一時刻的負荷數據與待預測時刻的負荷關聯度較高,而天氣因素中溫度對短期負荷的影響最大,因此,將預測日前一周與前一日的鄰近時刻負荷數據、溫度數據及相關日類型作為參考影響因子,將其作為輸入對算法進行學習,可得到更準確地預測結果。
為預測1天從0點到23點的實際負荷,分別建立如下的單點負荷預測模型,支持向量機模型輸入量共16個,具體選擇如表1所示。

表1 支持向量機模型輸入量
其中,d代表待預測日,d-1、d-7分別代表待預測日前一天和前一周;L(d-7,t)代表d天t時刻的歷史負荷值;Tmax(d)、Tmin(d)、Tavg(d)分別表示d天最高溫度、最低溫度、平均溫度;D(d)代表d天日類型。
輸出量L(d,t)為d日t時刻的負荷預測值。把預測日前30 d相應的歷史負荷數據、氣象信息和日類型因子作為訓練樣本。
4.2 模型參數選擇
支持向量機核函數選擇RBF函數,雜草入侵優化算法中種群初始化數量:20個;最大種群規模:30個;最大迭代次數:150次;生成種子數量上下限:20-0個;非線性指數:3;問題維數:2;標準差初始值:1;標準差最終值:0.001。
4.3 算例結果
采用SVM與IWO-SVM 2種算法,以MATLAB作為仿真平臺,以某市2012年7月1日到2012年8月31日每天24點的負荷數據、當地氣象因素及對應的日類型作為實驗數據,分別對2012年8月25日至31日進行了次日24點的負荷預測。
對于單日24點負荷預測情況選取8月29日為例進行分析,實際負荷曲線與采用SVM方法建立模型的擬合曲線的對比如圖2所示。

圖2 SVM算法負荷曲線對比
其中,帶圓圈標記的曲線代表真實負荷,帶三角標記的曲線表示SVM預測結果曲線。誤差曲線如圖3所示。

圖3 SVM預測誤差曲線
由圖2、圖3可看出,采用SVM算法的預測結果整體走勢基本與真實值相吻合,最小相對誤差為0.06%,最大相對誤差為5.67%,24點平均相對誤差為 2.375%。
采用IWO-SVM模型進行的單日24點負荷預測情況如表2。

表2 8月27日24點負荷預測

續表2
由表2中數據可看出,采用IWO-SVM算法的預測結果與真實值非常接近,最小相對誤差為0.469%,且預測誤差超過3%的點只有2個,最大相對誤差為3.416%,24點平均相對誤差為1.701%,比SVM算法的精度和穩定性都更好。
采用2種方法對1周7天的負荷進行了預測,每天的平均誤差結果如表3所示。

表3 SVM與IWO-SWM算法預測誤差
由表3可知,SVM和IWO-SVM算法預測的準確度均達到97%,滿足調度部門對于日負荷預測準確率的要求,也說明了2種算法在實際應用中的可行性。比較SVM 與IWO-SVM 2種方法的實驗結果:SVM的預測結果不夠穩定。而IWO-SVM的預測結果誤差相對穩定且預測誤差更小。實驗結果表明:IWO-SVM模型的預測較SVM方法有更高的準確度,證明了IWO尋優算法優化SVM的參數選擇的可行性。
本文針對SVM傳統的參數選取主要依靠經驗試算實驗比對的方法導致難以快速選擇合適參數從而影響負荷預測精度的問題,研究了將入侵雜草優化算法與支持向量機相結合的改進算法。提出控制誤差ε的取值,采用入侵雜草尋優算法對懲罰參數C和核函數參數σ進行優化選取,將自動尋優的結果賦給支持向量機,實現支持向量機自動尋優。通過MATLAB仿真實驗,算例結果表明,入侵雜草算法提高了支持向量機預測精度,有效優化了模型參數,提高模型預測性能。
[1]王奔,冷北雪,張喜海,等.支持向量機在短期負荷預測中的應用概況[J].電力系統及其自動化學報,2011,23(4):115-121.
[2]張倩, 楊耀權. 基于支持向量機核函數的研究[J]. 電力科學與工程,2012,28(5):42-45.
[3]謝宏,魏江平,劉鶴立.短期負荷預測中支持向量機模型的參數選取和優化方法[J].中國電機工程學報,2006,26(22):17-22.
[4]谷文成,柴寶仁,滕艷平.基于粒子群優化算法的支持向量機研究[J].北京理工大學學報,2014,34(7):705-709.
[5]王瓊瑤,何友全,彭小玲.基于改進遺傳算法的支持向量機參數優化方法[J].計算機與現代化,2015(3):33-36.
[6]郭克友,郭曉麗,王藝偉,等.SVM參數優化方法分析與決策[J].計算機測量與控制,2016,24(6):255-259.
[7]曾繁耀,黃昭榮.短期電網負荷預測方法研究[J].自動化與儀器儀表,2016(8):84-86.
[8]周金虎. 基于入侵雜草算法的數據挖掘聚類算法研究[D].蘭州:蘭州理工大學,2014.
[9]左旭坤,蘇守寶.多子群入侵雜草優化算法研究及應用[J].計算機工程,2014,40(2):184-188.
[10]馬立新,李淵.日最大負荷特性分析及預測方法[J]. 電力系統及其自動化學報,2014,26(10):31-34.
Load Forecasting Based on Support Vector Machine Optimize by Invasive Weed Optimization
ZHOU Shangjunxi, MA Lixin
( School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)
Aiming at the problem of the support vector machine(SVM) parameter selection methods rely mainly on the experience calculation and its low efficiency defects, a new method, invasive weed optimization(IWO) algorithm, combining with SVM, is proposed. By controlling the value of error and using IWO algorithm to optimize the punish parameters and kernel parameters, the model is constructed. As the relevant historical load data, weather data and other information of city of Jiangsu Province used as the simulation data, the simulation results prove the feasibility of the SVM algorithm for short-term load forecasting and the effectiveness of the IWO algorithm for improving the parameters of SVM. The experimental results show that the prediction accuracy of this method can meet the industry requirements, with the average error less than 3%.
load forecasting; support vector machine; invasive weed optimization algorithm
10.3969/j.ISSN.1672-0792.2017.02.006
2016-09-13。
上海張江國家自主創新重點資助項目(201310-PI-B2-008)。
TM715
A
1672-0792(2017)02-0035-06
周尚珺璽(1992-),女,碩士研究生,研究方向為電力負荷預測及電力營銷。
馬立新(1960-),男,教授,主要從事電力系統分析與優化運行,智能電網與智能科學,電氣設備狀態監測與診斷方法,電能質量監控與能效測評技術,風光發電智能控制系統方面的研究。