張建秋
摘 要:該文使用支持向量機中的兩種核函數,采用grid-search算法、遺傳算法、粒子群算法優化參數,建立對吉林市某小區燃氣管網日負荷預測的支持向量機模型。將日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡作為燃氣管網日負荷變化密切相關的主要影響因素,分別作為支持向量機的輸入量,將小區人員臨時出差、小區臨時增加暫住人口等隨機因素作為燃氣管網日負荷變化密切相關的次要影響因素,將隨機因素統一歸為支持向量機的一個輸入量。采用[0,1]歸一化方法,對作為影響因素的輸入量數據與日負荷預測輸出量數據進行歸一化處理。對節假日和工作日的燃氣管網日負荷預測采用獨立處理方法,避免了相互之間的干擾影響。試驗結果表明,采用徑向基核函數的支持向量機預測模型對燃氣管網日負荷預測擬合程度達到90%以上。
關鍵詞:燃氣管網 支持向量機 日負荷預測
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0099-04
城市小區燃氣管網的日負荷指標是城市燃氣的基礎工作,對分析燃氣管網的年負荷、月負荷具有重要指導意義,并且燃氣經營企業對燃氣管網的日負荷及預測情況日益重視[1]。燃氣管網日負荷數據的變化規律十分復雜,主要同天氣、氣溫、終端用戶人口數量等因素密切相關,并且國家法定節假日的日負荷變化與工作日亦不相同。傳統的燃氣管網日負荷預測方法主要有回歸綜合位移平均模型、多元主要有線性回歸法、三角函數模型、BP神經網絡法等[2],試驗結果表明這些預測方法具有一定的精度[3-5]。但上述方法所需樣本數據較多,并且樣本數據越多,上述方法得到的預測模型泛化能力越強,可信度越高。
支持向量機(SVM)是機器學習研究重大成果,其具有泛化能力強、全局尋優的特點,尤其具有所需樣本數據少的特點[6]。SVM利用松弛變量和核函數[7],針對樣本數據線性不可分的情況,在高維空間尋找其最優分類面。
該文將吉林市某小區燃氣管網的日負荷作為研究對象,將燃氣管網日負荷變化密切相關的主要影響因素——日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡,作為SVM的6個輸入量,將燃氣管網日負荷變化密切相關的次要影響因素——小區人員臨時出差、小區臨時增加暫住人口等隨機因素,統一作為SVM的1個輸入量,利用不同核函數、不同參數的支持向量機建立吉林市某小區燃氣管網日負荷預測模型,通過該預測模型得到該小區的燃氣管網日負荷預測值。
1 支持向量機
1.1 支持向量機原理
設表示線性函數,其表達式為: (1.1)
其中:為偏置,為可調權值向量,決策規則:,將稱為超平面(Hyper Plane)。由式定義超平面L,L將輸入空間X劃分成兩部分,如圖1所示。
顯然,有許多分類超平面可以將圖1中的“圓圈”和“五角星”兩類點正確區分開。
取訓練樣本{},其中:為第i個樣本,。對于線性可分訓練集存在超平面L:,即式1.2和式1.3。
, (1.2)
, (1.3)
定義超平面L1:,,設為超平面L1上的一點;超平面L2:,,為超平面L2上的一點。和滿足式1.4和式1.5。
(1.4)
(1.5)
超平面L1與超平面L2之間間隔為式1.6。
(1.6)
尋找超平面L1和L2間隔最大化的平面——最優超平面,即為二次規劃問題,如式1.7和式1.8所示。
(1.7)
s.t (1.8)
利用lagrange乘子法解決上述二次規劃問題,建立lagrange函數如式1.9所示。
(1.9)
其中為lagrange乘子。
將lagrange函數對,求其最小值,對求其最大值,解、和在函數的鞍點上滿足式1.10和式1.11。
(1.10)
(1.11)
將式1.10代入lagrange函數式1.9,利用式1.11可得原優化問題的對偶問題,可構造出最優超平面,如式1.12、式1.13和式1.14所示。
(1.12)
s.t. (1.13)
(1.14)
基于最優超平面的分類規則如式1.15所示。
(1.15)
1.2 核函數
對于二維空間的線性不可分數據群,為構造最優超平面,其函數表達式如式1.16所示。
(1.16)
構造向量y和a,如式1.17和式1.18所示。
(1.17)
(1.18)
可轉化為,即式1.19。
(1.19)
可見,映射到四維空間后,原來在二維空間中一個線性不可分的問題變成了線性可分,構造函數,其滿足式1.20和式1.21。
(1.20)
(1.21)
其中,為低維空間多維常量,為低維空間多維變量,為由映射到高維空間的對應常量,為由映射到高維空間的對應向量。
若只需將低維空間的輸入代入式1.20,計算即可得到高維空間的線性分類函數,則函數稱為核函數,能使得上述式1.20和式1.21中的兩個函數計算結果完全一致。
2 燃氣管網日負荷的影響因素及數據處理
本文以吉林市某小區燃氣管網日負荷為研究對象,時間為2012年9月份非節假日和節假日,非節假日的時間跨度為2012年9月份工作日,即9月3日至9月7日、9月10日至9月14日、9月17日至9月21日、9月24日至9月29日,節假日的時間跨度為2012年9月份中的部分法定節假日,取9月8日、9日、15日、16日、22日、23日、30日。將日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡作為影響小區燃氣管網日負荷的主要因素,分別作為SVM的6個輸入量。將小區人員臨時出差、小區臨時增加暫住人口等隨機因素作為影響小區燃氣管網日負荷的次要因素,采用隨機變量法統一作為SVM的1個輸入量。將小區燃氣管網日負荷實際消耗量作為SVM的輸出量。由于溫度、人員數量、人員年齡等數據單位不同,會引起數據數量級差異,本文對日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡、隨機因素、日負荷實際消耗量的數據進行[0,1]歸一化,使所測數據歸為一個數量級。工作日和節假日中小區燃氣管網日負荷影響因素的歸一化數據,分別如圖2和圖3所示。endprint
3 建立小區燃氣管網日負荷的預測模型
3.1 支持向量機建模
本文采用多項式核函數(polynomial核函數),徑向基核函數(radial basis function核函數),懲罰參數c和gamma值采用grid-search算法、遺傳算法(GA)、粒子群算法(PSO)進行參數尋優。對以上組合所建立的不同支持向量模型進行交叉試驗,尋求最優預測模型。利用該模型對工作日和節假日的小區燃氣管網日負荷進行預測。
3.2 試驗結果分析
尋求工作日小區燃氣管網日負荷最優預測模型階段,訓練集時間跨度為9月3日至9月7日、9月10日至9月14日、9月17日至9月21日,預測集時間跨度為9月24日至9月29日;尋求節假日小區燃氣管網日負荷最優預測模型階段,訓練集時間跨度為9月8日、9日、15日、16日、22日,預測集時間跨度為9月23日、30日。訓練集和預測集的數據為日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡、隨機因素、日負荷實際值。利用支持向量機中polynomial核函數和radial basis function核函數(RBF)、優化方法采用grid-search算法、遺傳算法(GA)、粒子群算法(PSO)。對工作日、節假日小區燃氣管網日負荷產生的預測效果分別見表1和表2。
由表1可見,采用radial basis function核函數和PSO優化算法的模型,可以實現工作日小區燃氣管網日負荷預測集的擬合程度最高,達到了90.781 %。預測結果如圖4、圖5所示。
由表2可見,采用polynomial核函數和PSO優化算法的模型,可以實現節假日小區燃氣管網日負荷預測集的擬合程度最高,達到了92.538 %。預測結果如圖6、圖7所示。
可見,支持向量機采用radial basis function核函數和PSO優化算法時,對工作日小區燃氣管網日負荷預測集的擬合程度最高;采用polynomial核函數和PSO優化算法時,對節假日小區燃氣管網日負荷預測集的擬合程度最高,均高于90%。
4 結語
該文采用多項式核函數、徑向基核函數,利用支持向量機對吉林市某小區工作日、節假日的燃氣管網日負荷建立預測模型,模型參數采用grid-search算法、遺傳算法、粒子群算法進行優化,將日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡作為影響小區燃氣管網日負荷的主要因素,將小區人員臨時出差、小區臨時增加暫住人口等隨機因素作為影響小區燃氣管網日負荷的次要因素,主要因素與次要因素統一作為SVM的輸入量,日負荷預測值作為SVM的輸出量。試驗結果表明,采用支持向量機建立的城市小區燃氣管網日負荷預測模型,其預測精度達到90%以上,為城市小區燃氣管網年負荷、月負荷的進一步分析提供了理論依據、技術支持和試驗方法。
參考文獻
[1] 譚羽非.城市燃氣管網日負荷預測的灰色神經網絡模型[J].哈爾濱工業大學學報,2003,35(6):679-682.
[2] 朱剛.城市燃氣管網負荷預測的研究[D].天津大學,2009.
[3] Potocnik, Primoz,Govekar. Short-term natural gas consumption forecasting[J].Proceeding of the International Conference on Applied Simulation and Modelling,2007(5):353-357.
[4] 杜元順.煤氣日負荷用的回歸分析方法[J].煤氣與熱力,1982(4):26-28.
[5] 田一梅,趙元,趙新華.城市煤氣負荷預測[J].煤氣與熱力,1998,18(14):20-23.
[6] 武海巍,于海業,張蕾.光合有效輻射預測模型的核函數組合優化[J].農業機械學報,2011,42(6):167-173.
[7] 武海巍.核函數與仿生智能算法在林下參光環境評價系統中的研究[D].吉林大學,2012.endprint
3 建立小區燃氣管網日負荷的預測模型
3.1 支持向量機建模
本文采用多項式核函數(polynomial核函數),徑向基核函數(radial basis function核函數),懲罰參數c和gamma值采用grid-search算法、遺傳算法(GA)、粒子群算法(PSO)進行參數尋優。對以上組合所建立的不同支持向量模型進行交叉試驗,尋求最優預測模型。利用該模型對工作日和節假日的小區燃氣管網日負荷進行預測。
3.2 試驗結果分析
尋求工作日小區燃氣管網日負荷最優預測模型階段,訓練集時間跨度為9月3日至9月7日、9月10日至9月14日、9月17日至9月21日,預測集時間跨度為9月24日至9月29日;尋求節假日小區燃氣管網日負荷最優預測模型階段,訓練集時間跨度為9月8日、9日、15日、16日、22日,預測集時間跨度為9月23日、30日。訓練集和預測集的數據為日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡、隨機因素、日負荷實際值。利用支持向量機中polynomial核函數和radial basis function核函數(RBF)、優化方法采用grid-search算法、遺傳算法(GA)、粒子群算法(PSO)。對工作日、節假日小區燃氣管網日負荷產生的預測效果分別見表1和表2。
由表1可見,采用radial basis function核函數和PSO優化算法的模型,可以實現工作日小區燃氣管網日負荷預測集的擬合程度最高,達到了90.781 %。預測結果如圖4、圖5所示。
由表2可見,采用polynomial核函數和PSO優化算法的模型,可以實現節假日小區燃氣管網日負荷預測集的擬合程度最高,達到了92.538 %。預測結果如圖6、圖7所示。
可見,支持向量機采用radial basis function核函數和PSO優化算法時,對工作日小區燃氣管網日負荷預測集的擬合程度最高;采用polynomial核函數和PSO優化算法時,對節假日小區燃氣管網日負荷預測集的擬合程度最高,均高于90%。
4 結語
該文采用多項式核函數、徑向基核函數,利用支持向量機對吉林市某小區工作日、節假日的燃氣管網日負荷建立預測模型,模型參數采用grid-search算法、遺傳算法、粒子群算法進行優化,將日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡作為影響小區燃氣管網日負荷的主要因素,將小區人員臨時出差、小區臨時增加暫住人口等隨機因素作為影響小區燃氣管網日負荷的次要因素,主要因素與次要因素統一作為SVM的輸入量,日負荷預測值作為SVM的輸出量。試驗結果表明,采用支持向量機建立的城市小區燃氣管網日負荷預測模型,其預測精度達到90%以上,為城市小區燃氣管網年負荷、月負荷的進一步分析提供了理論依據、技術支持和試驗方法。
參考文獻
[1] 譚羽非.城市燃氣管網日負荷預測的灰色神經網絡模型[J].哈爾濱工業大學學報,2003,35(6):679-682.
[2] 朱剛.城市燃氣管網負荷預測的研究[D].天津大學,2009.
[3] Potocnik, Primoz,Govekar. Short-term natural gas consumption forecasting[J].Proceeding of the International Conference on Applied Simulation and Modelling,2007(5):353-357.
[4] 杜元順.煤氣日負荷用的回歸分析方法[J].煤氣與熱力,1982(4):26-28.
[5] 田一梅,趙元,趙新華.城市煤氣負荷預測[J].煤氣與熱力,1998,18(14):20-23.
[6] 武海巍,于海業,張蕾.光合有效輻射預測模型的核函數組合優化[J].農業機械學報,2011,42(6):167-173.
[7] 武海巍.核函數與仿生智能算法在林下參光環境評價系統中的研究[D].吉林大學,2012.endprint
3 建立小區燃氣管網日負荷的預測模型
3.1 支持向量機建模
本文采用多項式核函數(polynomial核函數),徑向基核函數(radial basis function核函數),懲罰參數c和gamma值采用grid-search算法、遺傳算法(GA)、粒子群算法(PSO)進行參數尋優。對以上組合所建立的不同支持向量模型進行交叉試驗,尋求最優預測模型。利用該模型對工作日和節假日的小區燃氣管網日負荷進行預測。
3.2 試驗結果分析
尋求工作日小區燃氣管網日負荷最優預測模型階段,訓練集時間跨度為9月3日至9月7日、9月10日至9月14日、9月17日至9月21日,預測集時間跨度為9月24日至9月29日;尋求節假日小區燃氣管網日負荷最優預測模型階段,訓練集時間跨度為9月8日、9日、15日、16日、22日,預測集時間跨度為9月23日、30日。訓練集和預測集的數據為日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡、隨機因素、日負荷實際值。利用支持向量機中polynomial核函數和radial basis function核函數(RBF)、優化方法采用grid-search算法、遺傳算法(GA)、粒子群算法(PSO)。對工作日、節假日小區燃氣管網日負荷產生的預測效果分別見表1和表2。
由表1可見,采用radial basis function核函數和PSO優化算法的模型,可以實現工作日小區燃氣管網日負荷預測集的擬合程度最高,達到了90.781 %。預測結果如圖4、圖5所示。
由表2可見,采用polynomial核函數和PSO優化算法的模型,可以實現節假日小區燃氣管網日負荷預測集的擬合程度最高,達到了92.538 %。預測結果如圖6、圖7所示。
可見,支持向量機采用radial basis function核函數和PSO優化算法時,對工作日小區燃氣管網日負荷預測集的擬合程度最高;采用polynomial核函數和PSO優化算法時,對節假日小區燃氣管網日負荷預測集的擬合程度最高,均高于90%。
4 結語
該文采用多項式核函數、徑向基核函數,利用支持向量機對吉林市某小區工作日、節假日的燃氣管網日負荷建立預測模型,模型參數采用grid-search算法、遺傳算法、粒子群算法進行優化,將日最高溫度、日最低溫度、日平均溫度、小區人員最高年齡、小區人員最低年齡、小區人員平均年齡作為影響小區燃氣管網日負荷的主要因素,將小區人員臨時出差、小區臨時增加暫住人口等隨機因素作為影響小區燃氣管網日負荷的次要因素,主要因素與次要因素統一作為SVM的輸入量,日負荷預測值作為SVM的輸出量。試驗結果表明,采用支持向量機建立的城市小區燃氣管網日負荷預測模型,其預測精度達到90%以上,為城市小區燃氣管網年負荷、月負荷的進一步分析提供了理論依據、技術支持和試驗方法。
參考文獻
[1] 譚羽非.城市燃氣管網日負荷預測的灰色神經網絡模型[J].哈爾濱工業大學學報,2003,35(6):679-682.
[2] 朱剛.城市燃氣管網負荷預測的研究[D].天津大學,2009.
[3] Potocnik, Primoz,Govekar. Short-term natural gas consumption forecasting[J].Proceeding of the International Conference on Applied Simulation and Modelling,2007(5):353-357.
[4] 杜元順.煤氣日負荷用的回歸分析方法[J].煤氣與熱力,1982(4):26-28.
[5] 田一梅,趙元,趙新華.城市煤氣負荷預測[J].煤氣與熱力,1998,18(14):20-23.
[6] 武海巍,于海業,張蕾.光合有效輻射預測模型的核函數組合優化[J].農業機械學報,2011,42(6):167-173.
[7] 武海巍.核函數與仿生智能算法在林下參光環境評價系統中的研究[D].吉林大學,2012.endprint