朱斌,汪一帆,孫鋼
(國網浙江省電力有限公司營銷服務中心, 杭州 310000)
需求響應(Demand Response,DR)管理作為智能電網的一個關鍵特征,其特點是終端用戶可隨時根據電價的變化調整其用電模式,減少用電費用,提高電網實時運行的可靠性和安全性[1-5]。隨著時代的發展,我國大型建筑物耗電量占全國總耗電量的比重越來越大,要減少建筑物的能耗,就必須通過DR管理在用電高峰時段積極改變其負荷分布[6-8]。然而,建筑的負荷轉移會導致需求側總用電量的變化,進而影響智能電網的運行狀況和動態電價[9-13]。因此,如何在智能電網與需求側交互過程中同時實現兩者效益最大化,是近年來備受關注的問題。
在電網-建筑物雙向交互的研究中,博弈論理論因其能處理多參與方之間復雜的交互關系而被廣泛采用。文獻[14]提出了一種基于住宅建筑能耗的博弈方法,該方法通過響應智能電網提供的實時電價來控制住宅建筑的電力需求,實現終端用戶的電費最小化。但該策略是基于靜態博弈的,即決策是由雙方處于平等地位的電網和建筑同時進行的。然而DR管理的主要目標是提高電網的穩定性與靈活性,在此過程中,智能電網和建筑物地位并不平等,電網處于核心地位,而建筑物處于輔助位置。針對上述問題,文獻[15-16]提出了一種基于Stackelberg博弈的電網與建筑之間的交互策略,利用Stackelberg博弈實現電網的利益最大化。文獻[17]運用兩級博弈提出了一種電網與住宅建筑之間的交互策略,并證明了納什均衡的存在。但以上方法均是從電網(供給側)的角度出發,在進行需求管理時,無法對需求側的利益進行量化,同時也無法處理負荷預測不確定性對交互產生的負面影響。
針對上述問題,本文提出了一種基于博弈論的智能電網與建筑物交互管理策略。本文建立了Stackelberg博弈電網-建筑物交互模型,確定納什均衡,并計算電網的最優動態電價與建筑物的最優電力需求,使電網凈利潤最大化,并減少需求波動,提高電網運行的穩定性。除此之外,本文還提出了一種增強型交互策略,用以解決建筑需求基線預測不準確對策略帶來的負面影響。
隨著可再生能源大規模并網,為應對其間歇性和不可控性所帶來的電力不平衡挑戰,未來的電網運行模式勢必是雙向的,即建筑物具備“電網響應功能”,緩解電網運行的壓力。智能電網與建筑物之間的通信與交互結構,如圖1所示。電網從建筑物中獲取用電信息,然后提前一天或至少提前幾個小時優化電價,以達到預期的電力管理水平,從而實現效益最大化。同時,配備了智能設備(如智能電能表)的建筑可通過響應電網給出的價格信息來使用戶改變其用電行為,從而減少用電費用。除此之外,對于商業和工業建筑,智能電表可以直接與樓宇的自動化系統相連,實現優化用電。隨著智能設備、互聯網通信技術和可再生能源發電的發展,在智能電網和建筑物之間建立雙贏的交互模型,必然是未來的發展方向。

圖1 智能電網與響應式建筑的交互模型結構Fig.1 Structure of interactive model structure between the smart grid and grid-responsive buildings
1.2.1 電網的效益模型
在電網-建筑物交互模型中,電網旨在通過設定電價(即基于價格的需求響應程序)來使利潤最大化并減小需求波動。
電網的利潤是指扣除相應的購電成本和網絡損耗后,將電力賣給建筑物所獲得的凈利潤。在i時段內,電網的凈利潤由售電量和相應的發電成本決定,其計算公式如下:
(1)

(2)
式中N設定為24,即一天被均分為24個時間段,每小時執行一次交互策略。
1.2.2 建筑物的效益模型
在電網-建筑物交互模型中,各類建筑物旨在通過響應電價信息并進行需求轉移,以最大程度地減少用電費用及轉移成本,降低用戶的不滿意度。
用戶不滿意度是指當電力需求受限、偏離正常需求水平時,用戶的不滿意程度。其計算公式如下:
(3)


(4)
式中ρi是描述建筑物i進行需求轉移的成本水平的預設正因子。通常,當電力需求轉移增加時,建筑物的轉移成本也會相應增加。
用電費為建筑物購買一定電量時支付的費用,并扣除相應的轉移成本,其計算公式如下:
(5)

博弈論是博弈雙方各自利用對方的策略變換自己的對抗策略,以達到取勝目的的一種方法[18-21],其主要包含三個因素,即:
i∈{M,R,I}
(6)
式中M為博弈參與者集合;R為策略集;I為支付函數。
在博弈過程中,每個博弈者i∈M都會選擇能使其利益ii∈I最大化的策略ri∈R,因此博弈者們不可避免地會產生利益沖突。例如在電網-建筑物交互模型中,當建筑物為減少其用電費用而進行需求轉移時,電網也會相應調整其價格信息,由此電網與建筑物之間可能會存在部分或完全沖突,而納什均衡便可很好地解決這個問題。

(7)
當博弈達到納什均衡時,任何參與者都無法通過單方面偏離其支配策略而獲得更多利潤。在電網-建筑物交互模型中,當達到納什均衡時,電網和單個建筑物將不會更改其策略,因為它們的各自利益均達到最大化。
在電網-建筑物交互博弈模型中,參與者是電網和建筑物,電網和建筑物的策略分別是制定動態電價和進行建筑物需求管理,電網和建筑物的效益與其各自關注的利益相關。在需求響應管理過程中,電網會設置每度電的價格,并提前向建筑物公布電價信息。然后,建筑物通過改變其電力需求(即進行需求管理)來對給定的價格信息作出響應,以使利益最大化。在此過程中電網首先起作用,然后建筑物根據給定的價格做出決策,這種交互的性質符合Stackelberg博弈。在Stackelberg博弈中,由于建筑物的需求管理基于電網發布的電價信息,因此電網是領導者,建筑物是跟隨者。預設Stackelberg博弈的納什平衡是電網和建筑物的最佳策略組合,如式(8)所示。
(8)


(9)
2.2.1 基于納什平衡的建筑需求管理優化
面對電網給定的電價信息,每棟建筑都希望通過調整一天內各個時段的電力需求來減少其效益損耗。由此,在電網-建筑物交互模型中建筑物的優化問題則轉化為最小化問題。建筑物用電方面的效益損耗主要取決于三個方面,即電費、轉移成本和用戶不滿意度。如式(10)所示,可通過優化電力需求來使建筑物k的效益損耗最小化,并且日總電力需求保持不變,即:
(10)

引入拉格朗日乘子λk來處理式(10)中的約束條件,則建筑物i的優化問題如式(11)所示。
(11)
假設電價f(Df)已知,為獲得建筑物k在需求管理過程中的最優電力需求,對式(11)進行求導,建筑物效益損耗最小化問題的一階最優條件是導數等于0。其計算公式如下所示:
(12)
式(12)的解便是納什均衡的平衡解。

(13)
由式(13)可知,海森矩陣的對角元素均為正值,且非對角因素均為零。因此,海森矩陣為正定矩陣,這意味著當建筑物的最優電力需求處于納什平衡狀態時,可有效地減少其在電網-建筑物交互過程中的效益損耗,使其效益損耗最小化,即建筑物納什平衡的存在性和唯一性得到證實。
2.2.2 基于納什平衡的電網動態定價優化
在電網-建筑物交互過程中,電網旨在通過優化動態電價,在實現凈利潤最大化的同時,減小電力需求波動。因此,電網效益的計算公式如下所示:
(14)
(15)
(16)


(17)

根據電網和建筑物需求管理的效益集和策略集,所提交互管理策略的運行流程如下:
步驟1:電網發布日前動態電價;


步驟4:重復步驟1至步驟3,直到達到納什平衡。
在電網-建筑物交互模型中,建筑物的原始電力需求(即基線)會影響優化后的動態電價和建筑物用電需求。然而,在實際情況中,建筑物的需求基線會提前一天進行預測,并且由于各種不確定性或意外因素,這種預測并不完全準確。預測誤差將會導致博弈的解決方案偏離納什均衡,導致交互策略性能較差。針對這一問題,本文提出了一種考慮建筑物需求基線預測不確定性的改進方案,即增強型電網-建筑物交互策略。假設建筑電力需求的基線預測不確定性服從正態分布,如式(18)所示。
(18)
將基線預測不確定性的期望值作為修正項,以提高所提出的交互策略的魯棒性,如式(19)所示。
(19)
值得注意的是,這種修正并不影響納什平衡的存在性。通過對Stackelberg博弈解決方案的修正,增強型交互策略確定的建筑物最優電力需求和電網最優動態價格分別如式(20)和式(21)所示。其中,rev表示修正后的情況。
(20)
(21)
為驗證所提策略的有效性,本文選取某園區作為電網交互區域,并對園區內建筑物的各種數據進行采集與驗證,估算電網和建筑物的收益。該園區包含12個具有不同功能的建筑物。園區全年的電力需求都相當高,因此電力方面的效益損耗也很高。電網把收取的電費分成四個帳戶,每個帳戶所包含的建筑物如表1所示。

表1 建筑物的建筑面積與功能Tab.1 Floor areas and functions of buildings
在本研究中,電網的動態價格是根據博弈論提前一天進行優化確定的。本文將一天分為24個大小相等的時間段,即每個小時為一個時間段。發電成本系數α、β、γ分別設置為50元/(MW·h)、10元/(MW·h)、0元/(MW·h)。建筑物需求基線預測不確定性的平均值和標準偏差分別設置為0.001 9和0.123 4。本文以浙江省實施的分時電價作為優化動態電價的約束條件。浙江省分時電價的詳細信息如表2所示。在每個時段,將浙江省分時電價對應值的+50%和-30%作為優化動態價格的上下界。

表2 浙江省實施的分時電價Tab.2 Time-of-use price implemented in Zhejiang province
本文選取兩周內10個工作日的數據,在考慮建筑物電力需求基線預測不準確性的情況下,分別分析基于Stackelberg博弈的基本交互策略與增強型交互策略對電網與建筑物效益的影響,并通過增強型交互策略確定納什均衡,得出建筑物的最優電力需求與電網的最優動態電價。
3.2.1 電網價格優化
在建筑物電力需求基線預測不準確的情況下,分別使用基于Stackelberg博弈的基本交互策略和增強型交互策略對電網10個工作日的動態電價進行優化,優化結果如圖2所示。(不同交互策略下各時段的動態價格均處于博弈理論的個體納什均衡狀態)從圖中可以看出,建筑物電力需求基線預測的不確定性會導致動態電價的優化偏離納什均衡,削弱了基本交互策略的有效性。因此,如果未適當考慮和解決此類不確定性問題,將會大大降低電網和建筑物的收益。

圖2 不同交互策略下的電網動態電價Fig.2 Dynamic electricity price of power grid under different interaction strategies
電網在使用不同交互策略后,十個測試日內平均每天的收益如表3所示,表中展現出了電網收益的五個方面(即電費,發電成本,凈利潤,需求波動和總效益),并進行了比較。
由表可知,電力需求基線預測的不確定性會導致電網的凈利潤從133 622元下降到133 231元,相比于基線的凈利潤而言,降幅接近3%。此外,不確定性還會導致總電力需求的大幅波動,使得電網運行的穩定性大大降低。然而,在電力需求預測不準確的條件下,使用增強型交互策略的電網在六個方面的收益均有顯著改善,但與無不確定性的交互策略相比,由于電網需求側存在不確定性,優化結果會偏離真實的納什均衡。

表3 不同交互策略下十個測試日內電網的平均收益Tab.3 Average return of the power grid within ten test days under different interaction strategies
3.2.2 建筑物需求管理優化
在使用不同交互策略后,10個測試日內與四個帳戶相關聯的建筑物的電力需求優化曲線如圖3所示。



圖3 不同交互策略下4個賬戶所關聯建筑物的電力需求優化Fig.3 Optimization of electricity demand for buildings associated with 4 accounts under different interaction strategies
每棟建筑物每小時的電力需求與該策略的納什均衡相對應;一般情況下,當電網出動態電價后,建筑物便可進行需求轉移,但基線的預測不確定性會導致構建的最優電力需求偏離真正的納什均衡。從圖中可以看出,增強型交互策略可以對建筑物的最優電力需求進行修正,其優化結果與未適當處理不確定性的結果相比,有明顯改善,可有效地應對基線預測不確定性帶來的影響。
在不同交互策略下,四個賬戶在10個測試日內平均收益的詳細情況如表4所示。由表可知,在基線準確且無不確定性的情況下,交互策略的效果最好。當建筑物電力需求基線預測不準確時,使用基本交互策略會使建筑物的電費與電力損耗有所增加,但增強型交互策略卻可以改善這一問題,雖然依舊無法和無不確定性的情況相比,但也在很大程度上減少了由于需求基線預測不準確而帶來的損失。

表4 不同交互策略下,十個測試日內四個帳戶的平均收益Tab. 4 Averaged benefits of four accounts on the ten test days using different interaction strategies
為實現智能電網與需求側的雙贏交互,本文提出了一種基于博弈論的智能電網與需求側交互管理策略。該策略通過Stackelberg博弈,考慮了智能電網和建筑的多重需求,實現兩者利益最大化。最后通過仿真分析,驗證了所提策略的有效性。所得結論有:
(1)所提的基于博弈論的基本交互策略可通過優化電網動態電價,有效地提高電網的效益,減小需求波動,維持電網穩定性。同時建筑物通過響應最優動態價格進行需求轉移,減少電力損耗及用電費用;
(2)所提的基于博弈論的增強型交互策略,可有效緩解需求基線預測不準確對交互過策略的負面影響。除此之外,增強型交互策略對電網與建筑物的效益改善情況要優于基本交互策略。
在未來的工作中,可進一步研究模型預測控制在所提策略中的應用,以實現電網動態定價和建筑物電力需求管理的實時優化,而不是提前一天進行優化,從而提高交互策略的靈活性和穩定性。