張敏慧,李曉露,柳勁松,林順富
(1. 上海電力大學 電氣工程學院,上海 200090;2. 國網上海電力科學研究院,上海 200437)
隨著“雙碳”目標的推進,風、光等分布式電源在電網中的接入比例不斷上升。分布式電源的發電具有波動性和隨機性,在并網過程中可能會對配電網產生巨大的擾動。為解決這一問題,微電網應運而生。伴隨電力市場的雙邊開放,微電網作為新興主體參與配電側的市場交易,然而,微電網在解決能量互補以及處理大規模可再生能源帶來的不確定性問題的能力有限。多微電網技術的發展可以有效彌補單個微電網在處理不確定性問題上的不足。多微電網通過自治管理和微電網間能量互濟的方式,緩解了微電網由于不確定性產生的供需不平衡問題[1-2]。
由于微電網中可再生能源所占比例不斷提高,集中式電力交易局限了微電網之間的協同合作和資源共享。P2P(點對點)電力交易可以解決這個問題,通過允許多個微電網直接相互交易,還能促進清潔能源的推廣和應用[3-4]。因此,未來的微電網應朝向P2P 電力交易模式轉型,以實現微電網之間的精準協同合作。在采用微電網P2P 交易模式的多微電網系統中,微電網之間、微電網與配電網之間能夠進行能量的交互,通過各個微電網的自治管理以及微電網之間的協調互補,降低微電網運行成本[5-6]。
參與微電網交易的各個利益主體由于具有不同的效益目標、不同的運營方式,在能量互動過程中,彼此影響、彼此作用,因此利益主體之間形成了相對復雜的博弈關系[7-8]。博弈論可以有效解決不同利益主體之間復雜的博弈問題[9-10]。通常情況下,博弈參與者被認為是絕對理性的[11],但在多微電網電能交易過程中,博弈參與者并不會展現出完全理性的狀態。
文獻[12]提出了一種考慮新能源發電不確定性的主從博弈模型,并將共享儲能容量租賃價格作為可變變量,通過優化共享儲能的方式削減了新能源發電不確定性對微電網交易造成的影響。文獻[13]將電能生產者與電能消費者之間的博弈轉換為隨機博弈,模擬了新能源發電不確定情況下的智能電網產消者的行為,證明隨機博弈對智能電網的管理具有參考價值。文獻[14]提出一種基于合作博弈的配電網-多微電網隨機博弈模型,為保證合作聯盟的穩定,提出基于談判系數的納什談判合作價值分配機制,將博弈雙方作為理性人進行博弈模擬。文獻[15]根據主動消費者和聚合商之間的交互作用,建立了主從博弈模型,研究了用戶在實時電價響應中的行為以及對電網電壓的影響,并通過算例證明了主從博弈模型模擬主動消費者和聚合商之間交互作用的有效性。由于參與微電網交易的利益主體均為有限理性人,文獻[16]提出了有限理性的演化博弈方法,并與完全理性人的傳統博弈模型進行比較,證明了有限理性的演化博弈方法在計算微電網源-儲規劃策略的有效性。在文獻[17]中,針對微電網的特點和屬性,研究人員設計了一套完整的綜合評價指標體系,并采用前景價值函數、改進層次分析法和熵權法相結合的主客觀綜合賦權方法,從而獲得更為客觀和準確的微電網評價結果。文獻[18]基于區塊鏈技術建立微電網分布式電力市場,采用前景理論將發電商的主觀偏好引入交易決策過程中,使優化結果更加符合實際微電網市場的不確定場景,更好地管理市場運行風險。文獻[19]提出了發電企業參與調整日前能源市場最優競價策略的博弈,將前景理論應用于博弈中,并對博弈主體的主觀性以及其如何影響博弈主體的決策進行了模擬。與現有假設產消者完全理性的投標模型不同,文獻[20]提出了一種基于前景理論的電力市場產消者競價模型;該模型考慮到電力市場投標規則的影響,包含了非理性和個人偏好,以獲得產消者對投標結果的主觀感知,并以此作為研究電能雙邊交易的基礎。文獻[21]提出了一個將微電網內部市場和不同微電網間的交易市場相互嵌套的市場清算算法。運用基于前景理論的分布式魯棒優化方法來描述消費者行為的復雜性。微電網的時間偏好,即對未來效用的偏好程度,也影響了微電網在電能交易中的行為選擇。然而,當前的研究尚未對微電網作為有限理性個體在面對供需不平衡的不確定性問題時的時間偏好進行考慮。
綜上,本文擬從多微電網之間交易過程中存在有限理性問題進行研究,基于時間偏好理論和前景理論提出多微電網運營商-微電網主從博弈下微電網P2P 博弈交易策略,最終為多微電網運營商的定價提供參考依據。本文的主要研究工作如下:1)分析微電網交易模式,建立多微電網運營商為領導者、微電網為追隨者的主從博弈模型;2)對微電網的成本收益進行定量分析,建立微電網的收益模型,并分析多微電網之間交易決策過程中表現出的有限理性,提出基于時間偏好理論和前景理論的主從博弈下微電網P2P博弈均衡求解方法。
傳統微電網在發電量不能滿足用戶的負荷需求時,將會向配電網購買電量以補足缺額。在多微電網主從博弈電能交易框架下,微電網之間可以進行P2P 交易平衡供需關系。發電盈余的微電網可將盈余電量通過內部交易售賣給供電不足的微電網。多微電網運營商負責協調電能交易,實現所有微電網收益最大化。
微電網之間的具體交易流程為:各個微電網將發電量與需求量等信息發布在交易平臺,多微電網運營商根據發布的信息制定內部交易價格并發布到平臺。各個微電網根據發布的信息計算存儲的電量、向配電網購買的電量以及向其他微電網購買或出售的電量,并將信息發布于平臺。隨后,多微電網運營商通過平臺上公布的信息調整內部交易價格,各個微電網根據內部交易價格以及平臺上的信息再次確定內部交易策略,經過多次調整直到達到供需平衡。
在上述交易步驟中,需要通過如下方式對交易中的變量進行計算:首先,多微電網運營商通過制定內部交易定價的方式協調多個微電網的交易;其次,微電網可根據多微電網運營商制定的電價自主選擇電能交易策略。最后,多微電網運營商與微電網的關系可以通過主從博弈進行模擬,在主從博弈的納什均衡點,微電網的整體收益可達到最大化。
因此,本文構建如圖1所示多微電網運營商-微電網主從博弈框架[22],上層領導者是多微電網運營商,為保證微電網之間充分交易電量,以所有微電網整體收益最大為目標,制定實時電價;下層追隨者為各個微電網,以微電網時間偏好前景值最大為目標,根據多微電網運營商制定的電價,確定微電網之間交易的電量。
在下層各個微電網之間的博弈過程中,微電網的主觀因素涉及兩方面的問題:對時間的效用偏好以及對風險和收益的偏好。時間偏好理論是指微電網在不同時間點上對于同樣數量級的收益/損失存在不同的偏好。前景理論可以有效模擬微電網在風險決策中的心理機制,促進微電網平衡風險與收益,更好地做出決策[23]。同時,前景理論可以幫助多微電網運營商對微電網的交易行為進行評估和優化。結合兩者的優點,本文提出基于時間偏好理論和前景理論的主從博弈下微電網P2P博弈均衡求解方法。
有限理性的概念最初是由赫伯特·A·西蒙提出的,是行為經濟學重要的基本假設之一。有限理性集中考慮決策者受外界因素或自身有限的判斷能力的影響,在不同情境下采取不同的決策行為。相較于完全理性判斷,有限理性具有更強的實用性和動態性,對實際經濟活動的指導具有重要意義。作為行為經濟學的重要理論,有限理性為研究微電網的決策行為提供了重要的理論基礎[24]。
微電網在交易過程中的有限理性主要體現在:不同微電網對交易的期待收益不同,對交易的耐心、風險承受能力以及對風險不確定性的態度也不一樣。在交易過程中,這些因素共同組成了微電網的決策依據。本文基于時間偏好理論和前景理論,分別考慮了微電網對收益和損失的敏感程度、現期與遠期時間段的持續性及附加折現影響因子等影響交易決策的心理因素,建立多微電網運營商-微電網主從博弈下微電網P2P博弈交易策略,模擬現實中微電網的交易決策。
時間偏好理論指出決策者在進行效用判斷時,效用值會隨著時間的推移而逐漸遞減[25],時間偏好理論可以有效模擬微電網在進行效用判斷時,收益帶來的效用會隨著時間的推移而逐漸遞減。遞減的比值計算方法如下:
式中:Di(t)為微電網i在t時段收益的時間偏好值;[s,s+τ)為現期時間段,[s+τ,∞)為遠期時間段,τ是隨機的,刻畫現期時間段的持續性,且服從參數為1/η的指數分布,因此E(τ)=1/η,當η較小時,現期時間段的期望持續性較大;κ表示遠期時間段的附加折現影響因子,當κ越大時,表明對現期偏好越小,0<κ≤1;ρi表示微電網i的貼現因子,是微電網對長短期收益重視程度的量化指標,ρi越大,說明微電網對短期收益越重視,相反,ρi越小,說明微電網對長期收益越重視,ρi>0。
綜上,時間偏好理論可以描述微電網在時間維度展現的有限理性,從而對微電網交易過程的納什均衡點進行合理計算。
在博弈過程中,需要考慮微電網在面對獲利和損失時不同的主觀感受以及處理不確定風險時的有限理性問題。在大多數情況下,微電網在面臨獲利時采取風險規避的態度,在面臨損失時采用風險偏好的態度。
不同于期望效用理論中決策者對風險的態度呈線性變化,前景理論[26]通過引入心理學、社會學等方面的理論來描述決策者在面對不確定風險時的行為模式,進而判斷決策者面臨不確定性風險時的態度。
微電網在處理收益和損失時,通常呈現出有限理性,微電網對于損失的負向主觀感受要強于等量收益的正向主觀感受。根據前景理論,微電網關于收益和損失的價值函數可由下式所示:
式中:Vi,t表示微電網i在t時段的價值函數;Vi,+(ΔUi,t)表示微電網i在t時段收益的價值函數;Vi,-(ΔUi,t)表示微電網i在t時段損失的價值函數;ΔUi,t表示t時段微電網i實際收益與理想收益的差值,即ΔUi,t=Ui,t-Ui,0,其中,Ui,t表示微電網i在t時段的實際收益;Ui,0表示微電網i的理想收益;α和β分別表示微電網對收益和損失的敏感程度,數值越大表示微電網對收益和損失越敏感,越容易影響微電網的交易行為;λ為損失規避系數,是微電網對損失厭惡程度的量化指標。通過上述設置,可以有效反映微電網的有限理性,即面對收益和損失采取不同的態度。
微電網面對不同概率的事件,也表現出有限理性,具體表現為:在決策時往往會高估低概率事件,而低估高概率事件。因此通過決策權重函數描述這個有限理性現象。決策權重函數可表示為:
式中:πi,+(pi,c)表示微電網i面對第c種收益事件的決策權重;πi,-(pi,d)表示微電網i面對第d種損失事件的決策權重;γ1表示微電網對收益的態度量化系數;γ2表示微電網對損失的態度量化系數;pi,c表示第c種收益事件發生的客觀概率;pi,d表示第d種損失事件發生的客觀概率。
將一個電力交易周期劃分為T個時隙,時隙t∈{1,2,…,T}。全體微電網的編號集合為:N={1,2,3,…,n}。
在t時段,微電網i收益值可由下式表示:
式中:Ci,t為t時段微電網i與用戶的交易電價;Cint,t為多微電網運營商規定的t時段內部交易的售電(購電)價格;xi,t為t時段微電網i消耗的電量;Cnet,t為t時段微電網從配電網購電的價格;Qnet,i,t為t時段微電網i從配電網購買的電量;Qbuy,i,j,t為t時段微電網i從微電網j購買的電量;Qsell,i,j,t為t時段微電網i向微電網j售賣的電量;n為微電網的總個數;Fst,i,t為儲能成本[27]:
式中:Cst為微電網單位時間內存儲單位電量的單價;Wst,i,t為微電網i在t時段儲能電池儲存的電量。
式中:Wst,i,t-1表示微電網i在t-1時段儲能電池儲存的電量;Qst,i,t表示微電網i在t時段的儲存(釋放)電量,如果Qst,i,t>0,則說明在t時段,微電網i正在往儲能電池里充電,如果Qst,i,t<0,則說明在t時段,微電網i的儲能電池正在放電。
微電網在進行電能交易時,一般會考慮時間的效用偏好以及風險和收益的偏好。因此,在分析單個微電網的交易決策時需要在單個微電網收益值的基礎上考慮不同時間偏好影響下的微電網前景值,將單個微電網收益值與理想收益值的差值ΔUi,t代入前景理論價值函數,并將時間偏好值、決策權重函數和價值函數相乘,單個微電網的時間偏好前景值如下式所示:
微電網i在t時段的決策集為:
式中:Qu,i,t表示t時段微電網i利用的電量。
式中:Qd,i,t表示t時段微電網i的發電量;當微電網i在t時段的發電量小于用戶需求電量時,說明微電網i的發電能力不足,t時段微電網i利用的電量等于微電網i供給用戶的電量與存儲的電量之和,減去向其他微電網和配電網購買的電量;當微電網i在t時段的發電量大于用戶需求電量時,說明微電網i的發電能力盈余,t時段微電網i利用的電量等于微電網i供給用戶的電量、存儲的電量、出售給其他微電網的總電量之和。
所有微電網在t時段內的決策集可表示為:
微電網i在交易博弈過程中,根據多微電網運營商的定價策略,在t時段通過選擇決策集si,t實現其自身時間偏好前景值最大的目標,即:
所有微電網在t時段內的決策集St和時間偏好前景值函數的博弈是一組優化問題。微電網i的目標函數取決于微電網i和其他微電網的交易策略。此外,一個微電網采取的策略會被其他微電網的策略所約束,這種約束稱為耦合約束。因此,多個微電網之間的P2P電能交易博弈被稱作對偶策略博弈[28]。
式中:Qi*表示t時段微電網i交易電量的納什均衡解;Vi表示t時段微電網i的時間偏好前景值;N表示全體微電網的編號集合。
1)微電網發出的電量被負荷消耗后,還會被用來為儲能電池充能或者與其他微電網進行交互,如果仍然留有剩余電量,則將被丟棄。因此微電網可利用的電量僅占微電網發出電量的一部分,如下式所示:
2)微電網之間的交易是公開透明的,因此微電網內部交易的出售電量總和等于購入電量總和:
3)微電網出售電量不得高于微電網的供給盈余電量,供給盈余電量為微電網利用電量與用戶需求電量的差值:
4)在多微電網運行中,所有微電網利用的電量,除去一部分被負載端所利用外,剩余電量將被儲能電池存儲,但多微電網如果不滿足負載要求,即可被利用的電量總和低于用戶需求電量總和,則多微電網運營商需要向配電網購買電量,以補足用戶需求電量缺額。
5)因為微電網儲能電池的充放電功率和容量都是有限的,Qst,i,t和Wst,i,t的約束可表示為:
式中:Qst,max,i,t和Qst,min,i,t分別為充放電量Qst,i,t的上、下限;Wst,max,i,t為儲能電池容量的上限。
6)微電網之間的交易是單向的,不存在一個微電網在同一時間段向同一個微電網出售和購買電量的情況,存在下面約束關系:
7)由于微電網相互之間、微電網與配電網之間受到傳輸線的容量限制,交易電量存在下面約束關系:
式中:Qbuy,max,i,j,t、Qsell,maxi,j,t、Qnet,max,i,t分別為Qbuy,i,j,t、Qsell,i,j,t、Qnet,i,t的上限。
如圖1所示,多微電網運營商以所有微電網整體收益最大為目標制定微電網之間的電能交易價格,微電網根據多微電網運營商制定的內部交易電價與其他微電網進行交易[29]。同時,微電網內部交易電價應低于微電網向配電網購買電量的價格,如式(23)所示:
多微電網運營商確定內部交易電價的過程為:微電網根據多微電網運營商制定的內部交易電價選擇自身的內部交易電量、儲能電量以及向配電網購買的電量。多微電網運營商將根據微電網的決策,以所有微電網整體收益最大為目標,調整定價。微電網再根據調整后的定價重新選擇自身的內部交易電量、儲能電量以及向配電網購買的電量。如此重復,直到博弈均衡時確認最終交易電價。
微電網之間充分交易電量時,由于減少了向配電網購買高價的補足電量以及儲能成本,收益將得到提升。多微電網運營商以所有微電網收益最大化為目標,可以確保多微電網內部充分交易,提高微電網的發電利用率,進而滿足“雙碳”目標的要求。
多微電網運營商以所有微電網整體收益最大為目標的定價博弈優化問題可表示為:
式中:Ui,t(Cint,t)表示在t時段,定價Cint,t下,第i個微電網的實際收益。
本文對多微電網運營商制定的電價、微電網之間交易的電量進行迭代求解[30]。通過隨機生成策略集,并使微電網在每個策略集下進行博弈,經過多次迭代后得到最優策略集,具體步驟如下:
1)載入微電網發電量、用戶需求量、微電網儲能電池容量、微電網與配電網之間傳輸線的容量限制等基本數據,生成微電網之間初始定價。
2)在可行域中隨機生成微電網初始交易電量群組,pi,t表示第t代的第i組交易電量,依次計算每組交易電量的時間偏好前景值,作為當前最優時間偏好前景值,計作Vbest,i,對應的交易電量為pbest,i;找到群組中的全局最優時間偏好前景值,計作Vbest,對應的交易電量為gbest。
3)更新交易電量,更新方法如下:
式中:a、b、c為設定的常數;pi,t+1表示第t+1代的第i組交易電量。
4)根據更新后的交易電量,依次計算每組微電網的時間偏好前景值,計作Vi,t,將Vi,t與Vbest,i進行比較,如果Vi,t>Vbest,i,則Vbest,i=Vi,t,pbest,i=pi,t,否則Vbest,i不變。
5)將Vi,t與Vbest進行比較,如果Vi,t>Vbest,則Vbest=Vi,t,gbest=pi,t,否則Vbest不變。
6)判斷全局最優時間偏好前景值Vbest是否連續固定代數保持不變,如果滿足條件,說明當前微電網之間的博弈達到了納什均衡,執行步驟7);否則執行步驟3)。
7)多微電網運營商根據微電網的交易電量,求取使所有微電網整體收益值最高的內部交易電價,判斷所有微電網整體收益值是否連續固定代數保持不變,如果滿足條件,執行步驟8),否則執行步驟3)。
8)輸出最終結果。
9)結束。
本文選取3個微電網(MG1、MG2和MG3)進行仿真分析。其中,MG1為風力發電微電網;MG2為光伏發電微電網;MG3為常規能源發電微電網,總共模擬了一天(24 h)的交易。微電網向配電網購買電量的單價為0.8 元/kWh,微電網向用戶出售電量按固定電價0.4元/kWh進行計算。
MG1、MG2和MG3的能源出力預測如圖3 所示。MG1的能源出力預測通過按照一定比例放大了文獻[31]中的風力發電數據,MG2的能源出力預測通過按照一定比例放大了文獻[32]中的光伏發電數據,MG3的能源出力預測是在整體發電功率為1 600 kW的基礎上增加了范圍為±100 kW的隨機發電功率。根據文獻[33]中的數據得到各個微電網的用戶需求預測電量如圖4所示。

圖3 微電網能源出力預測Fig.3 Energy output power prediction of microgrids

圖4 用戶需求預測Fig.4 User demand prediction
采用如下方案進行研究:
方案一:當微電網可利用的電量低于用戶需求電量時,微電網直接向配電網購買補足電量,微電網之間不存在電能交易行為。
方案二:在方案一的基礎上,引入主從博弈的多微電網運營商P2P 電能交易策略,微電網之間可通過電能交易行為平衡供需關系,并通過期望效用理論計算納什均衡解。
方案三:在方案一的基礎上,引入主從博弈的多微電網運營商P2P 電能交易策略,微電網之間可通過電能交易行為平衡供需關系,并通過時間偏好理論和前景理論計算納什均衡解。
方案三中3 個微電網的前景理論參數取文獻[34]中的定值,α=0.88,β=0.88,λ=2.25,γ1=0.61,γ2=0.69。MG1的發電量基本可以滿足用戶的需要,因此MG1更關注遠期收益,MG1的貼現因子較小,ρ1=0.7;MG2為光伏發電,有部分時間不能滿足用戶需要,因此MG2比MG1更關注短期收益,MG2的貼現因子略大于MG1的貼現因子,ρ2=0.8;MG3為常規能源發電,發電成本較高,對快速收回成本的傾向更強,因此MG3更加關注短期收益,MG3的貼現因子在3個微電網中最大,ρ3=0.9。在3 個微電網的時間偏好參數中,遠期時間段的附加折現影響因子κ=1,現期時間段的持續強度η=0.33。
通過對微電網供需平衡關系進行計算,具體計算方法為:根據微電網發電量與需求量的歷史數據,將發電量與需求量的差值作為供需值,統計每個時段的供需值,并將所有時段供需值的分布范圍劃分為9個大小相等的區間,將每個區間的時段數與總時段數的比例作為該區間的概率,得到概率分布如圖5 所示。微電網供需電量區間如表1所示。

表1 微電網供需電量的區間Table 1 The range of power supply and demand in a microgrids

圖5 微電網供需概率分布Fig.5 Probability distribution of supply and demand in microgrids
前景理論中Ui,0的選取方式分為兩種情況,當微電網的發電量均超過用戶需求時,收益參考點為3 個微電網的平均收益,分別為1 967 元/h、1 943元/h、1 832元/h。當存在微電網的發電量不能滿足用戶需求時,微電網處于供需不平衡狀態,不能僅用微電網的平均收益作為收益參考點,需要通過收益參考點的選取影響微電網的交易策略,從而降低供需不平衡程度。
當供需不平衡程度較高時,增加內部交易電量可有效降低供需不平衡程度。適當提高收益參考點,會使得處于供電不足的微電網負向前景值增大,從而大量買入發電盈余微電網的盈余電量。因此適當提高收益參考點可以平衡供需關系。根據三個微電網的平均收益,如圖6 所示,收益參考點分別取2 085元/h、2 036元/h、1 965 元/h。

圖6 供需不平衡程度較高時預計收益曲線Fig.6 The expected revenue curve under high degree of supply and demand imbalance
在供需不平衡程度較低時,適當降低收益參考點,使得盈余狀態的微電網通過內部交易獲得同等收益時,前景值的增加較快。這樣可以促使盈余狀態的微電網將盈余電量賣給供電不足的微電網,使得供需不平衡程度進一步降低。根據三個微電網的平均收益,如圖7所示,參考點分別取1 842元/h、1 811元/h、1 731元/h。

圖7 供需不平衡程度較低時預計收益曲線Fig.7 The expected revenue curve under low degree of supply and demand imbalance
5.3.1 收益分析
通過模擬交易,得到多微電網運營商每小時收益值如圖8所示。由圖8可知,未引入多微電網運營商P2P 電能交易策略的方案一中所有微電網總體收益低于方案二和方案三。然而,從03:00—05:00時間段,由于用戶需求較低,多微電網運營商P2P 電能交易策略未能起到平衡供需的作用,方案一在該時段成為較佳方案。與未引入多微電網運營商P2P 電能交易策略的方案一相比,方案二和方案三的整體收益表現更佳。此外,方案三的整體收益高于方案二,這說明通過時間偏好理論和前景理論計算多微電網運營商P2P 電能交易的納什均衡解對于提高微電網的總體收益具有優勢。具體而言,前景理論計算了微電網面對損失風險時的偏好,在微電網發電量無法滿足用戶需求時,多微電網運營商更傾向于通過內部交易來平衡供需關系和降低損失。因此,采用前景理論計算多微電網運營商P2P 電能交易的納什均衡解比采用期望效用理論更具優勢。

圖8 多微電網運營商收益Fig.8 Revenues of multiple microgrid operators
5.3.2 DG利用率分析
如圖9所示,DG利用率為評價微電網可靠性的重要指標[35],在00:00—03:00,18:00—24:00,因為MG1、MG2和MG3中至少有一個微電網無法滿足用戶需求,而供給盈余的微電網無法通過P2P電能交易將盈余的電量補充給供給不足的微電網。供給盈余的單個微電網雖然DG利用率較高,但對于整體而言,方案一的DG利用率還是處于較低水平;當所有微電網均能滿足用戶需求時,無需通過P2P內部交易平衡供需關系,DG利用率就可達到最大值;引入多微電網運營商P2P 電能交易策略后,可通過內部交易將一些微電網的盈余電量平衡給了供給不足的微電網,相比于方案一,方案二與方案三的DG利用率均有所提升。方案三的DG利用率略高于方案二,這說明:相比于期望效用理論,通過時間偏好理論和前景理論計算得出的納什均衡解可以使微電網之間交易更加充分。

圖9 DG利用率Fig.9 The DG utilization rates
5.3.3 碳排放分析
在傳統交易模型下,微電網需要與配電網進行電能交易,而配電網的電能大多來自化石燃料發電,不符合低碳經濟的發展政策[36]。引入多微電網運營商P2P 電能交易策略后,微電網之間的電能交易解決了一部分供需不平衡電量問題,因此減少了微電網向配電網購電的電量,將這部分減少的電量按下式換算成二氧化碳排放量:
式中:MCO2,i,t表示微電網i在t時段的二氧化碳排放量;δ表示化石燃料發電量轉換為二氧化碳排放量的系數,一般取。
換算后的二氧化碳排放量如圖10 所示。由圖10可知,在06:00—09:00、10:00—16:00時間段,由于微電網的發電量均能滿足用戶需求,無需從配電網進行購電,此時碳排放量為0。引入主從博弈的多微電網運營商P2P 電能交易策略后,微電網之間可以充分交易,使得新能源微電網能夠優先滿足用戶需求,在一定程度上降低了碳排放量。由于方案一的24 h等價二氧化碳排放量為14 950 kg,方案二的24 h等價二氧化碳排放量為9 240 kg,方案三的24 h等價二氧化碳排放量為5 030 kg,所以方案二、方案三的碳排放總體上低于方案一的碳排放。方案三的碳排放低于方案二的碳排放,滿足“雙碳”目標的整體要求。通過時間偏好理論和前景理論計算得出的納什均衡解使微電網之間更充分地交易,從而降低購買配電網的電量。

圖10 不同方案下二氧化碳排放量Fig.10 Carbon dioxide emissions under different schemes
5.3.4 收斂性分析
在方案二與方案三計算出最終納什均衡解之后,記錄迭代過程中產生的解和最終納什均衡解,計算歷史解與最終納什均衡解的平均距離,并作為收斂性評價指標g:
式中:M為歷史解的總個數;Pi表示第i個歷史解;Pbest為最終納什均衡解。
各個迭代周期的g變化如圖11 所示。引入時間偏好理論和前景理論之后,微電網均衡解在第120代時已達到均衡狀態;而期望效用理論則需要到270代才能達到均衡狀態。結果表明,時間偏好理論和前景理論的引入可使多微電網運營商-微電網主從博弈下層模型中微電網間的博弈快速達到納什均衡狀態,從而使上層多微電網運營商可以較為快速地判斷定價是否合理。相較于期望效用理論,其更快的收斂速度能更迅速地滿足市場交易需求,提高市場交易效率。

圖11 不同迭代次數下的收斂性評價Fig.11 Convergence evaluation under different iteration times
本文研究了多微電網之間交易過程中存在的有限理性問題,基于時間偏好理論和前景理論提出了多微電網運營商-微電網主從博弈下微電網P2P博弈交易策略,得出結論如下:
1)采用主從博弈模型的多微電網運營商交易策略,微電網的整體收益值得到顯著增長,提升了DG利用率,減少碳排放量。
2)時間偏好理論和前景理論的引入使主從博弈下層模型中微電網間的博弈快速達到納什均衡狀態。相較于期望效用理論,時間偏好理論和前景理論能更快速計算出均衡解。
基于時間偏好理論和前景理論的多微電網P2P 交易策略為微電網資源調度與定價提供了優化方案,提高了微電網自身的可靠性和穩定性,加快了微電網在資源調度時的響應速度,降低了電能損失,保障了電力市場的公平、透明,順應了當前電網的分散化發展趨勢。