陳志遠,王鐵驪
(南華大學 經濟管理與法學學院, 湖南 衡陽 421001)
氣候變暖及化石能源日益枯竭的背景下,大力開發運用可再生能源已成為全球共識。我國太陽能資源豐富,光伏發電技術具有巨大的發展潛力。分布式光伏作為光伏行業的重要發展方向,對降低光伏電站前期投資、減少電力輸送線損、促進能源結構調整和供求關系轉變具有重要作用[1]。分布式光伏項目的參與主體眾多,各方采取的策略直接影響到光伏電站建設和運營的質量,決定著項目的成敗。因此研究分布式光伏項目中多主體間的復雜博弈,有利于對分布式光伏的發展現狀和激勵政策進行審視和反思,為政策制定提供依據。
聚焦光伏技術的推廣,國內外學者開展了多方位的研究。一類典型的研究是通過理論分析,對光伏項目的經濟性和可持續性進行探討。如柳君波等[2]運用生命周期理論,通過設定基于政策與技術引導的比較情景,對國內331個城市的光伏發電能力進行評估,揭示了不同地區光伏經濟性的顯著差異。Yu等[3]對澳洲1.2 MW的屋頂光伏項目進行生命周期可持續性評估,發現盡管光伏項目的環境效益良好,但是只有在政府的資助下,其經濟表現才可行。圍繞光伏平價上網的問題,魯正等[4]基于改進的平準化度電成本的方法,對光伏項目的效益進行敏感性分析,發現系統單位造價對于項目效益影響最大。也有學者運用實證分析的方法,探索影響光伏技術推廣的因素。如陳梓毅等[5]對三處分布式光伏項目進行調研,通過構建實證模型,分析了分布式光伏發電的經濟和環境效益,發現裝機容量越小越有利于光伏技術的推廣。朱向東等[6]利用計量方法,考察美歐反傾銷、反補貼的背景下我國光伏產業的空間動態及影響因素,揭示了政策激勵在全國范圍內均能促進光伏發展,其中中部地區的作用最為顯著。考慮光伏項目中存在多主體的復雜博弈,還有學者利用博弈論進行研究。如格日勒圖等[7]以儲能電站和光伏電站為主體,建立電力市場博弈模型,并基于Shapley值對合作博弈剩余進行分配,發現儲能電站和光伏電站作為獨立市場主體,能夠更好地引導社會投資。Shan等[8]利用演化博弈和實證分析方法,對我國光伏脫貧項目進行研究,發現適當提升績效補貼和完善收益分配機制,能夠有效保障項目的可持續性。綜上,學界對于光伏推廣已開展了廣泛的研究,但已有文獻多側重于從經濟效益和社會效益的視角進行分析和闡述,運用博弈理論研究光伏推廣過程中多方的交互關系相對缺乏,且往往忽視了各方策略對于電站建設和運營效率的影響。
因此,在已有研究的基礎上,利用演化博弈方法,考慮各主體的策略對分布式光伏電站建設和運營效率的影響,構建多主體演化博弈模型,據此進行演化穩定策略分析,并利用當前市場數據進行數值仿真,研究主要參數對各主體策略選擇的影響,最后提出相應的促進分布式光伏發展的對策建議。
分布式光伏電站的推廣涉及利益主體眾多,包括政府、投資企業、業主、商業銀行和設備供應商等[9]。政府作為政策制定和市場監管的主體,對引導市場持續健康發展具有重要作用;投資企業和業主投入資金、技術和場地等資源,以獲取最大化收益為目標;各方經過復雜交互動態的博弈,實現利益均衡。根據Zhang等[10]和Liang等[11]的研究,同樣以政府、投資企業和業主為博弈主體,并基于如下假設,構建分布式光伏推廣過程中多主體的博弈模型。
假設1分布式光伏項目的利益主體均有2種可選策略。政府鼓勵推廣分布式光伏的概率為x,不鼓勵推廣分布式光伏的概率為1-x;投資企業選擇積極策略的概率為y,選擇消極策略的概率為1-y;業主選擇積極策略的概率為z,采取消極策略的概率為1-z;x,y,z∈[0,1]。
假設2若投資企業與政府鼓勵推廣分布式光伏的政策背道而馳,政府將向投資企業額外征收環境保護稅金。
假設3當投資企業和業主均選擇消極的策略時,政府需支付解決能源消耗和污染防治的費用。
假設4采取積極策略時,各主體愿意進行投資以獲取收益;采取消極策略時,各主體傾向于減少投資或不投資,以降低投入提高收益。
在條件假設的基礎上,模型參數設定如表1所示。
根據以上參數,計算各主體所采取策略的支付矩陣元素,如表2所示。

表1 博弈系統參數設定

表2 多主體博弈的支付矩陣元素
政府鼓勵推廣分布式光伏的期望收益為G11,選擇不鼓勵策略時,期望收益為G21,在演化博弈過程中,政府的復制動態方程可表示為:
G11=yz(g1-g2+g4)+y(1-z)(α1g1-g2+g4)+(1-y)z(α2g1-g2+g4+e3)+
(1-y)(1-z)(α3g1-g3+e3)
(1)
G21=yzg1+y(1-z)α1g1+(1-y)zα2g1+(1-y)(1-z)(α3g1-g3)
(2)
(3)
投資企業采取積極策略的期望收益為E12,采取消極策略的期望收益為E22,在演化博弈過程中,投資企業的復制動態方程可表示為:
E12=xz(e1-e2+e4)+x(1-z)(α1e1-e2+e4-r3+r4)+(1-x)z(e1-e2+e4)+
(1-x)(1-z)(α1e1-e2+e4-r3)
(4)
E22=xz(α2e1-e3)+x(1-z)(α3e1-e3)+(1-x)zα2e1+(1-x)(1-z)α3e1
(5)

(α1-α3)e1-e2+e4-r3]
(6)
業主采取積極策略的期望收益為R13,采取消極策略的期望收益為R23,在演化博弈過程中,業主的復制動態方程可表示為:
R13=xy(r1+r2-r3+r4)+x(1-y)(α2r1+r2-r3+r4-e2)+(1-x)y(r1+r2-r3)+
(1-x)(1-y)(α2r1+r2-r3-e2)
(7)
R23=xyα1r1+x(1-y)α3r1+(1-x)yα1r1+(1-x)(1-y)α3r1
(8)
(9)
在非對稱的多主體演化博弈中,任何混合策略一定不是演化穩定均衡點,演化穩定均衡僅在純策略均衡處取得[12]。因此,潛在的穩定均衡策略均在0和1處,博弈系統的內部均衡解為:S1(0,0,0),S2(0,1,0),S3(0,1,1),S4(0,0,1),S5(1,0,0),S6(1,0,1),S7(1,1,0),S8(1,1,1)。根據李雅普諾夫穩定性理論,當雅克比矩陣在某內部均衡點處的所有特征值的實部均為負數時,則該均衡點代表的純策略是系統的演化穩定均衡策略。演化博弈系統的雅可比矩陣J如下:
其中
J11=(1-2x)[yz(g2-g4)+y(-g2+g4-e3)+z(-g2+g4)+e3]
J22=(1-2y)[-xzr4+x(e3+r4)+z[r3+(1-α1-α2-α3)e1]+(α1-α3)e1-e2+e4-r3]
J33=(1-2z)[xr4+y[e2+(1-α1-α2+α3)r1]+(α2-α3)r1+r2-r3-e2]
將S1~S8分別代入式(10),求出相應的特征值,見表3。由于模型中所有參數均大于0,均衡解S1(0,0,0)的特征值中存在非負情形,即S1一定不是博弈系統的演化穩定均衡策略,表明當投資企業和業主均選擇消極策略時,政府不會采取不鼓勵推廣分布式光伏的策略。

表3 演化博弈均衡解的特征值
進一步地,確定模型中各參數的實際值,對各主體的策略演化進行數值仿真。分布式光伏的規模較小,裝機容量設為10 kW,則年發電量為9750 kW·h;近年來光伏補貼持續退坡,度電補貼設為0.11元[13];2020年國內分布式光伏的投資成本為3.38元/W/年,運營成本為0.054元/W/年[14];增收投資企業的稅費為15元/m2[15],經計算各參數實際值見表4。

表4 模型參數實際值
利用Matlab 2019b進行數值仿真,分析參數變動對各主體策略選擇的影響。選取各主體的初始意愿、政府補貼額、稅收成本和效率系數進行研究。
3.2.1初始意愿
初始參數條件下,各主體的初始意愿對演化路徑的影響如圖1所示。不管政府的初始意愿如何,最終的演化穩定策略均是鼓勵推廣分布式光伏,表明政府從分布式光伏項目中,能夠獲得足夠的收益以彌補資源投入。此外,項目還產生了大量的外部效益,如碳減排和就業。因此,選擇鼓勵推廣分布式光伏始終是政府的最優策略。從投資企業的角度看,當初始意愿高于0.9時,積極策略是演化穩定策略。低水平的初始意愿下,投資企業傾向于選擇消極的策略,表明初始意愿能促使投資企業采取積極措施推廣分布式光伏。隨著初始意愿的增大,業主達到演化穩定策略的時間變長,但最優策略始終是消極策略,反映了業主在當前的光伏市場和政策環境下,積極參與分布式光伏項目無法獲得較高的收益,應探索合理的利益分配機制,避免打擊業主推廣分布式光伏的積極性。

圖1 初始意愿對演化路徑的影響曲線
3.2.2政府補貼
隨著光伏補貼數額的變化,各主體策略選擇的演化路徑如圖2所示。補貼的減少有利于政府獲得更多的收益,所以隨著補貼的下降,政府收斂至演化穩定策略的速度變快。從投資企業和業主的視角來看,提高補貼能給其帶來更多的收益,選擇積極策略的動力也會增強。當補貼高于1 320元/年(0.135元/(kW·h))時,投資企業傾向于選擇積極策略。當補貼高于1 540元/年(0.158元/(kW·h))時,業主也將采取積極的策略。相較于投資企業,業主從分布式光伏項目中獲得的外部收益較少,因此需要更高的補貼以平衡支出。當補貼數額不足以彌補投資和成本間的空缺時,投資企業和業主將選擇消極策略。

圖2 補貼水平對演化路徑的影響曲線
3.2.3稅收成本
隨著稅收成本的變化,各主體策略選擇的演化路徑如圖3所示。政府通過處罰性征稅的方式,促進投資企業積極推廣分布式光伏。隨著稅收額度的提升,投資企業選擇消極策略的成本增加,當處罰性稅收增加至1 120元/年時,投資企業將選擇積極策略,表明稅收處罰能促進投資企業積極推廣分布式光伏。當投資企業選擇積極策略時,光伏投資的成本得到平攤,業主也傾向于采取積極策略,表明合理的成本分攤機制能提升業主推廣分布式光伏的積極性。此外,稅收成本越高,投資企業和業主收斂至演化穩定策略的速度越快,當處罰力度低于840元/年時,消極策略將成為他們的最優策略。

圖3 稅收成本對演化路徑的影響曲線
3.2.4效率系數
復制動態方程式(3)中不包含效率系數,所以政府的策略選擇不受效率系數的影響。初始參數條件下,效率系數對投資企業和業主的演化路徑的影響如圖4所示。當業主選擇消極策略的效率系數為0.7時,投資企業建設和運營分布式光伏電站的效率較高,采取積極策略能夠獲得較高的收益;業主選擇積極策略的平均收益高于消極策略。因此,業主和投資企業的演化穩定策略均為積極策略。當業主選擇消極策略的效率系數為0.9時,投資企業更快地收斂至積極策略,表明提高效率系數α1有利于增強企業選擇積極策略的動力;而效率系數越高業主選擇消極策略的基本收益和積極策略的差距越小,不支付投資成本能獲得更高的收益,因此消極策略成為業主的占優策略。

圖4 效率系數對演化路徑的影響曲線
投資企業選擇消極策略的效率系數α2越大,業主達到收斂策略的速度越慢,盡管業主建設和運營分布式光伏電站的效率較高,但各方收益不足以平衡資源投入,因而業主和投資企業最終的演化穩定策略均為消極策略。當投資企業和業主均選擇消極策略的效率系數高于0.3時,二者依然能從光伏電站中獲得較高的基本收益;當效率系數α3低于0.1時,選擇消極策略的收益將小于積極策略,積極策略成為投資企業和業主演化穩定策略,表明政府鼓勵推廣分布式光伏的政策下,效率系數α3對投資企業和業主選擇消極策略具有促進作用。
分布式光伏作為光伏產業的重要組成部分,對促進能源結構調整具有重要意義。以政府、投資企業和業主為主體,考慮各方策略對分布式光伏電站建設和運營效率的影響,構建演化博弈模型,系統分析了分布式光伏推廣中多主體的復雜博弈與策略演變路徑。研究結果表明:初始意愿能影響各主體達到均衡策略的速度,并促進投資企業選擇積極策略;政府補貼和懲罰性稅收能促進投資企業和業主選擇積極策略;分布式光伏電站的效率系數對政府的策略選擇沒有影響,提高業主采取消極策略時的效率系數對投資企業選擇積極策略具有促進作用,提高投資企業和業主均采取消極策略時的效率系數能促使投資企業和業主選擇消極策略。
基于研究結果提出以下對策和建議:
1) 科普分布式光伏發電的優勢,打消各主體的顧慮。分布式光伏的收益率較高,但需要投資企業和業主積極參與。政府應積極開展光伏科普活動,讓業主了解光伏發電,并給予投資企業貸款支持,主動承擔一定投資風險,提升二者采取積極策略的初始意愿。
2) 引導措施應獎懲并行,補貼積極響應推廣政策的主體,懲罰消極響應的主體。光伏發電作為可再生能源,具有初始投資高、投資回收期長的特點,政府進行補貼推廣是確保各方獲得經濟效益的重要手段,同時加強投資企業的責任意識,對消極推廣分布式光伏的投資企業,應給予嚴厲的經濟處罰,加大其采取消極策略的成本。
3) 積極探索適宜的商業模式和利益分配機制,鼓勵技術創新和管理創新。投資企業和業主應積極探索基于協調平臺或專業公司的商業模式,實現資源的統一調配,提升推廣分布式光伏的管理效率,以降低建設和運營成本,并綜合考慮各主體的資源投入、推廣積極性等,構建合理的收益分配機制。政府應加強對分布式光伏建設和運營工作的監督管理,及時發現投資企業和業主的消極行為,對其搭便車的行為進行處罰。同時,政府應加大對光伏技術創新的支持力度,以提升光電轉換效率,降低光伏電池的生產成本,進一步降低分布式光伏的投資成本。