王新平,雷景婷,于淮鈺
(西安科技大學管理學院,陜西 西安 710054)
煤炭是我國工業主體能源,在我國能源消費結構中所占比重一直超過60%,遠高于30%的世界平均水平。如今我國經濟發展進入新常態,煤炭行業也進入“需求增速放緩、產能過剩和庫存消化、環境制約強化、結構調整改革”的“四期并發”階段[1],粗放型高速增長模式已不能適應高質量發展的要求。高質量發展模式是我國以供給側改革為主線,實現創新引領、轉型升級和管理提升的集約化經濟增長模式。面對我國能源消費減量的要求以及清潔能源使用比重逐漸提升的趨勢,實現“提質增效、生態安全、創新驅動”的高質量發展,成為煤炭企業核心目標。
目前,國內外學者對煤炭企業高質量發展方向提出了新要求。錢鳴高等[2]、謝和平等[3]為煤炭企業高質量發展指明了方向,即安全、高效、綠色、創新、智慧;牛克洪[4]認為煤炭企業未來戰略規劃應突出“安全、綜合、集約、高效、綠色、智慧、可持續”。西方學者認為煤炭產業處于衰退期[5],而我國學者通過客觀事實判斷煤炭產業將進入快速成長期[6],轉型升級[7]、綠色創新[8]是煤炭企業高質量發展的必由之路;以創新驅動我國煤炭企業發展模式變革、質量變革、效率變革,以能源大數據支撐能源供給側深化改革[9],為煤炭企業高質量發展范式提供了方向。
隨著高質量發展政策的提出,生態保護和經濟發展并行成為煤炭行業發展的新思路,學界采用演化博弈的方法識別煤炭企業碳減排的關鍵因素[10],探究綠色開采技術推廣演化規律[11],確定礦區復合生態系統的利益矛盾[12],構建礦區生態修復管理機制[13]和安全管理機制[14],通過提高企業質量治理能力[15],為推動煤炭行業技術革命,提高安全保障能力,增強生產效率提供理論指導,從微觀層面提升高質量發展研究水平。
現有研究主要是從煤炭企業安全管制、煤炭資源整合與配置、煤炭綠色低碳減排等方面進行博弈分析,而針對我國煤炭企業高質量發展中多方博弈主體參與的策略問題研究較少。在此背景下,本文從政府政策機制視角、煤炭企業主體視角、市場體制視角出發,運用三方動態博弈方法,深入探究我國煤炭企業高質量發展動力機制,為推進煤炭企業轉型升級提供理論上的支撐。
本模型由政府、煤炭企業和煤炭能源市場三個利益主體組成一個系統。在成熟的能源生產消費市場中,相關能源經濟政策、能源產品價格、企業發展模式等屬于公開透明信息,因此,假定該模型是完全信息博弈。模型中三方主體均為有限理性決策方,追求自身利益最大化且可進行自我學習。通過構建三方非對稱動態演化博弈模型,探究三方的最佳策略組合。研究各主體在博弈過程中不同決策的損益情況,參照部分學者研究中的博弈假設[10-13],并根據研究情景給予適當改進。博弈模型的基本邏輯框架如下所述。
博弈方1:政府。政府作為能源管理政策制定者,決策不能只考慮自身成本和收益,應以推動煤炭企業發展模式創新、保障能源市場體系穩定為主要目的,以社會效益和環境效益最大化為主要訴求。政府主要負責高質量發展相關政策的制定、政策履行(財政激勵和補貼支持)及對策調整等。本系統中政府有兩種策略選擇:激勵、不激勵。
博弈方2:煤炭企業(以下簡稱“企業”)。目前,除了個別優勢先進企業外,煤炭產業普遍存在發展不平衡、不充分問題[16]。基于技術創新和商業模式創新的高質量發展模式,可以解決相關問題。當然也有一些企業由于自身實力不足或缺乏創新意識而未轉型升級。因此,煤炭企業有兩種策略選擇:高質量發展模式、傳統粗放發展模式。
博弈方3:煤炭能源市場。能源市場屬于國家管制范疇,其中煤炭作為典型的大宗能源物資,主要面對的“市場”并不是數量龐大的終端消費者,而是少數若干大中型公司客戶(如火電廠、煉鋼廠、煉焦廠等)。煤炭能源市場(以下簡稱“市場”)既是煤炭企業生產產品的利益直接相關者,又是政府政策調控行為的間接受益者。本系統中市場對于企業高質量發展的反饋有兩種可能:接受高質量發展、不接收高質量發展。
博弈模型的相關參數及含義見表1。為不失一般性,假定以下因素的符號均為正,并基于表1假定,建立該模型的基本形式見表2。

表1 模型相關參數及含義Table 1 Model related parameters and meanings

表2 政府-企業-市場三方博弈模型收益矩陣Table 2 Tripartite game model benefit matrix of government-enterprise-market
本模型提出以下假設:政府選擇“激勵”的概率為x,選擇“不激勵”的概率為1-x;企業選擇“高質量發展模式”策略的概率為y,選擇“傳統粗放發展模式”策略的概率為1-y;市場選擇“接受高質量發展”策略的概率為z,選擇“不接受高質量發展”策略的概率為1-z。
政府選擇激勵和不激勵的期望收益πx1和πx,見式(1)和式(2)。
πx1=yz(U-M-S+W)+
y(1-z)(U-M-S-K+Q)+
(1-y)z(U-M-L+T)+
(1-y)(1-z)(U-M-K-L+Q+T)
(1)
πx2=yzW-y(1-z)K-
(1-y)zL-(1-y)(1-z)(L+K)
(2)
政府決策的復制動態方程,見式(3)。
F(x)=dx/dt=x(1-x)(πx1-πx2)=
x(1-x)(-Sy+U-M+Q+T-Ty-Qz)
(3)
由復制動態方程穩定性定理可知以下兩點。





圖1 政府決策的動態演化圖Fig.1 Dynamic evolution of government strategies
企業選擇高質量發展和傳統粗放發展模式策略的期望收益πy1和πy2見式(4)和式(5)。
πy1=xz(R+R′+βS-Cq)+
x(1-z)(R′+S-Cq)+
(1-x)z(R+R′-Cq)+
(1-x)(1-z)(R′-Cq)
(4)
πy2=xz(-C1-C2-T)+
x(1-z)(R1-C1-C2-T)+
(1-x)z(-C1-C2)+
(1-x)(1-z)(R1-C1-C2)
(5)
企業決策的復制動態方程見式(6)。
F(y)=dy/dt=y(1-y)(πy1-πy2)=
y(1-y)(βSxz+Sx-Sxz+Rz+R′-
Cq+Tx-R1+C1+C2+R1z)
(6)





圖2 企業決策的動態演化圖Fig.2 Dynamic evolution of enterprises strategies
市場選擇接受高質量發展和不接受高質量發展策略的期望收益πz1和πz2見式(7)和式(8)。
πz1=xy(A+S-βS)+(1-x)yA
(7)
πz2=-xyQ+x(1-y)(B-Q)+
(1-x)(1-y)B
(8)
市場決策的復制動態方程見式(9)。
F(z)=dz/dt=z(1-z)(πz1-πz2)=
z(1-z)(Sxy-βSxy+Ay+Qx+By-B)
(9)





圖3 市場決策的動態演化圖Fig.3 Dynamic evolution of market strategies

(10)
在非對稱博弈中,若演化博弈均衡E是演化穩定均衡,則E一定是嚴格納什均衡,而嚴格納什均衡又是純策略均衡,即在非對稱博弈中混合策略均衡一定不是演化穩定均衡。因此,只需討論純策略均衡的漸近穩定性即可。故討論E1(0,0,0)、E2(1,0,0)、E3(0,1,0)、E4(0,0,1)、E5(1,1,0)、E6(1,0,1)、E7(0,1,1)、E8(1,1,1)八個點的漸近穩定性,找出均衡穩定點,其余均為非漸近穩定狀態。穩定性分析可以通過Jacobian矩陣展開,其矩陣見式(10)。
由李雅譜諾夫第一法可知,當Jacobian矩陣的所有特征值λ>0時,均衡點是不穩定點,稱為源點;當Jacobian矩陣中所有特征值λ<0時,該均衡點是漸進穩定點,即為匯;當Jacobian陣的特征值λ中存在有正有負時,該均衡點是不穩定點,稱為鞍點。且漸進穩定點(ESS)的Jacobian矩陣的特征根必須小于0。下面以點E1(0,0,0)為例分析純策略納什均衡點的漸近穩定性(式(11)),其他點的穩定性證明類似可得。
(11)
上述矩陣的特征多項式見式(12)。

(12)
依據現實情況,煤炭企業選擇傳統粗放式發展模式時獲得的運營收益R1,付出的運營成本C1和風險損失C2三者滿足R1-C1-C2>0。
由表3可知在推進高質量發展過程中政府、企業、市場在不同情境下各自最終的演化穩定策略。演化的穩定狀態是三方博弈的結果,且會隨另外兩方選擇的比例變化而變化。本文致力于為社會提供政府激勵、企業高質量發展、市場積極接受的高質量發展模式,即鼓勵達到(x=1,y=1,z=1)的理想策略選擇狀態。 由表3分析得出:要使博弈三方達到理想狀態,需要滿足條件⑤:M-U+S<0,Cq-R-R′-βS-C1-C2-T<0,βS-S-A-Q<0。

表3 各均衡點穩定性判斷Table 3 Judging the stability of each equilibrium point
結合煤炭行業的自身特點,取各部門公布的行業指標的平均水平,并考慮滿足M-U+S<0,Cq-R-R′-βS-C1-C2-T<0,βS-S-A-Q<0的條件,將參數初始值設定為U=16,M=6,S=5,R=12,R′=5,Cq=13,β=0.6,R1=10,C1=6,C2=2,A=8,B=4,T=4,Q=3,進行模擬分析。
基于上述條件,將x初值設定為0.5(即設定:政府選擇“激勵”的概率為0.5),在0到1之間隨機對y和z賦值。由圖4可知,不同的y和z初值會對x的收斂速度產生影響,但x仍單調遞增并收斂于1,說明政府選擇“激勵”策略的比例會隨著時間持續增加,最終將全部選擇“激勵”策略。

圖4 y和z隨時間(t)變化時x值的演化曲線圖Fig.4 Evolution curve of x when y and z change with time
將y初值設定為0.5(即設定:煤炭企業選擇“高質量發展模式”的概率為0.5),在0到1之間隨機對x與z賦值。由圖5可知,在演化過程中y值并非單調遞增,甚至出現了明顯減小的情況,即在演化的初期企業選擇“高質量發展”的比例逐漸減小。這可能是由于該階段政府的政策激勵力度不大,市場對于高質量發展的接受度不高,且企業需要一段時間來適應和接受高質量發展新模式,所以導致企業逐漸轉向選擇傳統粗放式發展模式。但經過一定時間演化,政府采取適當的激勵措施,市場愿意接受高質量發展時,企業最終全部選擇“高質量發展”的策略。

圖5 x和z隨時間(t)變化時y值的演化曲線圖Fig.5 Evolution curve of y when x and z change with time
將z初值設定為0.5(即設定:煤炭能源市場選擇“接受高質量發展”的概率為0.5),在0到1之間隨機對x與y賦值。由圖6可知,在演化過程中市場選擇“接受高質量發展”的比例出現了大幅下降的情形,這表明市場需要時間來接受高質量發展。隨著時間的推移,政府采取適當的激勵措施,企業全面轉型為高質量發展模式時,市場最終將全部選擇“接受高質量發展”。

圖6 x和y隨時間(t)變化時z值的演化曲線圖Fig.6 Evolution curve of z when x and y change with time
圖7為三方決策組合的演化趨勢,給x、y、z進行三次賦值,分別為x=0.2,y=0.4,z=0.5;x=0.8,y=0.6,z=0.2和x=0.4,y=0.4,z=0.4。可以看出隨著時間的變化,三方主體最終都演化至穩定狀態點E8(1,1,1)。

圖7 三方博弈的演化路徑圖Fig.7 Evolution path of the three-party game
1) 在推動煤炭企業高質量發展的過程中,政府、煤炭企業和煤炭能源市場三個主體的不同決策之間相互影響。企業“不愿轉型,不能轉型,不敢轉型,不想轉型”,主要受到政府和市場決策行為的影響。
2) 當M-U+S<0,Cq-R-R′-βS-C1-C2-T<0,βS-S-A-Q<0時,動態穩定平衡點是E8(1,1,1)。 即當同時滿足以下三個條件:①政府激勵的成本和補貼之和小于其效用;②企業高質量發展的運營成本小于企業高質量發展的運營收益、潛在收益、所得補貼、企業傳統粗放式發展的總成本、企業傳統粗放式發展時交付政府的罰款之和;③企業高質量發展所得補貼小于政府付出的補貼、市場接受高質量發展的效用、市場不接受高質量發展時交付政府的罰款之和時,該三方博弈會演化至理想的穩定狀態。因此,模型能否達到全局穩定狀態將取決于政府激勵的成本、效用、補貼,企業高質量發展和傳統粗放式發展的運營成本、總收益,市場接受高質量發展的效用、不接受高質量發展時交付的罰款等參數值的大小。
3) 目前我國煤炭企業高質量發展仍處于初期階段,煤炭企業、煤炭能源市場都需要時間來適應和接受高質量發展這一新模式。在演化初期,政府激勵高質量發展的措施若單一且無明顯效果,加之市場監管與競爭體制尚不完善,會使得煤炭企業高質量發展的相關利益主體的參與積極性不高,導致企業和市場選擇和接受高質量發展的比例大幅下降。此時政府需著重發揮主導作用,提高企業和市場的傳統管控效用(罰款)以及激勵補貼,降低高質量發展的成本,有效提升企業轉型動力,促進市場積極接受高質量發展。
1) 從政府角度來看,針對煤炭企業高質量發展中不同階段的不同情形,政府需“審時度勢”,著重發揮調節作用。在高質量發展的初期,煤炭企業和市場對高質量發展的積極性難免不高,此時政府需著重發揮主導作用,給予推行高質量發展的行為以獎勵和反方向行為的懲罰,適當增加對市場和企業的激勵補貼及傳統管制效用,征收企業的資源、能源稅,環境污染罰款,對環境破環嚴重、安全事故較多的企業實施退出機制。當高質量發展到一定階段時,降低政府的政策性激勵成本,充分運用市場機制,利用無形資源如媒體、互聯網及非營利性組織進行政策宣傳和自動調節;此外適當降低對企業和市場的直接補貼,完善其他方式的激勵,比如對企業實施土地和稅收優惠政策、銀行給予貸款政策優惠等。
2) 從煤炭企業角度來看,除了追求企業利潤,也要提升社會效益和環境效益。在高質量發展初期,企業應抓住高質量發展先機,爭取得到更多政策支持,以降低企業運營總成本。此時高質量發展模式對于大多數企業和市場來說較為陌生,所以企業的銷售額可能減少甚至虧損,但從長遠來看,高質量發展會為煤炭企業創造大量經濟效益、社會效益和環境效益,對能源行業的持續健康發展產生深遠的影響。面對發展清潔能源的大趨勢,企業應以科技創新突破發展瓶頸,探索煤炭化學開采等前沿技術,提升煤炭作為清潔能源原料的比重,實現煤炭資源的清潔高效利用。
3) 從市場角度來看,市場應積極適應高質量發展帶來的煤炭消費結構變化。面對嚴格控制煤炭消費總量增長[17]的要求,應減少煤炭的低效消費量,降低煤炭作為燃料的消費比重,提高煤炭作為清潔能源原料的消費比重。目前火電企業的主體地位逐漸被清潔能源企業代替,其中以新型煤化工企業為代表的煤炭消費群體應主動參與到高質量發展建設之中,爭取獲得更多的財政補貼,提高高質量發展的增量效用。
本文以“政府-煤炭企業-煤炭能源市場”三方博弈機制分析為基礎,深入挖掘煤炭企業深層次機制障礙,分析煤炭企業“不愿轉型,不能轉型,不敢轉型,不想轉型”的深層次原因,有望識別并破解煤炭企業轉型升級成效不彰、高質量發展動力不足等現實瓶頸問題,為煤炭行業政策機制優化設計提供根本思路,為推進煤炭企業高質量發展提供學理上的支撐。
作為未來研究方向的建議,應針對煤炭企業高質量發展模式的創新構建,開展煤炭企業高質量發展模式的評價指標體系研究。