馬光紅, 鮑鋮奕, 單而芳
(上海大學管理學院, 上海200444)
“一帶一路”沿線國家大多為發展中國家, 基礎設施建設滯后. 為了實現基礎設施的互聯互通, 東道國政府利用PPP(public-private-partnership)模式增加基礎設施的供給. 沿線國家的基礎設施主要包括交通基礎設施和能源基礎設施, 其中交通基礎設施涵蓋鐵路、港口和道路等項目; 能源基礎設施涵蓋輸油管線、輸電系統和跨境光纜等項目. 在“一帶一路”背景下, 我國一些企業參與基礎設施的投資. 由于PPP 基礎設施項目系統的復雜性和利益主體的多元性,我國企業面臨較高的投資風險. 為了降低多元主體合作不穩定引致的利益損失, 本工作利用演化博弈理論, 研究了影響PPP 項目合作穩定性的主要因素.
“一帶一路”PPP 基礎設施項目的合作受環境及主要利益主體的策略選擇等多方面的影響. 一方面, 沿線國家地緣政治復雜, 投資環境存在較大差異性和波動性, 如投融資市場不健全、東道國貨幣市場不穩定、匯率波動幅度較大等, 使得我國社會資本投資于跨區域基礎設施的激勵不足. 另一方面, 基于本國經濟、社會以及生態的考量, 沿途國家對我國“一帶一路”倡議的響應存在明顯差異, 或積極參與、或等待觀望、或放棄合作. 此外, 作為基礎設施的消費者和使用者, 當地公眾對基礎設施投資的反應也較大程度上影響著項目的進一步開展.
國內外關于PPP 國際基礎設施項目的研究主要涉及合作意愿、項目績效及風險分析等方面. Biygautane 等[1]對海灣合作委員會三個國家的PPP 基礎設施合作前景進行了研究, 為卡塔爾、沙特阿拉伯和科威特開展PPP 基礎設施的合作提供政策建議. Shi等[2]研究了基礎設施項目中政府補貼政策、績效保障政策與PPP 基礎設施項目效率之間的關系. 結果顯示, 績效保證和政府補貼融合的政策可提高PPP 基礎設施項目的效率. Ye 等[3]分析了私營部門在PPP 基礎設施項目中的投資意愿. 結果表明, 項目經驗豐富、政企關聯度高、盈利能力強的社會資本方更具有主動參與PPP 項目的意愿. 袁競峰等[4]通過研究國際PPP 基礎設施項目關鍵績效相關指標, 為我國企業進入PPP 國際市場投資提供了重要的參考依據. 趙澤斌等[5]應用前景理論和風險感知因素分析了公共部門與私人部門在重大基礎設施工程風險管理過程中的演化和穩定條件, 揭示影響雙方風險管理決策的驅動因素, 為強化PPP 重大基礎設施合作的風險管理提供了重要依據.
演化博弈是一種研究系統穩定性的有效方法[6], 可以描述行為策略的動態演化過程, 目前已廣泛應用于經濟、管理等多個學科領域. Babu 等[7]以演化博弈理論解釋了供應鏈成員行為引發級聯效應而使系統遠離均衡的現象, 并用博弈均衡評估了供應鏈的可持續性.Ozkan-Canbolat 等[8]認為戰略創新在其相關行業內存在演化過程, 且業務模式的演化結果需要重新界定. Yang 等[9]從市場機制和行政監督機制出發, 用演化博弈模型研究了知識產權合作下多利益相關者的策略和收益函數, 并探究其合作演化的穩定策略組合. 馬翔等[10]對京冀霧霾治理聯盟的穩定性展開研究, 構建了聯盟的非對稱演化博弈模型, 分析其穩定性, 探索最優策略組合, 并提出了有利于霧霾治理合作的建議. 朱慶華等[11]對地方政府與相關企業的碳減排博弈展開了靜態混合策略和動態策略演化博弈分析, 為政府制定合理的補償、懲罰政策提供參考.
綜上, 國內外學者運用演化博弈理論在供應鏈評估、霧霾治理合作、碳減排管理等領域進行了深入的研究, 所得結果為本研究提供了重要的理論依據和思路借鑒. 本工作綜合考慮了PPP 國際基礎設施系統的復雜性, 從公共部門、私人部門以及公眾的合作視角為切入點, 創新性地構建了東道國政府、我國企業、公眾的三方博弈模型, 分析了利益相關主體行為策略的選擇; 探究了穩定性影響因子, 梳理了影響PPP 基礎設施項目合作穩定的因素, 并結合工程實例進行了數值仿真. 研究結果以期對東道國政府和我國社會資本方提供策略依據.
演化博弈基于“有限理性”假設. 博弈方的認知和信息均有限, 需要通過不斷學習和模仿成功策略, 逐漸自我修正而趨于滿意. 國際PPP 基礎設施項目可參考的經驗較少, 環境復雜, 且我國企業、東道國政府以及公眾對合作項目的認知也很有限[12]. 此外, PPP 基礎設施合作中存在學習和模仿的過程, 具有復制優異策略的傾向. 博弈三方通過了解前期合作項目, 基于自身利益的考量, 進一步修正策略以獲得預期的結果. “一帶一路”PPP 基礎設施項目的合作符合演化博弈的基本假設.
1.1.1 博弈中的參與方
在“一帶一路”PPP 基礎設施合作中, 主要存在3 個有限理性的博弈方, 分別是東道國政府、我國投資企業、當地公眾.
1.1.2 博弈三方行為策略
東道國政府和我國企業是PPP 基礎設施項目的直接參與者, 公共部門主要扮演監管者角色, 維護公眾利益, 其策略空間為{合作, 不合作}. 我國企業作為PPP 項目的社會資本方, 是投資主體之一,也是項目的建設者和特許經營期內的運營者,其策略空間為{合作,不合作}. 當地公眾是項目的間接參與者, 可以向公共部門提出利益訴求. 如果是使用者支付項目, 公眾的支付水平會影響投資企業的收益, 其策略空間為{強參與且嚴格監督, 弱參與且不嚴格監督}.
假設東道國政府、我國企業、當地公眾采取“合作”、“合作”、“強參與且嚴格監督”策略的概率分別為x, y, z; 采取“不合作”、“不合作”、“弱參與且不嚴格監督”策略的概率分別為1-x, 1-y, 1-z, 其中0 ≤x ≤1, 0 ≤y ≤1, 0 ≤z ≤1.
1.1.3 收益矩陣及參數假設
πg,πe: PPP 基礎設施項目合作成功時, 東道國政府、我國企業的綜合凈收益, 包括項目的直接收益和項目衍生的間接收益.
πp: 基礎設施投資為當地公眾帶來的收益, 包括就業機會增加、收入提高、交通改善、貿易流通成本降低所帶來的收入提高等.
cg,ce: 東道國政府或我國企業因對方中止合作造成的損失, 包括前期調研、項目報建、招投標采購、融資準備等前期成本.
cp: 當地公眾選擇“強參與且嚴格監督”策略時額外的監督成本.
t : 東道國政府為吸引我國社會資本投資所提供的稅收優惠, 以及為協助我國企業項目運作、融資等而成立PPP 管理機構、制定相關政策支持所投入的成本.
α,β : 當地公眾選擇“強參與且嚴格監督”策略時, 東道國政府、我國企業為爭取項目獲得公眾支持而分別承諾公眾的社會福利及提供的優惠.
ω,μ : 東道國政府、我國企業二者中主動放棄合作一方的沉沒成本及國際聲譽損失, 包括因此損失的其他項目合作機會及國際信譽的下降等.
PPP 基礎設施項目三方收益矩陣如表1 所示.
演化博弈理論表明, 當某種行為策略的收益高于平均收益時, 采用該策略的比例會在種群中逐漸上升, 體現優異策略的趨向性[13]. 以動態微分來描述這一策略采用頻率或頻數趨向性的方程式就是復制動態方程.

表1 演化博弈三方收益矩陣Table 1 Tripartite payoffmatrix of evolution game
(1) 根據收益矩陣, 東道國政府采取“合作”、“不合作”策略的期望收益分別為

其平均期望收益為

東道國政府采取“合作”策略的復制動態方程為

(2) 我國投資企業采取“合作”、“不合作”策略的期望收益分別為

其平均期望收益為

我國投資企業采取“合作”策略的復制動態方程為

(3) 當地公眾采取“強參與且嚴格監督”、“弱參與且不嚴格監督”策略的期望收益分別為

其平均期望收益為

當地公眾采取“強參與且嚴格監督”策略的復制動態方程為

令式(1)~(3)均等于0, 得到演化博弈的14 個均衡點. 結合各參數的實際涵義, 篩選出滿足條件0≤x ≤1, 0≤y ≤1, 0≤z ≤1 的均衡點共10 個, 分別為E1(0,0,0), E2(0,0,1), E3(0,1,0),
由李雅普諾夫穩定性理論[14]可知, 均衡點漸進穩定的充要條件是對應雅克比矩陣的所有特征值均具有負實部. 由微分方程(1)~(3)得出雅克比矩陣為

將10 個均衡點分別代入上述雅克比矩陣, 運用Matlab 軟件求解矩陣特征根, 逐一判斷穩定性, 判別結果如表2 所示, 其中考慮各參數的實際涵義, 本工作認為πg?t+α, πe?β, 因此均衡點E7, E8的第一、二項特征根均可判斷為負.

表2 演化博弈模型均衡點的穩定性分析Table 2 Stability analysis of equilibrium points in evolutionary game model
由表2 可知, 均衡點E1(0,0,0)的特征根全部為負, 均衡點E7(1,1,0)的全負特征根條件為α+β <cp, E8(1,1,1)的全負特征根條件為α+β >cp, 二者相反, 不存在交集. 因此可判斷該演化博弈模型存在兩種漸進穩定情況: 當滿足α+β <cp時, 漸進穩定點為E1(0,0,0)與E7(1,1,0); 當滿足α+β >cp時, 漸進穩定點為E1(0,0,0)與E8(1,1,1).
為研究影響PPP 基礎設施合作穩定的因素, 基于演化博弈模型漸進穩定結果及均衡點的空間位置和演化方向, 分別進一步分析了兩種情形下各參數對合作穩定性的影響.
當α+β <cp, 東道國政府與我國投資企業提供的社會福利和優惠低于公眾“強參與且嚴格監督”策略的額外監督成本時, 經過演化, 公眾行為策略逐漸傾向收益更優的“弱參與且不嚴格監督”策略. 均衡點E1(0,0,0)與E7(1,1,0)漸進穩定, E9, E10為鞍點. 根據E9, E10所在的空間位置可知, E9可能演化至E1(0,0,0)或E7(1,1,0), 且演化至E1(0,0,0)和E7(1,1,0)的可能性分別與區域Ⅰ和區域Ⅱ的面積大小有關. 演化路徑如圖1 所示.

圖1 E1(0,0,0), E7(1,1,0)漸進穩定時的演化路徑Fig.1 Evolutionary path for asymptotic stability of E1(0,0,0) and E7(1,1,0)
若博弈三方初始狀態落在區域Ⅰ, 行為策略組合將演化至E7(1,1,0), 即{合作, 合作, 弱參與且不嚴格監督}. 同理, 若博弈三方初始狀態落在區域Ⅱ, 博弈將演化至E1(0,0,0), 即{不合作, 不合作, 弱參與且不嚴格監督}. 區域Ⅰ面積越大, 則博弈演化至“合作”策略組合的可能性越高, 合作穩定性越強[15]. 根據E9的空間位置可知, 區域Ⅰ的面積S1為

由式(4)可知, 當E1(0,0,0)與E7(1,1,0)漸進穩定, 影響“一帶一路”PPP 基礎設施合作穩定性的主要參數包括東道國政府和我國企業的綜合投資凈收益πg, πe, 一方違約時另一方的前期沉沒成本cg, ce, 政策支持t, 國際聲譽損失ω, μ. 各參數對合作穩定性的影響分析如下.
(1) 東道國政府、我國企業的投資凈收益πg, πe.
(2) 一方違約時, 合作另一方的前期成本cg, ce.
(3) 東道國政府政策支持t.
(4) 東道國政府、我國企業聲譽損失ω, μ.
當α+β >cp, 東道國政府與我國投資企業提供的社會福利和優惠高于公眾“強參與且嚴格監督”策略的額外監督成本時, 基于收益的考量, 公眾對“強參與且嚴格監督”策略的傾向性逐漸增大. 均衡點E1(0,0,0), E8(1,1,1)漸進穩定, E9, E10為鞍點. 根據鞍點所在空間位置可知, E9將演化至E1(0,0,0), E10將演化至點E8(1,1,1). 演化路徑如圖2 所示.

圖2 E1(0,0,0), E8(1,1,1)漸進穩定時的演化路徑圖Fig.2 Evolutionary path for asymptotic stability of E1(0,0,0) and E8(1,1,1)
博弈三方初始狀態落在區域Ⅲ或Ⅳ, 合作將分別演化到E8(1,1,1)或E1(0,0,0), 區域面積越大, 演化至相應策略組合狀態的可能性越大. 根據E9, E10的空間位置可知, 區域Ⅲ, Ⅳ的面積S3, S4分別為

由式(5), (6)可知, 區域Ⅳ的面積S4的參數不包括社會福利α 和優惠β. 投資凈收益πg,πe,前期沉沒成本cg,ce,政策支持t 和聲譽損失ω,μ在式(5)和(6)中均有出現,但各參數對S3,S4的影響程度相同、方向相反, 且S3, S4的面積大小與合作穩定性的關聯方向也相反. 因此,區域Ⅲ的面積S3能夠完整體現該情形下各參數對合作穩定的影響. 下面根據式(5)展開分析.(1) 東道國政府、我國企業的綜合凈收益πg, πe.
(2) 東道國政府、我國企業的前期成本cg, ce.由可知, 參數實際取值范圍內,S1對cg, ce均單調遞減. 契約一方違約意向強烈, 博弈另一方招投標階段成本越高, 合作穩定性趨弱.
(3) 東道國政府政策支持t.
(4) 東道國政府、我國企業聲譽損失ω, μ.
(5) 東道國政府、我國企業提供的社會福利和優惠α, β.
以上分析結果表明, 兩種演化情形下, 各項參數對博弈演化方向的影響具有一致性. PPP項目綜合投資凈收益πg, πe的增加, 招投標階段投入成本cg, ce的有效控制, 確定最優政策支持t*、公共部門、社會資本方適當給予公眾一定的社會福利α 和優惠β, 提高PPP 項目的國際關注度, 都能夠增強“一帶一路”PPP 基礎設施項目的合作穩定性.
為了驗證上述結論, 更直觀地刻畫博弈演化的過程及各參數取值對演化結果的影響, 本工作運用Matlab, 結合PPP 基礎設施工程實例對三方合作策略演化博弈過程進行仿真.
“一帶一路”沿線某國家, 利用我國社會資本, 采用PPP 模式建設城市軌道交通項目. 項目投資額50 億美元, 特許經營期25 年. 根據投資項目可行性研究報告, 相關參數取值如下: πg= 0.8 億美元, πe= 3.0 億美元, πp= 600 萬美元, cg= 200 萬美元, ce= 250 萬美元,t=500 萬美元, ω =150 萬美元, μ=100 萬美元.
(1) 情形A. 取cp= 100 萬美元, α = 3 萬美元, β = 5 萬美元. 三方初始策略比例設定如下: 我國企業“合作”策略比例x=1/3、東道國政府“合作”策略比例y =1/3、當地公眾“強參與且嚴格監督”策略比例z = 1/3. 策略組合演化至{合作, 合作, 弱參與且不嚴格監督}, 演化過程如圖3 所示.

圖3 情形A 演化路徑Fig.3 Evolutionary path for asymptotic stability A
(2) 情形B. 取cp=10 萬美元, α=600 萬美元, β =300 萬美元. 三方初始策略比例如下:我國企業“合作”策略比例x=1/3、東道國政府“合作”策略比例y =1/3、當地公眾“強參與且嚴格監督”策略比例z = 1/3. 策略組合演化至{合作, 合作, 強參與且嚴格監督}, 演化過程如圖4 所示.

圖4 情形B 演化路徑Fig.4 Evolutionary path for asymptotic stability B
博弈最終演化方向除了與參數取值相關, 也受三方初始策略比例的影響. 在情形B 中, 三方初始策略比例x, y, z 取值降低至(0.13, 0.13, 0.13)時, 演化結果仍與圖4 相同; 但當我國企業與東道國政府的初始“合作”策略比例進一步降至x=y =0.12 時, 系統演化方向突變, 如圖5 所示. 這表明漸進穩定點E1具有一定的初始狀態依賴, 且博弈存在演化突變.

圖5 合作策略演化突變Fig.5 Strategy mutation of the evolution
(1) 投資凈收益πg, πe.
固定其他參數取值, πg, πe∈[0.5, 5]億美元, 用Matlab 模擬項目投資凈收益πg, πe對合作穩定的影響, 結果如圖6 所示. 可見, S3隨著投資凈收益πg, πe的增大而增加. “一帶一路”PPP 基礎設施合作中東道國政府、我國投資企業預期的綜合投資凈收益πg, πe越高, 雙方越傾向于采取積極的“合作”策略.

圖6 投資凈收益對合作的影響Fig.6 Impact of investment returns on cooperation
(2) 招投標階段前期成本cg, ce.
固定其他參數取值, cg, ce∈[0.5, 5]億美元, 用Matlab 模擬前期成本cg, ce對合作穩定性的影響, 結果如圖7 所示. 可見, S3隨cg, ce的增大而減小. 當一方違約時, 博弈另一方基于風險規避的目的, 其沉沒成本越高, 選擇“合作”策略的可能性越小, 合作穩定性降低.
(3) 政策支持t.
固定其他參數取值, t ∈[0,0.8]億美元, 用Matlab 模擬東道國政府政策支持t 對合作穩定性的影響, 結果如圖8 所示. 可見, S3隨著t 的增大先逐漸增加, 達到極大值后隨t 的進一步增大而顯著減小. 東道國政府可通過尋求最優政策支持水平, 以促進“一帶一路”PPP 基礎設施的合作穩定. 但是, 過高的政策支持和優惠使政府財政壓力增加, 與通過PPP 模式引入社會資本的目的相悖, 政府合作策略的選擇可能性減小, 合作穩定性趨弱.

圖7 招投標階段對合作的影響Fig.7 Impact of bidding period costs on cooperation

圖8 東道國政府政策支持對合作的影響Fig.8 Impact of policy support on cooperation
(4) 國際聲譽損失ω, μ.
固定其他參數取值, ω,μ ∈[0,0.03]億美元, 用Matlab 模擬國際聲譽損失ω, μ對合作穩定的影響, 結果如圖9 所示. 可見, S3隨ω, μ的增大具有同向變動趨勢, 但相比投資企業違約所承擔的國際聲譽損失μ, 東道國政府違約所承擔的國際聲譽損失ω 對S3有著更顯著的影響.這表明國際聲譽損失的增加, 能促進“一帶一路”PPP 基礎設施合作的穩定性. 國際關注度越高, 東道國政府選擇積極的“合作”策略的概率越大.
(5) 社會福利α 和優惠β.
固定其他參數取值, α, β ∈[0,0.1]億美元, 用Matlab 模擬東道國政府和我國企業提供的社會福利α 和優惠β 對合作穩定的影響, 結果如圖10 所示. 可見, S3隨著α, β 取值的增大而異向變動. 提供過高的社會福利及降低經營期內的特許價格, 會減少東道國政府和我國企業的收益, 從而弱化雙方的合作意愿.
以上Matlab 工程案例仿真驗證了穩定性影響因子的分析結果.
國際PPP 基礎設施項目風險復雜, 相關利益主體合作的不穩定將影響我國社會資本的投資收益. 因此, 研究不同利益主體的策略選擇有助于項目的合作共贏. 本工作運用演化博弈理論, 創新性地構建了“一帶一路”PPP 基礎設施合作中東道國政府、我國企業、公眾的三方演化博弈模型, 建立了相互制約的博弈收益矩陣, 以復制動態方程分析了不同策略組合、不同均衡情形下博弈的演化路徑, 并運用Matlab 進行了演化路徑仿真和數值模擬. 本工作的主要結論如下: ①東道國的政策支持, 包括稅收減免、最低收益擔保、融資服務、勞動力準入服務以及法律支持等, 對我國社會資本進入該國的PPP 基礎設施市場以及采取合作策略具有較強的激勵機制; ②基礎設施作為公共品, 特許價格水平影響民眾的福利和投資主體的收益, 如果PPP 項目特許定價較低, 民眾獲得較高的福利, 博弈向不合作方向演化, 因此東道國政府和我國社會資本方應該確定合理的特許價格; ③PPP 基礎設施跨域合作受到國際關注, 擴大關注度以提高違約方的聲譽損失有利于項目的合作穩定. 此外, 投資凈收益具有正向激勵作用, 東道國政府和我國企業應該加強風險管理和控制, 以保證獲得預期的投資回報.

圖9 國際聲譽損失對合作的影響Fig.9 Impact of international reputation loss on cooperation

圖10 社會福利和優惠對合作的影響Fig.10 Impact of social benefits and preferences on cooperation
本工作通過構建PPP 基礎設施項目三方合作演化模型, 分析了影響合作穩定的主要因素,但還沒有將各相關因素深入展開, 例如東道國提供的政策支持可進一步細分為稅收優惠、融資服務、法律支持等. 后續研究應結合各利益相關主體的具體行為特征探討更直觀的合作穩定影響因子.