和燕杰
(麗江師范高等專科學校國際旅游與工商管理學院,云南 麗江 674199)
建設長江經濟帶,不但能促進經濟發展由東向西梯度推進,縮小區域發展差距,還能優化全國經濟結構,形成與絲綢之路經濟帶的戰略互動,是新時期促進我國區域經濟協調發展,直接惠及6億國民的重大戰略舉措(李克強,2014)[1]。在這樣的背景下,研究長江經濟帶沿線各省市如何基于異質性的比較優勢強化彼此之間的經濟合作,事關中國區域經濟的協調發展,事關國家發展戰略的實現,因而是一個十分重要的現實與理論問題。在建設長江經濟帶的進程中,流域所特有的上下游之間的自然聯系使得生態保護等合作領域具備了公共物品的性質,從而導致市場失靈,合作效率不高,甚至使合作流于形式。這主要是由于經濟運行機制在特定領域內不能自發調節以及政府的制度安排不能校正市場失靈而產生的(Field,2008)[2],但從根本上講是由于區域利益的不一致所導致的。所以,需要通過必要的政策矯正來克服市場失靈,使得區域利益趨向一致,不斷提升公共物品供給合作的績效。因此,深入研究長江經濟帶跨區域公共物品供給合作問題,對于深化長江經濟帶經濟合作,促進長江流域經濟的協調發展,保證生態安全都有著重大的現實意義。
流域生態環境作為公共產品具有顯著的跨區域性,它不但具有全國屬性,還具有鮮明的地域屬性(彭高旺,2009)[3],其供給不僅要由中央政府來承擔,而且更重要的是要由區域內所有受益者共同承擔(李寧等,2010)[4]。流域生態環境不但具有不可分割的自然屬性,還具有顯著的外部性特征且生態產權難以界定(梁麗娟等,2006)[5]。上游地區如果為了獲得最大的經濟利益而過度使用環境資源,即使出現生態災難,其成本也可以很方便的轉嫁給下游地區,形成負的外部性,而上游地區如果有著保護生態環境的積極性,則下游地區可以獲得正的外部性,因此出于各自的經濟利益,上游地區有著過度開發的偏好(王燕,2011)[6],而下游地區則有著免費搭便車的偏好(Sandler T,2009)[7]。這種區域利益的不一致導致了流域公共物品的供給合作存在很大困難,合作效率不高。那這些問題如何解決?從現有文獻看,代表性的觀點有:比較優勢理論和分工理論并不能解決流域經濟合作問題,其很大的原因是由于以GDP為導向的地方政府政治晉升機制進一步強化了這種區域利益的不一致從而增加了合作的難度(卓凱、殷存毅,2007)[3],因為這種利益不一致導致了地方保護主義的長期存在(周黎安,2004[8]),并且由于地方政府對局部利益的偏好,在沒有相應“秩序”規范的條件下,“諸侯經濟”這種不合作的現象勢必出現(殷存毅,2004)[9]。因此中國的改革最難的不是“體制摩擦”問題,而是其身后的“利益摩擦”問題,所以改革的關鍵是解決利益不一致所產生的各種利益矛盾問題(樊綱,2009)[10],而建立穩定的合作制度需要滿足合作制度內生性、參與各方利益平衡、參與方必須切實感受到合作的互利以及合作制度對參與方具備約束力等條件(青木昌彥,2000[11])。顯然,利益受益者對受損者進行利益補償以及由國家提供承諾將有助于解決流域公共物品供給合作中所產生的利益不一致的問題(盧周來,2008)[12]。沿著這樣的思路,本文將基于博弈分析的框架研究利益不一致與長江經濟帶跨區域公共物品供給合作問題,以探索提升長江經濟帶跨區域公共物品供給合作績效的道路。
長江經濟帶生態保護問題是長江經濟帶區域經濟合作中重要的合作領域之一,同時還是長江經濟帶區域經濟合作的難點之一,很具有典型性。為了方便進一步分析問題,本研究假設如下:(1)長江經濟帶有上游區域A和下游區域B兩個利益主體;(2)將A和B看作是具有完全理性的決策主體;(3)A和B的決策是兩種純策略即A是保護與不保護而B是補償與不補償;(4)A選擇保護策略時得到的長期收益LR;A選擇不保護策略時得到的短期收益SR;A選擇保護策略時所要支付的成本C1;B選擇補償策略時所要支付的成本C2;當A選擇保護策略時,B得到的外部性收益E1;當A選擇不保護策略時,B得到的外部性收益E2;LR、SL、E1、E2、C1和C2為正數,LR、SL、E1和E2都與時間有關。
缺乏剛性的約束機制條件下的短期博弈均衡。所謂雙方的合作缺乏剛性的約束機制,就是指沒有對不保護和不補償的策略選擇進行懲罰的制度安排。假設決策參與者A采取保護策略,參與者B采取補償策略,這樣A采取保護策略要付出保護成本但由于可以得到B的補償而可以獲得收益LR-C1+C2,B采取補償策略也要支付補償但同時可以得到由于A的保護而產生的外部性收益而最終也可以獲得收益E1-C2;如果A選擇保護,而B選擇不補償,那么A不但要付出保護成本同時還得不到B的補償而只能得到收益LR-C1,而B則不但可以不支付成本C2并且還可以搭A保護生態的便車得到收益E1;如果A選擇不保護,B選擇補償,那么A由于可以獲得短期利益(如伐木收益等)同時還可以獲得B的補償而可以獲得收益SR+C2,B則一方面要提供補償另一方面要承受由于A破壞生態而帶來的外部性的利益損失而只能得到收益E2-C2;假如A選擇不保護,B選擇不補償,那么A可以得到收益SR,B則可以得到收益E2。最終,參與博弈的各方選擇怎樣的策略取決于各方自身的利益。
根據以上分析,構建博弈模型,如圖1所示。

圖1 長江經濟帶跨區域公共物品供給短期博弈模型
在短期內,上游區域A由于選擇保護策略所產生的效益不可能立即顯現,而是需要相當長的時間,因此在短期內短期利益總是要大于長期利益,即LR
為了克服個體理性與集體理性之間的矛盾,引入剛性的行為約束機制對行為主體進行必要而有效的約束。對上述的假設進行必要的修正,其他假設不變,增加兩條假設:(5)雙方建立了剛性的行為約束機制;(6)F1是在上游區域A選擇不保護策略的條件下,區域A所受到的懲罰;F2是在下游區域B選擇不補償策略的條件下,區域B所受到的懲罰。這樣,可以構建博弈模型,如圖2所示。

圖2 引入剛性約束機制后的長江經濟帶跨區域公共物品供給短期博弈模型
通過分析,無法確定這一過程是否存在純策略的納什均衡,因此只能從定義出發求混合策略的納什均衡。假設μ是A選擇保護策略的概率,γ是B選擇補償策略的概率。
在給定μ的條件下,B選擇補償策略(γ=1)和不補償策略(γ=0)的期望收益:
πB(1,μ)=(E1-C2)μ+(E2-C2)(1-μ)
πB(0,μ)=(E1-F2)μ+(E2-F2)(1-μ)
πB(1,μ)=πB(0,μ)
F2=C2
在給定γ的條件下,A選擇保護策略(μ=1)和不保護策略(μ=0)的期望收益:
πA=(1,γ)=(LR-C1+C2)γ+(LR-C1)(1-γ)
πA=(0,γ)=(SR+C2-F1)γ+(SR-F1)(1-γ)
πA=(1,γ)=πA(0,γ)
F1=LR-C1+SR
所以F2=C2和F1=LR-C1+SR是B和A選擇不同策略的臨界點,因此只要保證F2≥C2和F1≥LR-C1+SR,就有混合策略的納什均衡解(保護,補償),所以對于具有公共品性質的合作領域,應當建立一種剛性的約束機制,這種機制應當充分發揮政府特別是中央政府的作用,通過減少政策的供給、減少稅收返還甚至調整地方政府人事等手段來對于非合作行為進行懲罰,實現A、B兩區域由利益不一致向利益一致、短期行為向長期行為轉化。
盡管在短期博弈中,為了分析問題的方便,假設長江經濟帶存在兩個利益主體,分別為上游區域A和下游區域B,但實際的情況是上游區域有著很多利益主體,同樣下游區域也有著多個利益主體,哪怕同在上游或下游區域的各個博弈主體之間的利益也是不一致的,因此認為各博弈主體具備完全理性是不合理的,而較為合理的假設是博弈各方的理性是有限的。盡管建立了剛性的約束機制,并且還有社會輿論的強大壓力(因為社會各界不希望長江流域陷入生態災難之中,而任何博弈方都不希望成為眾矢之的),但各博弈方不可能在任何情況下都遵循同一種保護或不保護以及補償或不補償的純策略,并且最優策略也不是一開始就有的,而是隨著時間的推移而不斷學習演化的過程。當然,更為重要的是利益不一致這一根本問題依然還將長期存在。因此,博弈雙方的各個行為主體在長期內通常會采用混合策略。那么,上游和下游區域雙方之間就形成了大群體成員的反復博弈的基本態勢。基于以上分析,放松一些條件后,對原先的假設做進一步的修正:(1)長江經濟帶有兩個利益群體,分別為上游區域和下游區域;(2)參與者決策是混合策略;(3)LR是上游區域選擇保護策略時得到的長期收益;SR是上游區域選擇不保護策略時得到的短期收益;C1是上游區域選擇保護策略時所要支付的成本;C2是下游區域選擇補償策略時所要支付的成本;E1是上游區域選擇保護策略的條件下下游區域得到的外部性收益;(4)E2是上游區域選擇不保護策略的條件下下游區域得到的外部性收益;(5)F1是在上游區域選擇不保護策略時受到的懲罰;(6)F2是在下游區域選擇不補償策略的條件下,其所受到的懲罰。LR、SL、E1、E2、C1、C2、F1和F2都為正數。
假設在初始狀態下,上游區域博弈主體中選擇保護策略的比例為α(0≤α≤1),而選擇不保護策略的比例為1-α;下游區域博弈主體中選擇補償策略的比例為β(0≤β≤1),而選擇不保護策略的比例為1-β。顯然,α和1-α以及β和1-β都是隨著時間的變化而不斷變化的,因此可以將其記成時間的函數α(t)、1-α(t)、β(t)和1-β(t),但是為了分析問題的方便可以仍然簡記成α、1-α、β和1-β。基于此,構建長期動態博弈模型,如圖3所示。

圖3 長江經濟帶跨區域公共物品供給長期動態博弈模型
從圖3的支付矩陣中,可以發現這一長期動態博弈過程并不存在純策略均衡。下面,求長期動態博弈的混合策略均衡。
上游區域選擇保護或不保護策略的預期收益是:
π保護=β(LR-C1+C2)+(1-β)(LR-C1)
π不保護=β(SR+C2-F1)+(1-β)(SR-F1)
平均預期收益是:
由生物進化的“復制動態機制”可得上游區域選擇策略傾向的復制動態方程(謝識予,2007)[13]:
下游區域選擇補償或不補償策略的預期收益是:
π補償=α(E1+C2)+(1-α)(E2-C2)
π不補償=α(E1-F2)+(1-α)(E2-F2)
平均預期收益是:
同理,可得下游區域選擇策略傾向的復制動態方程:
令G(α)=0,G(β)=0,可得α*和β*的兩個穩定狀態均為0和1。依據微分方程的穩定性定理以及演化穩定策略的性質(謝識予,2007),可得:






基于以上分析,可以得到長江經濟帶跨區域公共物品供給長期動態博弈的相位圖,如圖4所示。

圖4 長江經濟帶跨區域公共物品供給長期動態博弈相位圖
在圖4中,不難看出,長江經濟帶上游地區群體與下游地區群體之間經過長期多次反復博弈的兩種進化穩定策略結果為(α*,β*)=(1,1)=(保護,補償)或者(α*,β*)=(0,0)=(不保護,不補償)。顯然,初始狀態采用不同策略的比例決定著系統最終會收斂于哪種進化穩定策略。假如初始狀態落在B區時,系統會收斂到屬于帕累托最優均衡的進化穩定策略(α*,β*)=(1,1)=(保護,補償);假如初始狀態落在C區時,系統會收斂到屬于帕累托劣均衡的進化穩定策略(α*,β*)=(0,0)=(不保護,不補償);假如初始狀態落在A區或者D區時,既有可能進入B區并最終收斂到(保護,補償),也有可能進入C區并最終收斂到(不保護,不補償)。因此,為了使系統收斂于帕累托最優均衡,即(α*,β*)=(1,1)=(保護,補償),除了使初始的博弈點出現在B區以外,更為重要的是要盡可能的擴大B區的面積,減少C區的面積。B區的面積為:

從長期來看,對于長江經濟帶上游地區而言,由于生態保護的效益隨著時間的推移而日漸顯現,帶來社會效益的同時,伴隨著旅游休閑等綠色產業的發展,將帶來更大的經濟效益,長期收益不斷增大。更為重要的是,隨著合作的不斷深化以及流域經濟一體化的實現,不斷增強的經濟實力使得上游地區完全具備了支付保護生態成本的能力和意愿。對于下游地區而言,隨著流域經濟一體化的實現,上游地區會因為保護生態的原因而大力發展綠色產業,下游地區所具備的資金、技術等比較優勢也能為上游地區發展綠色產業提供合作,并因此獲得利益。最終,這一切將使補償變成為市場機制下的價值交換,各方將形成長期的博弈均衡,補償也將成為歷史。
長江經濟帶生態保護所具有的公共品的特性導致推進和深化長江經濟帶生態領域的合作要比其他合作領域困難,是長江經濟帶經濟合作的難點之一。短期內,在缺乏剛性約束機制條件下,各個參與者都會選擇(不保護,不補償)這一嚴格優勢策略。因此,對于具有公共品性質的合作領域,應當引入剛性的行為約束機制對行為主體進行必要而有效的約束,充分發揮政府特別是中央政府的作用,通過減少政策的供給、轉移支付甚至是調整地方政府人事等手段來對于非合作行為進行懲罰,以保證產生混合策略的納什均衡解(保護,補償),實現由利益不一致向利益一致、短期行為向長期行為轉化。長期內,要產生帕累托最優均衡的進化穩定策略即上游地區選擇保護策略,下游地區選擇補償的策略,就必須滿足長期收益能補償生態保護的成本和短期收益的條件,但這種補償并不是一開始就能滿足的,尤其是在博弈演化剛開始的一段時期內,因此需要對不保護的行為進行必要的懲罰,其懲罰的力度應以能補償上述的成本和短期收益為底線,越大越好。這樣,會使博弈結果朝著帕累托最優的方向演進。這一演進的結果會使長江經濟帶上游地區生態保護的效益隨著時間的推移而日漸顯現,帶來社會效益的同時,將帶來更大的經濟效益,使得長期收益不斷增大,對保護成本和短期收益的補償能力也不斷增強。更為重要的是,隨著合作的不斷深化以及流域經濟一體化的實現,不斷增強的經濟實力使得上游地區完全具備了支付保護生態成本的能力和意愿,而下游地區也會因為參與推動上游地區綠色產業的發展而獲得巨大的經濟利益。最終,這一切將使生態補償變成為市場機制下的價值交換,各方將形成長期的博弈均衡,補償也將成為歷史。