王治和,王 丹,張 強
(西北師范大學 計算機科學與工程學院,蘭州 730070)
十八大以來,黨中央、國務院高度關注扶貧開發工作,并制定一系列精準扶貧政策[1]。精準扶貧受到政府和學術界的廣泛關注。在全面建成小康社會的民主化進程中,精準扶貧作為脫貧致富的有效手段扮演著不可或缺的重要角色。根據中辦發[2013]25號文件,精準扶貧是指通過對貧困戶和貧困村精準識別、精準幫扶、精準管理和精準考核,引導各類扶貧資源優化配置,實現扶貧到村到戶,逐步構建扶貧工作長效機制,為科學扶貧奠定堅實基礎[2]。精準扶貧是對以往的粗放式扶貧工作的總結、反思、再認識[3]。精準扶貧由貧困對象識別和扶貧資源瞄準兩部分構成[4]。在精準扶貧工作過程中,對貧困對象的精準選擇、對其貧困程度及貧困原因等的精準確定將不可避免地影響扶貧資金和扶貧資源投放等后續扶貧工作。因此,精準識別是精準扶貧的關鍵,是精準扶貧的基礎和前提[5]。
我國政府“兩項制度銜接”政策的出臺實施使精準扶貧已經日益機制化[6]。但面對國家近年來如此之大的扶貧力度,為何在貧困對象精準識別過程中還存在著不精準問題和“貧困陷阱”呢?因為在扶貧對象精準識別過程中存在著相關參與者之間的利益博弈。
我國目前主要采取以政府為主導的開發式扶貧,在實際的扶貧對象識別過程中,貧困人口的識別采取規??刂频姆绞?,自上而下、逐級分解[7]。由此涉及不同層級的多個參與主體,包括中央、省、地、縣各級政府、各級扶貧領導小組及辦公室、相關部門以及基層扶貧群眾和貧困農戶。從經濟學角度出發,貧困對象精準識別中各參與主體間存在利益沖突和信息不對稱,各參與主體總是在一定條件下追求自身利益最大化,為尋求最優利益,各主體采取不同的行為策略,由此產生了各參與主體間的博弈,他們各自的利益決策行為在很大程度上將影響貧困人口的識別準確度和精度,直接關系到今后我國扶貧政策的減貧績效和扶貧總體的實際成效。市場經濟條件下,資源投入和瞄準效率是影響扶貧效果的兩大因素[8]。為此,需要改善扶貧對象的選擇和識別機制,進一步提高貧困對象的識別精準度,以提高精準扶貧效果。因此,本文擬基于演化博弈論視角,分析扶貧對象識別過程,探究識別過程中各參與主體之間的博弈行為及其策略調整過程、演化趨勢和穩定性。
傳統博弈論中假設博弈人是完全理性的,但這與現實世界是不符的。演化博弈論則是以有限理性的博弈方作為博弈分析的基礎,認為經濟社會中的博弈人不可能對信息變化做出迅速的最優反應,其研究分析博弈群體成員的策略調整過程、演化趨勢和穩定性,強調變化的動態過程?!把莼€定策略(ESS)”和“復制動態方程”是演化博弈中比較重要的兩個概念。ESS是指在博弈方動態策略調整中會達到對少量偏離的擾動有穩健性[9]。即對群體中所有成員都采取這種策略,而這種策略的收益相對于其他策略而言最優,那么,將沒有突變策略影響這個群體改變原來的策略選擇。在非對稱博弈中,個體更傾向于應用演化穩定策略來選擇行為并決定競爭結果[10]。復制動態方程用來描述單群體策略的動態調整過程,是描述某一個特定策略在一個群體中被采納的比例的動態微分方程[11]。
當前精準扶貧工作是以政府為主導的開發式扶貧為主。雖然政府具有扶貧資源的擁有權和分配權,但是對于準扶貧對象的真實情況及扶貧資源實際使用效果等信息都難以進行準確地獲取和實時地核查,相較于政府,扶貧對象對于自身的貧困狀況、貧困程度和貧困原因則是十分熟悉。不難發現政府與貧困對象之間存在著嚴重的信息不對稱問題。由此,政府為了有效地核查貧困對象的真實情況、準確地獲取扶貧資源的實際使用效果等,選擇通過設立扶貧機構來開展具體實際工作。所以精準扶貧工作所涉及到的組織機構和參與個體雖然比較繁多、錯綜復雜,但是依據精準扶貧政策的實施過程,其總體上可以大致歸納為政府、扶貧機構及扶貧對象等幾大主體。其中,政府、扶貧機構與扶貧對象等幾大主體之間存在著委托代理關系[12]。國家委托扶貧機構下放扶貧資源給貧困人口,由這些扶貧機構來識別、決定扶貧資源最終投向哪些對象,然后層層下放,以確保國家扶貧資源可以真正有效地運用到貧困人口身上,切實提升精準扶貧政策的實施效果。
貧困對象精準識別過程實際上涉及到政府與扶貧機構之間、扶貧機構與扶貧對象之間的兩層博弈。因此,這里本文建立了政府-扶貧機構以及扶貧機構-扶貧對象間的演化博弈模型,研究三者之間的關系。
在這里,假設貧困人口精準識別中不存在如貧困人口的標準與衡量指標問題、扶貧統計技術手段問題等技術難題。
2.1.1 政府-扶貧機構之間演化博弈模型假設
(1)博弈中的參與者
博弈中的兩個參與者是政府、扶貧機構,博弈雙方都是有限理性的。
(2)行為策略
政府有兩種策略可以選擇,分別為:監管、不監管;扶貧機構有兩種策略可選擇:工作盡職、工作不盡職。
(3)收益矩陣
政府應合理行使監管權,同時扶貧機構應該認真盡職工作,由此將使貧困對象識別更加精準,精準扶貧績效得到保障,各個參與主體的最大利益得到滿足。由此假設當政府實施監管,同時扶貧機構認真盡職時,雙方收益均為0;而當扶貧機構工作不盡職被政府實施監管發現時,扶貧機構的損失為D(罰款、解聘、民事和刑事懲罰等,事實上由于我國監督機制的缺失,扶貧機構D損失值較低),此時政府挽回了部分經濟利益損失,這里記為P;當扶貧機構選擇盡職工作,政府為了節省監管成本,選擇不監管時,政府節約了監管成本G;而當政府恰好選擇不監管時,扶貧機構就不認真盡職工作,違背道德,通過減少工作成本、尋租腐敗等獲得額外收益,這里記為R,此時政府將損失部分經濟利益L。由此得到收益矩陣如表1所示。

表1 政府與扶貧機構博弈雙方的收益矩陣
2.1.2 政府-扶貧機構之間演化博弈模型建立及分析
現在是監管扶貧機構的政府部門和扶貧機構兩個不同的博弈群體,這是一個非對稱博弈。非對稱博弈的每一次博弈中,兩個博弈群體中的成員隨機配對進行博弈,博弈方在各自所在的群體內部選擇學習和策略模仿。
假設在博弈中,選擇認真盡職策略的扶貧機構比例為x,那么采取不盡職策略的扶貧機構比例為(1-x);選擇嚴格監管策略的政府比例為y,那么選擇不監管策略的政府比例為(1-y);有限理性的行為主體有一定的統計分析能力和對不同策略收益的事后判斷能力,收益較差的行為人遲早會發現這種差異,并開始學習模仿另一類行為人。因此行為人的比例是隨時間而變化的[13]。即x,y通常是時間t的函數。
扶貧機構選擇“工作認真盡職”策略時的期望收益為:

扶貧機構選擇“工作不認真盡職”策略時的期望收益為:

那么,扶貧機構的平均收益為:

此時扶貧機構的復制動態方程為:

政府選擇“監管”策略時的期望收益為:

政府選擇“不監管”策略時的期望收益為:

那么,政府的平均期望收益為:

此時政府的復制動態方程為:

利用式(4)、式(8)兩個微分方程組成的動態復制方程求取均衡點,令dx/dt=0,dy/dt=0。
首先對政府的復制動態方程進行分析可以得出:當x等于(P+L-G)/(P+L)時,dy/dt始終為0,那么所有y都是穩定狀態。當x取值為0<x<(P+L-G)/(P+L)時,y的穩定狀態是y*=0和y*=1,此時演化穩定策略為y*=1。當x取值為1>x>(P+L-G)/(P+L)時,y的穩定狀態是y*=0和y*=1,此時演化穩定策略為y*=0。
對扶貧機構的復制動態方程進行分析可以得出:當y等于R/(D+R)時,dx/dt始終為0,那么所有x都是穩定狀態。當y取值為0<y<R/(D+R)時,x的穩定狀態是x*=0和x*=1,演化穩定策略為x*=0;當y取值為1>y>R/(D+R)時,x的穩定狀態是x*=0和x*=1,演化穩定策略為x*=1。
由此得到政府與扶貧機構博弈雙方的群體類型比例變化復制動態關系,如圖1。
由圖1可以得出政府與扶貧機構之間不存在博弈的長期演化穩定策略。在實際工作中,政府實施監管,但由于“政出多門,多頭管理”,全面地監管每一個扶貧機構是不可能的。部分扶貧機構冒險選擇偷懶、腐敗、違規等行為。政府為了防止和抑制扶貧機構工作不認真盡職、尋租腐敗,會選擇加強對其監管,此時扶貧機構會暫時選擇認真盡職工作。但加強對扶貧機構的監管并不能完全徹底地消除其不盡職腐敗行為。隨著扶貧機構暫時選擇認真盡職工作,在長期中,政府必然會慢慢放松監管,最終又將導致扶貧機構的失職。所以政府與扶貧機構博弈雙方不存在博弈的長期演化穩定策略。

圖1政府-扶貧機構博弈雙方群體類型比例變化復制動態關系
對各個條件下的演化穩定策略進一步分析可以發現:當扶貧機構選擇認真盡職的比例大于(P+L-G)/(P+L)時,演化穩定策略是y*=0,政府經過策略調整,終將選擇不監管;當扶貧機構選擇認真盡職的比例小于(P+LG)/(P+L)時,演化穩定策略是y*=1,政府終將選擇監管。當政府選擇監管的比例大于R/(D+R)時,演化穩定策略是x*=1,各個扶貧機構經過長期學習及調整策略,終將選擇認真盡職;當政府選擇監管的比例小于R/(D+R)時演化穩定策略是x*=0,扶貧機構終將選擇不認真盡職工作。所以雖然政府與扶貧機構博弈雙方不存在政府有效監管、扶貧機構完全認真盡職工作的穩定狀態,但政府實施監管和約束并不是無效的。政府選擇監管的比例越高,扶貧機構失職行為的比例將越低,尋租、腐敗現象將大大降低,貧困識別精度將得到提升。
除此之外不難發現,一方面,隨著政府的監管成本G越大,說明政府監管體系出現問題或政府的監管不合算,政府對扶貧機構實施監管的比例就降低,從而導致扶貧機構不認真盡職工作的概率將加大。G越小,即政府監管成本越低,(P+L-G)/(P+L)越小,監管的低成本激勵政府進行監管的可能性越大。扶貧機構認真盡職工作的概率將加大。另一方面,扶貧機構工作不認真時所獲得的額外收益越多即R越大,R/(D+R)就越大,若要達到有效監管,政府所需監管力度越大。扶貧機構的違規代價、失職成本D越高,R/(D+R)就越小,即若要達到有效監管,政府所需監管力度較??;所以若扶貧機構看到不認真盡職工作時潛在的額外收益足夠大且失職成本,違規代價較低的時候,他們極有可能選擇不認真盡職工作,反而與非貧困對象共同合謀來牟取扶貧資源,從而滋生腐敗行為。更有甚者可能濫用職權,人為故意“設租”。以上行為最終會導致貧困識別精度不高,精準扶貧效果差強人意。因此,上述分析可以說明:扶貧機構的違規失職成本過低、工作不
盡職獲得的額外收入越多及政府的監督成本過高是影響貧困對象識別準確度和扶貧績效的重要因素。
2.2.1 扶貧機構-扶貧對象之間演化博弈模型假設
(1)博弈的參與者
扶貧機構和扶貧對象。扶貧對象(即貧困對象)由于自身認識能力較低,掌握信息不完全,其理性行為是有限的。
(2)行為策略
扶貧機構的策略空間為:“工作認真盡職”與“工作不認真盡職”,扶貧對象的策略空間為:“誠實”與“不誠實”。
(3)收益矩陣
假設Z代表扶貧機構的收益;S代表扶貧對象的收益;若扶貧對象不誠實反映自身情況,甚至是非貧困戶冒領扶貧資源,由此將會給扶貧對象本身自己帶來經濟收益,這里記為M,同時給社會帶來經濟損失,記為N;若扶貧對象不誠實反應自身情況時,扶貧機構采取認真盡職的態度去核查是否瞄準的為真正貧困人口,如果核查扶貧對象情況不屬實,存在欺瞞行為,甚至為非貧困戶,將采取不給予扶持,對欺瞞行為進行罰款等處罰,這里記為K,同時,扶貧機構認真盡職進行核查的成本為C,并且假設檢查成本C<Z+K;當扶貧機構認真盡職工作,扶貧對象如實反映自身貧困情況,則扶貧機構可以識別真正的貧困對象,此時貧困對象可以獲得扶貧資源I;若扶貧機構不認真盡職,不認真稽查監管,那么對其進行的處罰為T。于是,可以得到扶貧對象與扶貧機構的收益矩陣,如表2所示。

表2 扶貧對象-扶貧機構的博弈收益矩陣
假設,M,T,C,K,I>0;K-M>0;T-C>0。
2.2.2 扶貧機構-扶貧對象之間演化博弈模型建立及分析
假設,在扶貧機構群體中,選擇認真盡職策略的比例x,則選擇不認真盡職策略的比例為(1-x);在扶貧對象群體中,選擇誠實策略的比例為y,則采取不誠實策略的比例為(1-y)。
扶貧機構采取“認真盡職”策略時的期望收益為:

扶貧機構采取“不認真盡職”策略時的期望收益為:

扶貧機構的平均收益為:

此時扶貧機構的復制動態方程為:

扶貧對象選擇“誠實”策略時的期望收益為:

扶貧對象選擇“不誠實”策略時的期望收益為:

扶貧對象的平均期望收益為:

此時扶貧對象的復制動態方程為:

令dx/dt=0,得到x=0,x=1,y*=(T-C+K)/K;令dy/dt=0,得到y=0,y=1,x*=M/(I+K)。用兩個微分方程(12)、方程(16)來描述扶貧機構和扶貧對象之間的博弈,找到U1(0,0),U2(0,1),U3(1,0),U4(1,1),U5(x*,y*)五個平衡點。通過分析微分方程組(12)、方程(16)的雅克比矩陣J的行列式detJ的符號和trJ的符號來分析上述五個平衡點的性質。
雅克比矩陣為:

將五個平衡點帶入雅克比矩陣J,若detJ符號為正值,且trJ符號為負值,則對應的平衡點為穩定點;若detJ符號為正值,且trJ符號為正值,則對應的均衡點是不穩定的;若detJ的符號為負值,則對應的該平衡點為鞍點。由計算結果可知:平衡點U1(0,0),U3(1,0),U5(x*,y*)的detJ符號為負值,則U1(0,0),U3(1,0),U5(x*,y*)點為鞍點;平衡點U2(0,1)的detJ符號為正值,trJ符號為正值,則U2(0,1)點是不穩定的;平衡點U4(1,1)的detJ符號為正值,trJ符號為負值,則U4(1,1)點為穩定點。根據五個平衡點的性質,得到博弈雙方動態演化路徑,如圖2所示。

圖2復制動態相位圖
由圖2可得,扶貧機構工作認真盡職,貧困對象選擇誠實反映自身情況是演化穩定策略(ESS),即U4(1,1)是穩定點。博弈雙方的演化調整過程是動態的,均衡結果的達到依托于博弈雙方開始時候的初始狀態。若第III和IV區塊擴大,系統收斂于穩定點U4(1,1)。所以,若x*和y*的值均變小,即U5點向左下方移動,系統收斂于穩定點U4(1,1)的概率增大。x*、y*與參數M、K、I、C、T有關聯,因此:
若對扶貧對象的不誠實行為懲罰力度增強,同時,對其通過不誠實行為給自身所帶來的額外收益也降低,x*=Q/(E+F)較小,U5點向左下方移動,增大收斂于U4(1,1)的概率。同時,x*=Q/(E+F)較小也意味著扶貧機構達到有效盡職工作,扶貧機構所需付出的力度較小,扶貧機構選擇工作認真負責的比例會變大,貧困對象識別偏差越小,識別精準度越高。若相反,則扶貧機構選擇工作不認真盡職策略的可能性就越大,表示扶貧對象識別過程存在偏差越大,存在錯位,識別精準度越低。
若對扶貧對象不誠實行為的懲罰力度加大,扶貧對象選擇誠實策略的比例會越來越大,扶貧對象會越來越注重個人形象,遵守道德,從而使貧困人口的識別精準度更高,精準扶貧績效得到保障。若反之,扶貧對象在貧困人口識別過程中選擇不誠實策略的可能性就越大,違背道德的行為概率也越大,終將導致貧困人口識別出現嚴重偏差錯位。
總之,由于扶貧對象精準識別中各參與主體間存在利益沖突和信息不對稱,為尋求最優利益,產生了主體間的博弈。通過對政府與扶貧機構之間、扶貧機構和扶貧對象之間的演化博弈分析可以看出,政府、扶貧機構、扶貧對象幾大主體的行為策略選擇在很大程度上將影響貧困對象的識別準確度和精度。而政府實施監督的成本代價、扶貧機構工作不盡職獲得的額外收益、扶貧機構的失職成本、扶貧機構的違規代價、對扶貧對象不誠實行為的懲罰力度、扶貧對象不誠實行為給自身所帶來的收益等因素都將影響政府、扶貧機構、扶貧對象等幾大主體之間的博弈策略選擇。因此,須制定合理的識別制度,采取一些相關措施,提高扶貧對象識別精準度,改善扶貧對象的選擇和識別機制,切實保障精準扶貧中貧困對象識別是合理有效的。
基于以上分析,為提高貧困對象識別精準率,得到以下幾點啟示:(1)在貧困對象精準識別過程中,推行自下而上的貧困群體參與式識別方式,以全民參與的方式,引導并鼓勵人民群眾參與到貧困對象精準識別的工作中,加大社會監督力量,遏制扶貧組織機構尋租腐敗,避免非貧困人口在自利心的驅使下與扶貧機構工作人員合謀騙取扶貧資源。設立由政府主導,扶貧機構監督,人民群眾參與的監督體系,形成政府與人民群眾精誠合作的識別格局,以降低監管成本。(2)政府可以通過購買第三方社會服務,如地方民間機構、科研和大專院校等非關鍵利益相關者,監督各扶貧主體的扶貧行為,確保貧困識別過程的公開、公正、透明。(3)通過創新扶貧機構干部考核任用機制,將扶貧工作績效作為選拔考核的重要依據,與其任用掛鉤,扶貧工作達標者還可以給予一定的精神和物質獎勵。若有不妥之處實施可核查和可追責制度,從而督促保證扶貧機構工作認真盡職。(4)建立貧困人口信息登記與動態監測平臺,動態管理建檔立卡信息,對貧困對象進行嚴格界定,規范評定與退出機制。加強動態化管理,保證符合條件的貧困對象精確、及時享受扶貧資源。
參考文獻:
[1]顧元吉.關于內蒙古“精準扶貧”的思考[J].中國市場,2016,(34).
[2]葛志軍,邢成舉.精準扶貧:內涵、實踐困境及其原因闡釋——基于寧夏銀川兩個村莊的調查[J].貴州社會科學,2015,(5).
[3]趙武,王姣玥.新常態下“精準扶貧”的包容性創新機制研究[J].中國人口·資源與環境,2015,(S2).
[4]黃承偉,覃志敏.我國農村貧困治理體系演進與精準扶貧[J].開發研究,2015,(2).
[5]汪三貴,郭子豪.論中國的精準扶貧[J].貴州社會科學,2015,(5).
[6]鄧維杰.精準扶貧的難點、對策與路徑選擇[J].農村經濟,2014,(6).
[7]張笑蕓,唐燕.創新扶貧方式,實現精準扶貧[J].資源開發與市場,2014,(9).
[8]羅江月,唐麗霞.扶貧瞄準方法與反思的國際研究成果[J].中國農業大學學報:社會科學版,2014,(4).
[9]唐華容.存在腐敗行為的扶貧資金監察進化博弈分析[J].安徽農業科學,2011,(4).
[10]Hammerstein P.The Role of Asymmetries in Animal Contests[J].An?imal Behaviour,1981,29(1).
[11]Taylor P D,Jonker L B.Evolutionarily Stable Strategies and Game Dynamics[J].Mathematical Biosciences,1978,(40).
[12]劉純陽,陳準.農村貧困人口瞄準中主體博弈行為的分析[J].湖南農業大學學報:社會科學版,2011,(3).
[13]謝識予.經濟博弈論[M].上海:復旦大學出版社,2002.