摘要:隨著中國從相對集權的政治經濟向開發社會與市場經濟的轉變,促進合作成為充分發揮中國潛能的關鍵。研究人類群體合作的進化問題可以更好地幫助人們實現合作。本文將運用博弈的思想淺析“高薪養廉”政策和加大反腐懲治制度可以有效遏制官場腐敗的現象,試圖進一步了解人類群體合作的進化過程。
關鍵詞:人類群體;合作的進化;博弈
改革開放以來,中國經濟和社會快速發展,對外開放和市場競爭使得人們更加感到合作的重要性。按照自利理性人的假設,人類群體是一個理性自私的群體,群體中的個體都是追求自身利益最大化的,那對于理解“人類群體合作行為的進化過程”對促進合作的實現尤為重要。阿克塞爾羅德在《合作的進化》一書中詳述了合作的建立、合作的進化對生物組織行為的影響,他把具有諸多復雜細節問題的合作現象抽象為經典博弈模型“囚徒困境”進行分析。由此,本文運用博弈的思想,分析“隨著我國反腐懲治力度的加大以及高薪養廉政策,官場腐敗現象得到了有效遏制”這一現象,試圖尋找政府與官員達成“合作”的原因。
本文建立了假設兩個都有機會受賄的官員之間的博弈模型,把政府的政策作為官員做出不同決策所獲得的收益R、S、T、P以及官員風險偏好Q的直接影響因素。假設甲、乙兩名官員同時負責一個項目,雙方都不受賄,他們從政府得到的收入是P,如果兩人同時受賄那么分別得到R的收益,如果一人受賄被發現那么其收益為S。如果未受賄的一方舉報受賄者那么他在得到P的同時還會因為聲譽等有利因素的提高而得到額外的“好處”A,用P+A=T來表示。為了便于討論先把Q設為0.5,既他們認為選擇受賄被發現的概率是0.5。在此設定下可以建立以下模型:
假設官員正常得到的收入為10,受賄被發現時為2,兩名官員同時受賄時為20,一名官員舉報另外一名受賄者時所得為14。那么有:R=20,S=2,T=14,P=10。即:
當甲選擇受賄時,他的預期收益為20*0.5+2*0.5=11,他不選擇受賄時的預期收益為14*0.5+10*0.5=12。很明顯甲不會選擇受賄。因為設置條件一樣,乙在理性狀態下也會做出同樣的選擇。
當把官員從政府得到的收入降低時,也就是把P值下調,比如P=5。那么會得到一個新的博弈模型:
重新計算甲的受賄風險收益為20*0.5+2*0.5=11,不受賄的收益為14*0.5+5*0.5=9.5。很明顯這種情況下甲會選擇受賄。
通過以上的對比發現P值的大小不同,那么官員在做出受賄與否的決定是不同的。其他影響因素不變的情況下,P大到一定程度時,官員不會選擇受賄。這可以證明實施“高薪養廉”政策是可以起到遏制貪污腐敗現象的。
下面同樣設定R=20,T=14,P=10。S代表的含義是受賄者被發現的后的收益,一般情況下該值為零或者很小的數字。假定政府的懲罰力度比S=2時更輕一點,比如設定S=5,那么得到一個新的博弈模型:
計算官員在較寬松的懲罰體制下的收益情況,甲選擇受賄時的風險收益為20*0.5+5*0.5=12.5,甲選擇不受賄的風險收益為14*0.5+10*0.5=12。那么甲的理性選擇是受賄。同樣博弈雙方是對稱的關系,乙同樣會選擇受賄。在R=20,T=14,P=10,S=2和R=20,T=14,P=10,S=5兩組不同的博弈環境下,博弈者做出了不同的理性選擇,可以得出結論,嚴厲的懲罰制度能有效遏制官員的腐敗。
把風險偏好Q引入到分析中來,以上討論的基礎是把Q假設為0.5,也就是說兩名官員都認為他們被發現和不被發現受賄的概率是相同的。顯然這種對Q的假設在現實中是不實際的。這時我們假定博弈者都是風險喜好者且偏好程度相同,給Q重新假定一個數值,如Q=0.8,也就是博弈者認為受賄成功的概率是0.8。在其他條件不變的情況下既:R=20,T=14,P=10,S=2時,甲選擇受賄的收益變成了20*0.8+2*0.2=16.4,不選擇受賄的風險收益為14*0.8+10*0.2=13.2。顯然博弈者會選擇受賄。
這時,需要引出一個基于以上討論的論證:政府懲治腐敗的力度和監管制度的有效性是與博弈者的風險偏好呈負相關的。
繼續在Q=0.8的條件下討論,假設政府的監管制度更加完善、懲罰制度更嚴厲,那么會對博弈者產生威懾,這時Q值會下降。賦予一個新的Q值(假設S沒有變動),Q=0.55。甲的受賄風險收益為20*0.55+2*0.45=11.9,不受賄的風險收益為14*0.55+10*0.45=12.2。現在這時博弈者會改變主意,選擇不受賄。于是可以得出更加完善的監管制度配合嚴厲的懲罰制度能有效打擊官員腐敗的結論。
以上的討論是把政府采取的措施用S、P、Q來表示,政府采取的不同措施表現在S、P、Q的變動上,以此分析博弈者根據選擇的風險收益做出不同選擇的過程。當然現實事件中,P和T同樣對博弈者的選擇起到重要的影響。當官員在受賄時能得到更大的利益,如P=30時,同樣假設T=14,P=10,S=2,Q=0.5,那么博弈者選擇受賄的風險收益變為30*0.5+2*0.5=16,選擇不受賄的風險收益為14*0.5+10*0.5=12,這種情況下博弈者會選擇受賄。但這并不妨礙得出結論:高薪養廉政策和完善的監管制度以及嚴厲的懲罰機制確實能起到一定程度的遏制腐敗的作用既能促進政府與官員之間的“合作”。
參考文獻:
[1][美]羅伯特·阿克塞爾羅德:合作的進化[M].上海:上海人民出版社,2007:86.
[2]曼瑟爾·奧爾森:國家的興衰——經濟增長、滯漲和社會僵化,上海:上海人民出版社,2007:21.
[3][美]埃利諾·奧斯特洛姆:集體行動何以可能[J].石美靜、熊萬圣譯.華東理工大學學報(社會科學版),2010(2):9.
[4][美]羅伯特·阿克塞爾羅德:合作的進化[M].上海:上海人民出版社,2007:94.