博弈論是什么?也許你還不甚了解,但生活中的博弈行為你一定不會陌生。商務談判是談判雙方的博弈,街邊買張彩票是彩民與彩票發行者的博弈,菜市場里買賣雙方的討價還價同樣是博弈。其實,凡是兩個及以上的行為人進行決策的過程,都會涉及到博弈。
而這樣的博弈關系,同樣存在于地方政府之間的決策過程中。本文運用博弈論知識,從政府間的博弈關系來探究地方政府的行政行為,從績效評價制度設計的角度提出如何有效提升政府績效水平。
什么是博弈?
西方理論界最具代表性的博弈案例為“囚徒的困境”(prisoners’dilemma),是由美國普林斯頓大學數學家塔克于1950年提出的。假設有兩個小偷A和B聯合入室盜竊,警察將他們抓住后,分別在兩個不同的房間內進行隔離審訊,使兩人無法串供。警察告訴他們,如果兩人都坦白了罪行,由于證據確鑿,兩人都將被判8年刑期,如果只有一人坦白,另一人抵賴,則抵賴一方將受到嚴懲,被加刑5年,而坦白一方則被從寬發落,無罪獲釋;如果兩個人都抵賴,警察會因偷竊證據不足而只能判兩人非法入室而各入獄1年。

他們該怎么辦呢7因為無法串供,所以每個人都不得不仔細思考另外一方可能的行為,從而決定自己的行為策略。在假設小偷B選擇坦白的情況下,如果小偷A坦白,兩人都將被判刑8年,如果小偷A抵賴,B被無罪釋放,A被判刑13年,因此對于小偷A而言,此種情況下坦白是最佳的策略選擇。在假設小偷B選擇抵賴的情況下,如果小偷A坦白,A將無罪釋放,B被判刑13年,如果小偷A抵賴,兩人都將被判刑1年,因此對于小偷A而言,在此種情況下坦白也是最佳的策略??梢?,無論小偷B做出何種選擇,坦白都是小偷A的最佳策略選擇?;谶@種思考,最終兩個小偷都坦白了偷竊行為,均被判刑8年。這就是著名的“囚徒的困境”。
因此,博弈就是兩個以上的理性決策主體,按照預先設定的規則,同時或先后進行一次或多次的策略選擇,獲取相應結果的過程。研究博弈行為的理論被稱為博弈論。
要運用博弈論工具,我們首先要了解博弈必備的四個要素:博弈參與者、博弈規則、參與者選擇的行為或策略、參與者的收益。從上例可以看出,博弈論最重要的假設前提是“人是理性的”,決策選擇的核心目的是“使決策參與者的自身利益最大化”。
政府績效評價中存在博弈嗎?
答案是肯定的。凡是涉及利益決策的地方就會存在博弈,政府績效評價同樣如此。在績效評價規則下,每個地方政府都會面對不同的公共決策抉擇,并因此得到不同的行政效果和績效評價結果。
在傳統的“以GDP為核心”的政府績效評價體系中,如果用A、B表示兩個地方政府,均有兩種公共策略選擇,一種是將有限的財政資金用于興建商業樓宇,招商引資,關注GDP增速,謀求短期的經濟發展效益;另一種是在發展經濟的同時,更加關注污染治理、民生保障,關注提升宜商宜居環境,追求地區的長久發展。
如果政府績效評價設計者提出以GDP為核心的評價思想時,就會形成這樣的博弈規則。當A、B地方政府同時將更多的財力物力用于環境治理,所取得的長遠利益折合現時效用,雙方均記為5個單位的收益,如果雙方都只關注于發展經濟,則僅僅取得了現實效用,雙方均記為3個單位的收益,可見長遠效用要遠高于現實效用。如果A政府積極治理環境,B政府只注重發展經濟,則A政府的環境治理成本較高,現實收益被發展成本所抵消,僅記為1個單位的收益,而B政府由于分享了A政府的治理付出,不僅獲得了發展經濟的當期利益,同時獲取了長遠發展的效用,且由于沒有治理成本,因此得到了7個單位的收益。策略選擇及效用如圖:
眾所周知,A、B地方政府都是“理性主體”,會思考如何在績效評價規則中獲取最大的決策效用。當B政府發展經濟時,如果A政府也發展經濟,則A獲得3個單位的收益,如果A政府治理環境,則A獲得的單位收益為1,因此,發展經濟是A政府的最優選擇。同理,當B政府治理環境時,如果A政府發展經濟,則獲得7個單位的收益,如果A政府也治理環境,則A獲得5個單位的收益。可見,無論B政府采取何種行為,發展經濟都是A政府在面對上述績效評價規則時的最優策略選擇。B政府同樣如此。
所以,博弈的結果是A、B雙方政府都只會等待他人去治理環境,而自己坐享其成,專心發展經濟。這就是為什么在原有的以GDP為核心的績效評價和考核工作中,地方政府不愿意耗費更多的人力、物力、財力做這樣”費力不討好”事情的原因。決策效用矩陣中,(3,3)的發展結果就形成了博弈的納什均衡。
當然,作為充分理性主體的雙方政府,都已經意識到共同選擇治理環境的行為決策會使整體的社會利益最大化。但由于缺乏共同行動的約束機制,任何一方都不敢貿然選擇此項決策,成為他人成功道路上的“墊腳石”。這就是“囚徒困境”的博弈情況下,當滿足個體利益最大化時,會出現損害集體利益的必然現象。如何形成新的納什均衡?
要想改變博弈的結果,在滿足個體利益最大化的同時形成集體利益最大化,就必須打破博弈規則,妥善解決個體利益與集體利益之間的矛盾,形成新的博弈均衡點。
在這種情況下,我們對政府績效評價規則,即博弈規則進行了調整。還是A、B兩個地方政府,他們依然面對兩種策略選擇,一是單純追求經濟發展,二是實現可持續發展。
當A,B雙方只單純發展經濟,因為都忽視了可持續發展,只能獲得3個單位的現時發展效用。如果雙方均重注可持續發展,那么除獲取現時效用外,還將得到額外的4個單位的長遠發展效用,合計記為7個單位的效用。當A政府努力實現可持續發展,而B政府只關注經濟發展,忽視了資源節約和環境保護,由于B政府對地區的可持續發展造成負面影響,將受到懲罰,被扣除2個單位的效用后,只能得到1個單位的效用;為了鼓勵A政府的選擇,將B政府被扣除的2個單位的效用分配給A政府,則A共記為5個單位的效用。策略選擇及效用如圖,
在此種績效評價規則下,A、B地方政府都需要重新思考如何獲取最大的收益。顯然,無論對方怎樣決策,自己選擇可持續發展都將是最優策略。博弈的結果為,A、B雙方都將可持續發展作為選擇,最終會形成決策效用矩陣中(7,7)的結果,達到新的納什均衡。
如何在博弈關系中提升政府的績效水平?
首先,實行信息公開制度,讓地方政府充分了解評價規則。不同的規則會帶來不同的預期成本和收益,影響著博弈參與者的策略選擇,進而決定其博弈的均衡結果。地方政府作為理性決策主體,為實現個體效用最大化,首先要明晰績效評價規則,了解評價的獎勵和懲罰措施,預期行為決策效果。為此,績效評價實施者要制訂績效評價制度,公布評價標準,公開評價程序,讓地方政府在充分明晰評價規則的基礎上,做出決策選擇,增強政府工作的透明度。
其次,制定評價機制,形成博弈的有效約束。博弈結果不僅取決于博弈雙方的策略選擇,更大程度上取決于制定的博弈規則。在博弈過程中,博弈參與者的策略選擇是基于“理性行為人”的假設前提,遵循的是個體收益的最大化。為了使地方政府按照“實現可持續發展”的博弈規則選擇策略,政府績效評價就要制定相應的博弈規則,特別要形成新的博奔關系的約束力。
第三,合理制定利益分配關系,推動地方政府理性選擇。一個良好的利益分配關系能夠幫助博奔個體在追求利益最大化的同時,形成整體利益的最大化。這是因為合理確定利益分配關系,會引導地方政府按照預期發展目標實現理性選擇。當一些地方政府以過度消耗資源、損壞生態環境、犧牲人民利益為代價實現地區的快速發展時,要給予高額的懲罰,在完全抵減收益的基礎上,還要付出更多代價,如此才能達到通過績效評價手段,發揮有效的激勵作用,實現整個地區的可持續發展。