趙子達(遼寧大學哲學與公共管理學院,遼寧 沈陽 110036)
“智豬博弈”是博弈論中一個十分經典的分析模型。假設豬圈中有兩頭豬在同一個食槽里進食,一頭大豬,一頭小豬,暫且認為它們都是有著自我意識和實現個人利益的充滿理性的“智豬”。這個豬圈很長,一頭安裝了一個控制飼料供應的踏板,飼料的出口和食槽卻安在另一頭。豬每踩一下踏板,另一邊就會有相當于10份的飼料進入食槽,但是踩踏板以及跑到食槽所需要付出的“勞動”加起來相當于要消耗2份飼料的能量。由此,大豬和小豬有以下幾種策略選擇:(1)如果小豬踩踏板,大豬將吃到9份飼料;(2)如果大豬踩踏板,小豬將吃到4份飼料;(3)如果兩頭豬同時踩踏板,大豬吃到7份飼料,小豬吃到3份飼料;(4)如果兩頭豬都等待,則雙方都吃不到飼料。綜上所述,智豬博弈的收益矩陣如表1所示。

表1 智豬博弈的收益矩陣
在這種情況下,兩頭“智豬”會怎樣分析問題呢?從小豬的角度來看,選擇踩踏板只能吃掉1份飼料,不踩踏板反而可能吃上4份。所以,踩踏板也就成為小豬的嚴格劣勢策略。若將該策略剔除,小豬的優勢策略必然是選擇等待。而此時的大豬有兩種選擇:(1)等待,則意味著什么都吃不到;(2)踩踏板,則意味著可以吃到4份飼料。
在這個博弈過程中,踩踏板對于小豬來說是嚴格的劣勢策略,應先將其剔除。在剔除小豬踩踏板這一選擇后所形成的新博弈中,小豬只有等待這一個選擇,而大豬卻有兩個可供選擇的策略。在這兩個抉擇中,選擇等待對大豬來說是一個嚴格劣勢策略,再剔除該策略。那么,在最后構成的新博弈中,必然會出現“小豬躺著大豬跑”的景象,這就是“智豬博弈”的最后均衡,即重復剔除的優勢策略均衡。
道德,是一種公共服務。[1]道德環境在一定程度上具有公共產品的屬性,即使用上的非競爭性和受益上的非排他性。誠然,良好的道德環境需要每個個體共同創造。但在現實生活中,社會成員的差異性導致每個道德行為成員在維系該環境平衡時,所需付出的成本是不盡相同的。成本不等與收益相等之間的矛盾,導致守德者得不償失,失德者卻不勞而獲。而出于自身利益的考量,企圖期望出現許多“圣人”,在遵守該不成文契約的同時卻容忍他人失德是不現實的。
根據前述“智豬博弈”模型,守德者如同大豬,失德者如同小豬。守德者花費成本奔波于“食槽和踏板”之間,而失德者卻在等待“飼料”供應。長此以往,對待守德者的不公,極易使其向失德者的行為模式傾斜。當大豬(守德者)也選擇等待時,雙方就都無飼料可吃了。這種道德危機的窘狀,如果不加以遏制,便會加速道德環境的惡化,最終導致社會道德體系的坍塌。由此可見,道德領域中的“智豬博弈”危機似乎在所難免。
共處社會道德環境中,如果失德者(小豬)的行為總被默許,那么守德者(大豬)便會越來越少。破解“智豬博弈”的困境,其核心指標為:飼料數量、踏板與投食口的距離。為此,有如下三種方案:(1)飼料減半,一方踩踏板意味著另一方吃完,則雙方都選擇等待;(2)飼料翻倍,倘若無論誰踩踏板,對方都不會把食物吃完,則雙方都可能會去踩踏板;(3)減量加位移,飼料減半,投食口移到踏板附近,則多勞多得,等待者不得食。
為防止社會道德危機,不妨借鑒破解“智豬博弈”窘境的三種策略,從而設計良好的守德激勵制度。上述方案中,如果減少獎勵力度,社會成員將失去“守德”的動力,傾向于通過“失德”而獲益;如果加大獎勵力度,則會導致道德維護成本的陡增。所以,最好的激勵機制來源于方案三,即針對個別優秀守德者(大豬)給予獎勵的同時,提高違德者(小豬)的作弊代價。如此,既節約了成本(對政府維護社會道德環境而言),又消除了“搭便車”的現象,有利于激勵社會成員構建良好的道德環境。
1.激勵機制——驅使人們守德揚善
中國傳統道德觀念強調“善欲人見,不是真善”。但在市場經濟逐利性愈發彰顯的今天,道德冷漠現象不斷出現,試圖讓每個社會成員都擁有這種“大善”未免過于苛責。現實生活中,守德者也許從未感受到別人對他們行為的合宜性所表示的贊賞之情。[2]適當的獎勵機制有利于驅使人們守德揚善,構建良好的道德環境。獎勵的關鍵在于,增強守德者的內心滿足感,促使其保持良好的行為習慣。所以,這種機制應以物質獎勵為輔,精神獎勵為主。例如,可以以社區為單位定期評選日常生活中的先進個人和事跡,并通過黨委宣傳部、官方傳媒等途徑,對守德楷模進行表揚和宣傳,引導全社會形成良好的道德風尚。
2.制度保障——免除施德后顧之憂
由馬斯洛的需要層次理論可知,安全需求處于較低階梯。[3]所以,社會成員在進行道德活動時,必須有相應的安全保障,避免正義的舉動給自身帶來不必要的麻煩和代價。政府應提供相應的優惠政策鼓勵公益社會組織的發展,如果施德者因救助他人反被誣陷,可以由公益機構對其提供維權支持。即便施德者因自身行為損害了他人一定的利益,也應該適當減輕甚至免除責任。倘若當地政府擁有較好的財政條件,還可以設立公益基金,為施德者的利益損失提供金錢救濟。通過完善制度保障網絡,激發社會成員的施德行為,免除后顧之憂。
1.內在約束——滲透道德柔性信條
構建良好的道德環境,其理想狀態是把道德準則內化為道德意識,從而指導個人的行為舉止,最終將守德形成一種日常生活習慣。即將守德觀念成為內心活動的外顯,而非外在規定的不得已。要想達到這種狀態,必須重視教育功能。道德教育,在人的教化和塑造上扮演著重要的角色,具有基礎性和全局性的作用。道德凝聚人心,但具有盲目性。為了正確引導道德走向,應當將道德教育立足于日常生活,注重受教育者自身利益的發展,增強道德教育的實踐性和開放性,而非只是單純地傳授課本上僵化的“圣人”模范信條。
2.制度規避——構建全民信用檔案
僅僅通過對失德者的教育,試圖改變其行為模式是遠遠不夠的。守德行為多依賴于社會個體的自覺,同時也需要制度提供保障。政府應運用經濟職能和政治職能,構建全民信用檔案系統,并將失德者的行為記錄其中。為更好地發揮懲戒教育的作用,可以允許將顯著輕微的失德記錄通過良好的守德行為予以抵消。但失德記錄的清除并不是毫無底線的,倘若觸碰了法律紅線,這種失德且違法的行為必將伴隨一生,讓其舉步維艱。通過適當提高信用數據的透明度,增加失德者的違規成本,進而引導其走向守德的軌道。
3.輿論監督——引領社會輿論導向
通過制度約束,可以有效防止社會成員觸碰失德的逆鱗。但是,如果這種剛性手段大范圍適用,容易引起人民反抗和社會動亂。為此,政府應加強輿論支配,使守德行為成為一種社會風尚,甚至是個人信仰。輿論萬能,所有其他形式的權力都導源于它。軍隊是無用的,除非士兵相信他們為之作戰的理由。制度是難以發揮作用的,除非它受到人們的普遍尊重。鑒于大眾傳媒對重大事件的傾向,近乎決定著社會輿論的走向,所以政府在尊重新聞媒體言論自由的同時,也應該加強對媒體的引導和監督,掌握輿論主動權。
根據道德領域中的“智豬博弈”模型,在構建具有公共產品屬性的道德環境時,守德者得不償失,而失德者卻不勞而獲。本文從破解“智豬博弈”的激勵機制出發,就守德者(大豬)和失德者(小豬)兩個層次,提出具體的應對策略,旨在改善道德危機現狀、營造良好社會氛圍。