周 洋 韓雪峰
什么是囚徒困境
亞當·斯密講了這樣一個故事:有兩個因巨額盜竊而正在服刑的囚犯A和B。區(qū)檢察官c正在調(diào)查一宗懸而未決的銀行搶劫案,并且他相信A和B就是罪犯。區(qū)檢察官c正在計劃競選州長,所以希望A和B認罪,因為這樣會在他的記錄中增加一項重要的定罪案件。他依靠監(jiān)獄警衛(wèi)的幫助,對A和B的牢房進行了突擊搜查,發(fā)現(xiàn)了隱藏的武器和毒品。他知道可以利用這一信息控告他們犯有藏匿武器與毒品的小罪而使之被判刑,他將A和B隔離起來并分別對他們作出了如下承諾:如果無人坦白銀行搶劫,他將以藏匿武器與毒品罪起訴并使兩人各被再判2年監(jiān)禁:如果兩人都認罪,則都因銀行搶劫罪而被再判5年監(jiān)禁;如果只有一人坦白并將對方揭發(fā)出來,則對坦白者的搶劫銀行與藏匿武器與毒品行為不予起訴并釋放他,而沒有坦白的人則會因搶劫銀行與藏匿武器與毒品而被再判20年監(jiān)禁。那么,這兩個囚犯該怎么辦呢?從表面上看,他們應(yīng)該互相合作。如果選擇抵賴,他們倆都能得到最好的結(jié)果。但他們不得不仔細考慮對方可能采取什么選擇。
對囚徒困境的引申與分析
警惕公權(quán)力的濫用。在上邊的囚徒困境中,區(qū)檢察官構(gòu)造了一種情勢,使得個人對自己利益的追求會導致對A和B都不利的結(jié)果,兩個囚徒都會坦白,從而每個人都達到一個雙方都認為是差于雙方都不坦白的結(jié)果。事實上,檢察官所構(gòu)造的這個困境對A和B的激勵是如此的強烈,以至于很容易想象A和B被迫承認搶劫銀行,甚至即使他們是清白的。我國“文革”中坦白從寬、抗拒從嚴的政策之所以能使一大批人承認自己的“罪行”,其奧妙即在于此。
個人理性與集體理性的沖突。囚徒困境反映了一個很深刻的問題,這就是個人理性和集體理性的沖突,即理性人的個人理性行為可能導致集體非理性。很顯然,A和B雙方都抵賴(各判2年)比雙方都坦白(各判5年)要好,但是,作為理性人的A和B都想占對方的便宜,結(jié)果誰也沒占到。
在現(xiàn)實生活中,這種個人理性與集體理性(社會效率)相沖突的事例很多。
利他主義者的囚徒困境。有人認為產(chǎn)生囚徒困境的原因在于:每個局中人只關(guān)心自己的利益而對他人的利益漠不關(guān)心,為了自利的目的他甚至不惜違背“協(xié)議”。因此,解決囚徒困境的答案在于:不要做一個利己主義者。
讓我們回憶一下歐·亨利的小說《麥琪的禮物》。主人公是一對新婚小夫妻——吉姆和德拉。圣誕節(jié)快到了,雙方都惦記著給對方買禮物,吉姆想給德拉買套發(fā)卡,因為德拉有一頭靚麗的秀發(fā):而德拉則希望給吉姆的祖?zhèn)鹘鸨碣I表鏈和表袋。但是,他們的生活比較拮據(jù)。于是,吉姆賣掉了心愛的金表,買了一套漂亮發(fā)卡:德拉賣掉了心愛的長發(fā),為吉姆的金表買了表鏈和表袋。出于無私愛心的利他主義行為,結(jié)果卻使得雙方的利益同時受損。
可見,囚徒困境無須受限于利己主義者的假設(shè),只要每個局中人對結(jié)果之偏好的全部要求存在著一定的順序,并且這些偏好是發(fā)散的,即使是利他主義者,同樣無法避免個體理性與集體理性的矛盾。
破解囚徒困境的解
陷入囚徒困境的人要想達到一個對大家都有效率的結(jié)果,就必須運用某種社會的交互作用來抑制個人對自利的追求。本文試著從以下幾個方面尋求破解囚徒困境的解。
對囚徒困境的科層式解決辦法。所謂對囚徒困境的科層式解決辦法是指賦予某個人能夠迫使每個博弈方不去采取均衡中那種誘人選擇的權(quán)力,擁有這種權(quán)力的人也就擁有了一種強制性的權(quán)威,以促使別人去做本來覺得不符合自身利益的事情,從而使博弈雙方的處境都得到改善。
人類的團隊生產(chǎn)也面臨著類似的囚徒困境,當人們覺得他對群體的貢獻無法準確衡量時,他的產(chǎn)量就趨于下降,就像在以前的人民公社制度下和現(xiàn)在的部分國有企業(yè)里面,如果大家都好好干,產(chǎn)品生產(chǎn)的多,大家都可以生活的很好,但問題在于:我好好干,你不好好干,我吃虧,你好好干,我不好好干,我占便宜,于是,納什均衡就是大家都不好好干,都餓肚子。團隊生產(chǎn)囚徒困境的科層式解決辦法是賦予監(jiān)督者以不對稱于其他成員的權(quán)威,監(jiān)督者的任務(wù)是“分配報酬,觀察投入品的投入行為以測試或估計它們的邊際生產(chǎn)率,以及布置任務(wù)并就做什么和如何做給出指導”。這種監(jiān)督導致了激勵機制的變化,它使卸責的人被懲罰,努力生產(chǎn)的人得到獎勵。在這里,科層(企業(yè))通過為下屬與上級創(chuàng)造激勵來重新協(xié)調(diào)了個人對自我利益的追求與群體效率之間的關(guān)系,從而有效地解決了團隊生產(chǎn)囚徒困境的難題。
合作與重復博弈。本文上面所講的囚徒困境都是指“一次性博奕”條件下的困境。在這種條件下,局中人對合作都沒有興趣??墒牵绻┺炔皇且淮涡缘?,而是可以多次重復的博奕,人們就有了合作的可能性,囚徒困境就有可能破解,連續(xù)的合作有可能成為重復的囚徒困境的均衡解,這也是博弈論上著名的“大眾定理”(Folk Theorem)的含義。
但合作的可能性不是必然性。博弈論的研究表明,要想使合作成為多次博弈的均衡解,博弈的一方(最好是實力更強的一方)必須主動通過可信的承諾,向另一方表示合作的善意,努力把這個善意表達清楚,并傳達出去。如果該困境同時涉及多個對手,則要在博弈對手中形成聲譽,并用心地維護這個聲譽。所以合作是非常困難的。
當事人的感情,信念與信仰。上面的“囚徒困境”只考慮了當事人博弈策略中的利害計算,未考慮當事人的感情、信念和信仰等非理性因素。如果在囚徒困境中加入這些因素,那么即使是一次博弈,博奕結(jié)果也會有很大的不同。設(shè)想一下,如果被隔離訊問的是一對雌雄大盜,它們彼此深愛著對方,面對檢察官構(gòu)造的囚徒困境時,它們想到的更多的是對方的命運,這種無條件的愛使每一方都寧愿選擇抵賴,即使是對方坦白也心甘情愿,當雙方都這樣做的時候,他們已經(jīng)成功地擺脫了囚徒困境。
信仰會使他們認為誠實信用會給他帶來(較之于不誠實的產(chǎn)出而言)更大的預期產(chǎn)出,或者誠實的價值是他所更看重的,因此,他們會率先采取合作的策略,這樣整個決策結(jié)構(gòu)就發(fā)生了變化,克服囚徒困境的合作解就有可能出現(xiàn)。
此外,諸如同情心、正義感、愧疚感等非理性因素,都可以在囚徒困境條件下誘導出合作行為。