趙玉亮(南開大學濱海學院,天津,300270)
?
丟包博弈之謎:對互惠理論的挑戰
趙玉亮
(南開大學濱海學院,天津,300270)
[摘要]互惠理論是近幾十年行為經濟學和實驗經濟學的主要研究內容之一,而Dufwenberg 和Gneezy 在2000年提出的丟包博弈的實驗表明,丟包人的回報行為與撿包人放棄的外部選擇權的大小并不存在正相關關系。Servátka、Vadovi (2009)和Cox等(2010)分別嘗試用外部選擇權的不平等和外部選擇權對丟包人的凸顯性來破解丟包博弈之謎,他們的實驗仍然沒有改變丟包人的決策行為與撿包人放棄的外部選擇的不對稱性,丟包博弈仍舊是個懸而未決的謎。破解丟包博弈之謎,對探究當前我國市場經濟條件下企業的競爭與合作、多成員之間的團隊創新行為有重要的啟示意義。
[關鍵詞]丟包博弈之謎; 互惠理論; 外部選擇權的不平等; 外部選擇權的凸顯性
自古以來互惠就是人類交往的基本的行為規范之一,我國傳統文化中即有“受人滴水之恩,定當涌泉相報”的思想,銜環結草、以恩報德的典故更是不勝枚舉。亞當斯密在其《道德情操論》中多次提到“善以善報”的思想①其中《道德情操論》第6卷第2章提及“ Kindness is the parents of kindness”。。現實生活中,人們不但經常對那些善意的行為進行回報,而且還經常犧牲自己的利益懲罰那些行為不善的人,Rabin(1993)將前一種行為稱為正互惠(positive reciprocity),將后一種行為稱為負互惠(negative reciprocity)。正互惠和負互惠在產業內企業間的競爭和合作行為、行業協會以及多成員的團隊創新中也廣泛存在,基于聲譽、激勵和懲罰層面的管理機制的存在顯著地提高了產業的合作水平和團隊績效。
近年來,行為經濟學和實驗經濟學也開始著重研究現實場景和實驗市場中的互惠現象,并將互惠現象模型化,受互惠激勵的人們在交往中可能產生完全不同于基于純自利人行為模型預測的結果(Rabin,1993 ;Fehr and Schmidt ,1999 ;Bolton and Ockenfels,2000 ;Charness and Rabin,2002;李曉義和李建標,2009)。部分學者對強互惠行為的證據、生物基礎和演化的現有文獻進行了評述(韋倩,2010)。
實驗經濟學家和行為經濟學家在最后通牒博弈、信任博弈、偷襲者博弈和禮物交換博弈中發現,互惠偏好顯著影響著實驗室中被試的行為。
1.最后通牒博弈實驗
Guth等(1982)開創性地實驗了最后通牒博弈。實驗中將被試隨機分為提議者和回應者,實驗者提供一定數量的金錢由提議者分配,如果回應者同意提議者的分配方案,則按照其方案分配,如果不同意其方案,則雙方什么都得不到。在他們的實驗數據中,提議者愿意分給對方的比例大都在30%-50%之間,低于20%的分配比例以很高的概率被拒絕。回應者愿意放棄一個正的分配額來懲罰提議者,表現出強烈的負互惠傾向。世界各地眾多不同形式的最后通牒博弈結果為負互惠行為提供了強有力的證據。為了回應“賭注盤”(stake cake,即提議者和回應者分配的金錢總數)變大以后拒絕率就會明顯下降的質疑,Cameron(1995)在印度尼西亞實施的最后通牒博弈實驗中將賭注盤變為相當于實驗參與者三個月的日常消費②Cameron 在印度尼西亞實施的實驗中最大賭注盤為200000印尼盾,實驗問卷顯示,該數額為實驗參與人三個月的日常消費。,結果證明回應者的拒絕率和低賭注盤時的拒絕率并無明顯差異。Hoffman、Mc Cabe和Smith(1996)發現賭注盤為10美元和100美元時提議者的分配方案和回應者的拒絕率無顯著差異,而產權的配屬③即博弈參與人提議者和回應者角色的通過何種方式確定。卻對提議者分配分布和回應者的拒絕行為有顯著影響。李建標、龐榮輝(2010)的三人最后通牒博弈數據也表現出該特點,在產權不清晰的重復三人最后通牒實驗下拒絕率為17.3%;而在產權清晰的實驗下,拒絕率為4.9%。為回應大學生被試由于類似的社會文化背景而使得最后通牒博弈實驗結果缺乏普適性的質疑,Henrich等(2001)展開了最后通牒博弈的跨越五大洲和12個國家的跨文化調查,被試涵蓋了15個不同文化背景的社會團體,這些社會團體包括狩獵社會、游牧社會、遷徙農耕社會和定居農耕社會,賭注盤大約為當地所在社會1-2天的工資水平。盡管這些不同背景的社會表現出來的行為差異很大,但提議者分給對方的比例在26%-68%之間,當分給對方的比例低于20%時,拒絕的概率在0.4-0.6之間。最后通牒博弈實驗中回應者對正的分配額的拒絕反映了人類交往中的負互惠現象,人們愿意放棄唾手可得的收益來懲罰他們認為不公的分配結果。
2. 信任博弈實驗
Berg(1995)設計了一個投資環境下的兩階段信任博弈來研究信任與互惠問題。該博弈執行如下:第一階段,被試隨機分為A類型和B類型,A類型參與人和B類型參與人分別得到10美元初始稟賦,A類型參與人需要決策將其10美元中的多少分給與之匹配的匿名的B類型參與人,該數值記為Ma(0≤Ma≤10,Ma,但是該數值被乘以3倍以后給予B類型參與人;第二階段,B類型參與人得到3Ma,并且需要決定返還多少給A類型參與人,返還的數值記為kb(0≤kb≤30,kb),A類型參與人收益為:Pa=10- Ma+kb,B類型參與人收益為:Pb=10+3Ma-kb。根據子博弈精煉納什均衡,B類型參與人的占優策略是(kb= 0),A類型參與人預期到B類型參與人的選擇,因此A類型參與人選擇Ma= 0,因此單次匿名交往的博弈實驗中該博弈的均衡結果為(Ma= 0,kb= 0。)。然而,事實上,他們的實驗結果表明,A類型參與人和B類型參與人的選擇顯著不為0,并且二者高度相關。在Berg教授以后,世界各地實施的諸多信任博弈實驗④Cox的三合一實驗分別為標準的信任博弈實驗和兩個拓展三倍的獨裁者博弈(一個為增值三倍的獨裁者博弈,一個為調整稟賦的標準獨裁者博弈)。都從不同的角度證明了該結論。Cox(2004)設計了三合一的信任博弈實驗識別信任和互惠行為,其信任博弈中81%(26/32)的A類型參與人選擇了大于零的Ma,53%(17/32)的B類型參與人選擇了大于零的kb,增值三倍的獨裁者博弈中,63%的A類型參與人選擇了正的Ma。夏紀軍(2005)利用Cox(2004)的框架,測度了基于20名中國被試的人際間的信任水平和可信水平,其中基礎信任博弈實驗中A類參與人選擇的Ma均值為5.24,而B類參與人選擇的kb均值為8.5。陳葉烽(2009)將信任博弈中社會偏好行為進行了分解,得出了信任博弈中A類型參與人的決策行為受互惠偏好的顯著影響、B類型參與人的回報行為受互惠偏好和利他偏好的顯著影響的結論。盡管學者們得出的信任博弈中參與人的行為受互惠偏好和利他偏好的影響程度不同,但都證明了互惠現象的廣泛存在。
3. 偷襲者博弈實驗
Abbink、Irlenbusch和 Renner(2000)(以下簡稱AIR)提出的偷襲者博弈(moonlighting game)本質上是信任博弈的擴展,允許參與人可以采取正互惠和負互惠兩方面的行動。參與人A和參與人B隨機配對,在兩階段博弈開始前,雙方賬戶中都被賦予12單位代幣的初始稟賦。第一階段,參與人A選擇一個行動a(-6≤a≤6),如果a≥0,則A賬戶減少a單位代幣,而B賬戶增加3a單位代幣;如果A選擇的a<0,則A賬戶中增加單位代幣,而B賬戶中減少a單位代幣。第二個階段B觀察到A的行動后,選擇一個行動b,如果b≥0,則A賬戶中增加b單位代幣,而B賬戶中減少b代幣,如果b≤0,則A賬戶中減少3單位代幣,而B賬戶中減少b單位代幣。偷襲者博弈的一個顯著特征就是參與人A可以選擇給予也可以選擇拿走,而參與人B可以根據第一階段A的行動進行獎勵或者懲罰。AIR的實驗結果表明,參與人B對A選擇拿走的行動(a<0)實施了懲罰,而且拿走的多少與實施的懲罰(b<0)程度顯著正相關。Falk、Fehr 和Fischbacher(2008)在偷襲者博弈的框架中設計了兩種設置:動機設置(Intention Treatment)和非動機設置(Non-intention Treatment),動機設置中參與人A自主選擇a,a的選擇完全在參與人A的自主控制中,而非動機設置中,通過主持人在參與人B面前擲骰子決定a。他們的實驗結果表明公平動機發揮著重要的作用,傳統經濟理論中僅將結果放入效用函數中是值得懷疑的,僅考慮分配結果的公平模型(如Bolton and Ockenfels,2000;Fehr and Schmidt ,1999)而忽略了非結果因素對互惠公平的影響,某種程度上是不完全的。Engelmann和Strobel(2010)在偷襲者博弈中改變了參與人A和參與人B的初始稟賦來考察偷襲者博弈的不平等厭惡和互惠對參與人行為的影響,在設置1中將參與人A和參與人B的初始稟賦分別設為17和18,而設置2中的參與人A和參與人B的初始稟賦分別設為17和48。以往的實驗表明,當不平等厭惡與互惠一致時,不平等厭惡理論解釋良好;當不平等厭惡與互惠矛盾時,不平等厭惡幾乎失去了解釋力。面對參與人A相同的行動,互惠的參與人B在兩種設置下的行為應該沒有差異,而不平等厭惡的參與人應該反應不同。參與人B的實驗結果在兩種設置下區別并不明顯。與不平等厭惡理論相比,顯然,在他們的實驗中參與人B的行為受互惠理論指導更強烈。
4. 禮物交換博弈實驗
學者們經常討論禮物交換博弈(gift exchange game)中的互惠現象,并用來解釋現實中經濟學經典范式失靈的預測。“禮物交換”是阿克洛夫最先在研究勞動契約制度時提出的,他認為勞動契約制度類似于不完全的“禮物交換”,工資決定了工人的努力水平規范,并反過來影響努力水平規范;企業提供一個高于市場出清水平的工資的原因就是“禮物交換規范”(Gift Exchange Norm)的存在,工人公平導向的行為導致了非自愿失業的存在(Akerlof,1982;Akerlof and Yellen,1988,1990)。Fehr、Kirchsteiger和Riedl(1993)在實驗中刻畫了阿克洛夫描述的情境,檢驗了公平對市場價格的影響。買者(雇主)提出價格,通過單向口頭拍賣決定價格,賣者(雇員)同意某個買者的價格后決定提供商品的質量,商品的質量決定了賣者的收益,同時賣者的成本會隨著提供商品質量的提高而增加。實驗結果表明,買者要約價格遠遠高于市場出清的價格水平,以此期待賣者提供高質量的商品回應高于市場出清的價格。結果表明,賣者的提供質量與買者要約的價格正相關,因此實驗結果對阿克洛夫的非自愿失業的公平工資——努力理論(wage-effort theory)提供了實驗支持。Fehr、Gachter和 Kirchsteiger(1997)對“禮物交換”博弈中的互惠行為進行更為細致的刻畫。人們對善意的行為進行回報和對惡意行為進行懲罰的正負互惠行為有助于契約的實施,并且能夠增加交易雙方的效率。如果市場能夠為交易雙方提供互惠的機會,就會產生穩健和強有勢的互惠效應,因此能夠增大可實施的行動集,產生大量的交易利得。在他們的實驗中給出了兩個主要設置:弱互惠設置WRT(weak reciprocity treatment) 和強互惠設置SRT(strong reciprocity treatment)。弱互惠設置中僅有雇員有機會實施互惠行為,而強互惠設置中交易雙方都有機會進行互惠反應。“禮物交換”博弈中SRT設置進行三階段博弈,WRT僅進行前兩階段的博弈。第一階段,雇主提出契約要(w,f),其中w 為工資,為要求的努力水平,f為偷懶的罰金,雇員被通知所有的雇主勞動契約要約以后,隨機選擇契約,契約達成;第二階段,同意雇主要約的雇員選擇努力水平e偷懶(即e<)有概率s(0<s<1)被第三方發現,該情況下雇員必須支付罰金f給雇主。因此,雇員不偷懶的期望效用是uns= w-c(e),c(e)為雇員努力的成本,且c′(e)>0,c(0)= 0,雇員偷懶的期望效用為us=(1- s)[w-c(e)]+ s[w-c(e)- f]。如果與之交易的雇員未偷懶或者偷懶沒有被發現則雇主的收益為π=(q-w,q為外生給定的贖回價值,如果其雇員偷懶并且被發現則其收益為π=(q-w+ f;第三階段,雇主實施互惠行為階段,雇主觀察到雇員的努力水平后,選擇一個數值p(p∈[0,2]),雇員在前兩個階段的收益乘以p ,p<0和p>0都會導致雇主的成本k(p),k(p)在區間p∈(0,1)遞減,在區間p∈(1,2)遞增,k(1)= 0,不偷懶或者偷懶未被發現的雇員的收益為uns=[w-c(e)]p ,其雇主的收益為π=(q-w-k(p);偷懶且被發現的雇員的收益為us=[w-c(e)- f]p ,其雇主的收益為π=(q-w+ f-k(p)。顯然,自利的雇主會選擇p=1,否則都會導致其成本的增加。自利如果作為共同知識,理性的雇員預期到雇主的選擇,第三階段的存在并不影響其努力行為的選擇。他們的實驗數據表明WRT下存在非明顯的互惠反應,而SRT下互惠反應非常強烈,盡管雇主要求了更高的努力水平,而偷懶的概率顯著下降,交易雙方的收益都有所增加。互惠作為某種契約實施手段顯著增大了可實施的交易空間,提高了交易效率。
丟包博弈是Dufwenberg 和Gneezy(2000)(下文簡稱DG)提出的,他們假設了如下場景:一個人在大街上發現了一個錢包,而且沒有人發現他撿到了錢包,錢包中有現金和證件等物品,顯然現金對其有效用而證件對其沒有實際的價值,對于錢包主人而言二者都是有價值的。撿包人可以選擇將錢包拿到附近的派出所登記姓名等待錢包主人前來尋找,失主會給予一定的報酬,撿包者也可以將錢包據為己有。將該情形刻畫成博弈模型如圖1所示,第一時點上參與人1(撿包人)有兩個選擇:將總價值為20的包“歸還失主”或者“據為己有”。如果選擇“據為己有”則參與人1獲得錢包中的現金收益x(0<x<20,x為外生給定的固定值),參與人2(丟包人)的收益為0;如果參與人1選擇將錢包“歸還失主”,則由參與人2決定如何分配20單位的總價值,參與人2分給參與人1的值記為y(0≤y≤20),則參與人1和參與人2的收益分別為y和20-y。參與人2行動的子博弈實際上是一個獨裁者博弈。
如果參與人僅受個人物質收益激勵,并且自利作為共同知識,則博弈均衡為(據為己有,0),因為參與人1預期到參與人2會最大化其物質收益20-y,選擇y=0,所以參與人1在第一時點上選擇“據為己有”,雙方的收益是分別是x和0。然而該均衡是無效率的,如果參與人1選擇歸還失主,則雙方的收益之和為20,大于在其選擇“據為己有”下的雙方收益之和x。同時,該博弈存在帕累托改進的空間,因為只要參與人2選y≥x,雙方的福利都會有所改進。很多實驗表明,人們在交往過程中可能受到很多其他非物質因素的激勵,這可能減少了無效率的產生。根據互惠理論,參與人1可能放棄潛在收益x向參與人2表示友好,而參與人2會根據參與人1行為做出相應的互惠反應。

圖1 DG的丟包博弈
DG(2000)的實驗共進行了五局(sessions),每局實驗中x分別設定為4、7、10、13、16,每局實驗12組被試,對于參與人2實施了策略方法(strategy method)⑤越來越多的實驗經濟學家利用策略方法來誘導實驗室和現實場景中的選擇行為,讓被試在他面臨的每一個狀態依賴的決策節點上做出選擇,然后匹配被試,最后根據實現的節點來確定決策,忽略未實現的節點。,即參與人2在不知道參與人1選擇的條件下做出選擇y。為了檢驗互惠效應,同時他們還實施了兩局獨裁者博弈,將獨裁者的選擇行為與丟包博弈中參與人2的行為進行對比,如果存在互惠效應,則參與人2會比如果他(她)作為獨裁者博弈中的獨裁者給出更高的y值。同時為了測度信念對決策行為的影響,兩位學者還測度了參與人1對參與人2分配給其的y值的猜測,同時令參與人2猜測了參與人1對y值的猜測值,并根據他們的猜測的精確度進行了支付。
丟包博弈實驗結果表明,參與人1的行為明顯與自利模型的預測不相符,在x=4、x=7、x=10、x=13、x=16的實驗中,選擇“歸還失主”的被試的比例分別為100%、50%、66.7%、33.3%和8.3%,即使某些參與人1猜測參與人2返還給他的y值小于x。顯然,隨著表示友好的參與約束增大,愿意表示友好的被試者越來越少。參與人2的行為明顯與互惠模型的預測不同,在x=4、x=7、x=10、x=13、x=16設置下的各局實驗中,參與人2選擇的y值平均值分別為7.33、4.83、7.54、6.12、5.75,檢驗結果也表明在5%的顯著水平上無法拒絕x與y不相關的假設,而y卻與參與人2對參與人1預期(即猜測)的預期正相關。更令人驚訝的是,在兩局獨裁者博弈實驗中,獨裁者選擇的y值平均值為6.08,與丟包博弈中選擇的y值并無顯著區別,而獨裁者博弈實驗中,獨裁者選擇的y值與其對參與人1預期的預期也存在正向關系。DG(2000)給出的解釋是參與人2(或者獨裁者)不想讓參與人1失望而不愿意給予參與人1低于其期望值的y值。

圖2 Brandts、Guth和Stiehler的丟包博弈實驗結構
Brandts、Guth和Stiehler(2006)(以下簡稱BGS)在研究指定分配權力的激勵效應時實施了一個加入除撿包人⑥在Chaness、Haruvy和Sonsino(2007)稱為先行動者(first mover),即圖2中的X。和丟包人⑦在Chaness、Haruvy和Sonsino(2007)稱為后行動者(second mover),即圖2中的Y或Z。之外的第三方的三人丟包博弈實驗。其實驗結構如圖2所示。三人共享一個總價值最大為12單位代幣的“包”。首先,X決定選擇外部選擇權(即圖2中的O)或選擇讓Y(或Z)來分配,三人共享該“包”(即圖2中的D)。如果X選擇外部選擇權,則他的收益為x=3(6),Y和Z的收益則為0;如果X選擇D即意味著他放棄了外部選擇權,則由Y或Z來在三人之間分配總價值為12單位的代幣,三人收益均為非負整數,且三人收益之和為12。為了考察分配權力對激勵效應的影響,BGS設計了兩種設置:X指定分配者的SA(selected allocator)設置和隨機選擇分配者的RA(random allocator)設置。在SA設置中,X決定他是否愿意放棄外部選擇權和愿意讓Y或Z作為分配者;RA設置中,如果X放棄外部選擇權,則隨機確定Y或Z作為分配者,二人被選為分配者的概率均為1/2。
受DG模型的鼓舞和直覺的影響,BGS的設置在考察分配者選擇方式對分配結果影響的同時也考察了外部選擇權大小對分配結果的影響。在其2(treatments)x3(sessions)x15(participants)的實驗中,每局三個回合(rounds),前兩回合中參與人X選擇外部選擇權收益為x=3,第三回合中X的外部選擇收益為x=6。他們假定分配者會在外部選擇權較大時(x=6)為自己保留的份額越小,因為不同的外部選擇權收益意味著參與人X放棄的潛在收益的大小。實驗結果表明他們的假設未被支持,高的外部選擇權并不能使得分配者給予自己較低的份額。他們認為可能是不平等的外部選擇權導致了違反直覺的結果,在兩種外部選擇權設置中,所有的收益全部給了參與人X。此外,兩種外部選擇權情況下的總收益也遠遠小于12,兩種情況下參與人X放棄的外部選擇權可能被視為一種義務而不是慷慨行為,因此不影響分配者后續的行為。
Chaness、Haruvy和Sonsino(2007)使用策略方法分別在三個大陸的互聯網上、以色列和西班牙實驗教室和美國的兩個州(田納西州和加利福尼亞州)的電腦機房實施了丟包博弈實驗⑧Chaness、Haruvy和Sonsino(2007)的實驗結構與DG基本類似,包對撿包人的價值x是從0,10,20,…,100中隨機抽取的,而丟包人需要在假定撿包人歸還包的情況下對于x的每個可能的值都做出一個具體的選擇y,y∈(0,100)。,以考察社會距離對互惠的影響。盡管他們得出結論“很多參與人關心其他人的收益,即使他們是身在異國的陌路人,將近30%的網絡參與人2選擇的y與參與人1放棄的x正相關”,而事實上,在網絡實驗中,對于參與人1放棄的不同水平的x,高達48%的參與人2選擇了固定的y值(36%的被試選擇y=0,13%的被試選擇y=50,9%的被試選擇其他的固定值)。在實驗教室和兩州的電腦機房實驗中選擇固定y值的被試也分別高達35%和40%。在互聯網、實驗教室和兩州的電腦機房實驗中參與人2選擇的y與x弱正相關的比例分別為28%、43%和33%。
到底是什么原因使得丟包博弈中的丟包人的回報行為與撿包人的放棄的外部選擇權x的大小不存在正向關系或存在微弱的正向關系?是不平等的外部選擇權,還是外部選擇權對參與人2不夠凸顯?
為了檢驗是否是BGS提出的不平等的外部選擇權可能導致丟包博弈之謎的猜想,Servátka和Vadovi (2009)實驗比較了被試在平等和不平等的外部選擇權條件下的行為。其實驗結構如圖3所示。如果參與人1選擇歸還(即圖3中的IN),則參與人2可以在其和參與人1之間分配一個剩余;如果參與人1選擇“據為己有”(即圖3中的OUT),則外部選擇權結果為(x1,x2),x1為參與人1的收益,x2為參與人2的收益;如果參與人強烈地關注收益的平等性,則導致平等結果的設計可能更能體現他們的考慮。基于這樣的邏輯,如果外部選擇權不平等,則參與人2可能不考慮參與人1放棄的可能收益,不平等的選擇權可能導致了參與人2僅為自己的利益考慮。相對平等的外部收益似乎可以使得參與人2在決策時更加關注參與人1放棄的外部收益。
Servátka和Vadovi 利用被試間設計和策略方法在新西蘭坎特伯雷大學分別實施了含有26組被試的不平等外部選擇權設置和平等外部選擇權設置的實驗。不平等的外部選擇權設置中,參與人1首先得到10單位代幣;如果選擇IN,則接下來由參與人2在兩人之間分配20單位代幣,參與人1獲得y單位代幣,而參與人2獲得20-y單位代幣;如果參與人1選擇OUT,則參與人1獲得10單位代幣,而參與人2的收益為0。平等外部選擇權設置唯一與不平等外部選擇權設置不同的是,當參與人1選擇OUT時,參與人1和參與人2均獲得5單位貨幣。在兩種設置中,為了避免可能的混合效應他們保持了外部收益之和不變,即x1+ x2=10。

圖3 Servátka和Vadovi 的實驗結構
然而實驗結果⑨參與人1的行為與DG的實驗結果一致,隨著x1的增大,選擇歸還失主的比例越來越少,不平等外部選擇權設置中27%(7/26)的被試選擇了歸還,而平等外部選擇權設置中,77%(20/26)的被試選擇了歸還。并沒有為BGS的對參與人2的猜想提供證據,在不平等外部選擇權中,參與人2選擇的y值均值為6.12,平等外部選擇權設置中參與人2選擇的y值均值為5.19,檢驗結果也表明參與人2的行為在兩種設置下并不存在顯著區別,因此他們得出結論:外部選擇權的不平等并不影響丟包博弈中參與人2的行為,丟包博弈之謎仍然未能得到解釋。
根據Batigalli和 Dufwenberg(2009)的心理前向歸納理論(psychological forward induction),參與人1放棄的外部選擇權反映了他有更高的希望從而期待對方返還一個更高的y,如果參與人2是內疚規避的(guilt-aversion),他對參與人1更新的信念會表現慷慨,外部選擇權越高,參與人1的更新信念也就越高,從而導致內疚規避的參與人2分配更多的金錢給參與人1。
Cox等(2010)試圖解釋DG提出的丟包博弈之謎:參與人1放棄的外部選擇權大小不影響參與人2的行為。他們質疑了DG報告的參與人2選擇的y與參與人1放棄的x的不相關性,認為y對x的反應取決于參與人2感知到的外部選擇權大小的凸顯性,參與人2決策時必須意識到參與人1放棄的x的大小從而對x做出反應。Cox等認為DG設計的原始協議可能使得放棄的外部選擇權對參與人2并不凸顯,因此他們改變了DG實驗設計中的兩個協議:第一,改變了目前所有丟包博弈實驗中對參與人2使用的策略方法,而采用了直接反應的方法(即序貫執行);第二,通過紙幣憑證代替DG實驗中采用的書寫數字代表決策的方法。
策略方法是Selten(1967年)提出的用于誘導決策的方法。關于策略方法是否影響回應者的行為,Brandts 和Charness給了一個綜述,但他們并沒有給出一個統一的結論,回答這個問題似乎要回到具體的情境中。在一個與丟包博弈實驗類似的信任博弈實驗中,Casari 和Cason(2009)利用一個簡單的信任博弈結構⑩Casari 和Cason(2009)與本文第一部分介紹的Berg(1995)的信任博弈實驗略有不同,Casari 和Cason(2009)中的參與人A選擇的Ma被限定為只有兩個值0或者10,如果Ma= 10則參與人B得到5Ma即50,而Berg(1995)中參與人B得到3Ma。直接反應方法是參與人B知道參與人A的選擇之后再做出決策,而策略方法是參與人B不知道參與人A決策的情況下直接做出決策,而僅當Ma= 10參與人B的決策才實施。,測度了策略方法和直接反應方法對博弈參與人行為的影響,結果表明策略方法對信任者的行為沒有顯著影響,而策略方法顯著地降低了被信任者的可信水平;直接反應方法下被信任者平均給予信任者12.6點,而策略方法下被信任者平均返還值為7.4點。對于真實貨幣或者紙幣憑證與書寫數字代替決策是否產生不同的效應,目前沒有文獻研究此類問題。
Cox等人利用直接反應方法和被試間設計在新西蘭坎特伯雷大學總共執行了兩設置(x=4和x=7)的112組被試的丟包博弈實驗。參與人1首先得到一個統一規格的含有4(或者7)張單位紙幣憑證的信封,如果參與人1將信封“據為己有”,則參與人2得到一個更大的含有空白紙條的牛皮信封,且無需做出決策;如果參與人1選擇“歸還”,則與其配對的參與人2得到的大牛皮信封中含有:4(或7)張單位紙幣憑證的統一規格信封,其上標有“他人的憑證”,和一個標有“我的憑證”的統一規格空信封,以及另外的16(或者13)張單位紙幣憑證。參與人2決定將總共20張單位紙幣憑證分別放到標有“我的憑證”和“他人的憑證”的信封中,分別代表參與人2和參與人1的收益。
Cox等人的實驗結果表明,參與人1的行為與DG實驗結果無顯著區別,即使改變外部選擇權對參與人2的凸顯性以后,參與人2的行為在不同的外部選擇權設置下仍然沒有顯著區別,x=4設置中參與人2給參與人1的信封中平均含有6.61新幣,而x=7設置中參與人2給參與人1的信封中平均含有6.00新幣。他們推測,之所以信任博弈中存在丟包博弈實驗中不存在的互惠現象,是因為信任博弈中信任者的投資行為改變了被信任者的可選行為集,而丟包博弈實驗中參與人2只能分配總價值一定的“包”。外部選擇權的凸顯性仍然沒能成為打開丟包博弈之謎的鑰匙,正互惠理論無法對丟包博弈做出合理的預測。
Dufwenberg 和Gneezy在 2000年提出的丟包博弈中丟包人的決策行為與撿包人放棄的外部選擇權的大小不存在相關關系,這對近幾十年發展起來的互惠理論提出了挑戰。本文首先回顧了最后通牒博弈、信任博弈、偷襲者博弈和禮物交換博弈等博弈模型中存在的互惠現象,進而回顧了Dufwenberg 和Gneezy 2000年提出的丟包博弈之謎以及其他學者給出的丟包博弈實驗的證據,然后繼續追蹤了學者的后續研究:Servátka和Vadovi (2009)驗證了Brandts等(2006)的猜想,可能是不平等的外部選擇權導致了丟包人的決策行為與撿包人放棄的外部選擇權的不對稱性,實驗結果表明平等的外部選擇權并沒有改變這一關系。Cox等(2010)嘗試用外部選擇權對參與人2的凸顯性來破解丟包博弈之謎,在實施了直接反應和用紙幣憑證代替書寫決策數字之后,仍然沒有改變丟包人的決策行為與撿包人放棄的外部選擇權之間的不對稱性,丟包博弈之謎仍舊是個懸而未決的謎。
互惠理論對于研究我國當前經濟新常態下企業行為和市場績效有重要的意義,目前為止,學界對互惠的條件和邊界仍沒有統一的定論。破解丟包博弈之謎,對探究當前我國市場經濟條件下企業的競爭與合作、多成員之間的團隊創新有重要的啟示意義。
[參考文獻]
[1] 李曉義,李建標. 互惠、信任與治理效率——基于比較制度實驗的研究[J]. 南開經濟研究,2009(1):101-121.
[2] 韋倩. 強互惠理論研究評述[J]. 經濟學動態,2010(5):106-111.
[3] 李建標,龐榮輝. 公平偏好的產權效應——以最后通牒博弈實驗為例. 2010, 工作論文.
[4] 夏紀軍. 中國的信任結構及其決定——基于一組實驗的分析[J]. 財經研究,2005(6): 39-51.
[5] 陳葉烽. 親社會性行為及其社會偏好的分解[J]. 經濟研究,2009(12): 131-144.
[6] Rabin, M. Incorporating fairness into game theory and economics [J]. American Economic Review, 1993, 83(5): 1281-1302.
[7] Fehr, E., Schmidt, K. M. A theory of fairness, competition and cooperation [J]. Quarterly Journal of Economics, 1999,114(3):817-868.
[8] Bolton, G. E., Ockenfels, A. ERC: a theory of equity, reciprocity, and competition [J]. American Economic Review, 2000, 90(1):166-193.
[9] Charness, G., Rabin, M. Understanding social preferences with simple tests [J]. Quarterly Journal of Economics, 2002, 117(3):817-869.
[10] Guth, W., Schmittberger, R., Schwarze, B. An experimental analysis of ultimatium bargaining [J]. Journal of Economic Behavior and Organization, 1982, 3(4): 367—388.
[11] Cameron, L. Raising the stakes in the ultimatum game: experimental evidence from Indonesia, Discussion Paper, 1995, Department of Economics, Princeton University.
[12] Hoffman, E., McCabe, K. Smith, V. On expectations and monetary stakes in ultimatum games [J]. International Journal of Game Theory, 1996, 25(3): 289-301.
[13] Henrich, J., Boyd, R., Bowles, S. et al. In search of homo economicus: behavioral experiments in 15 small-scale societies. American Economic Review, 2001, 91(2):73-78.
[14] Berg, J., Dickhaut. J., McCabe K. Trust, reciprocity, and social history [J]. Games and Economic Behavior , 1995, 10(1): 122-142.
[15] Cox J C. How to identify trust and reciprocity [J]. Games and Economics behavior, 2004, 46(2): 260-281.
[16] Abbink, K.; Irlenbusch, B.; Renner, E. The moonlighting game [J]. Journal Economics Behaviror and Organization, 2000, 42(2):265-277.
[17] Falk, A.; Fehr, E., Fischbacher, U. Testing theories of fairness—Intentions matter [J]. Game and Economics and Behavior, 2008,62(1):287-304.
[18] Engelmann, D., Strobel, M. Inequality aversion and reciprocity in moonlighting games[J]. Games, 2010, 1(4):459-477.
[19] Akerlof, G. A. Labor contracts as partial gift exchange [J]. The Quarterly Journal of Economics, 1982, 97(4):543-569.
[20] Akerlof, G., Yellen, J. Fairness and unemployment [J]. American Economic Review 1988,78(2):44-49.
[21] Akerlof, G., Yellen, J. The fair-wage effort hypothesis and unemployment [J]. Quarterly Journal of Economics, 1990, 105(2):255-283.
[22] Fehr, E., Kirchsteiger, G., Riedl, A. Does fairness prevent market clearing? An experimental investigation [J]. Quarterly Journal of Economics, 1993, 108(2):437-459.
[23] Fehr, E., Gachter, S. Kirchsteiger, G. Reciprocity as a Contract Enforcement Device: Experimental Evidence[J]. Econometrica, 1997,65(4):833-860.
[24] Dufwenberg,M., Gneezy, U. Measuring beliefs in an experimental lost wallet game [J]. Games and Economic Behavior, 2000, 30(2):163-182.
[25] Brandts,J., Güth, W., Stiehler, A. I Want YOU! An experiment studying motivational effects when assigning distributive power [J],Labour Economics ,2006,13(1): 1-17.
[26] Charness, G., Haruvy, E., Sonsino, D. Social distance and reciprocity: an internet experiment[J]. Journal of Economics Behavior and Organization, 2007, 63(1): 88-103.
[27] Maro? Servátka Radovan Vadovi , Unequal outside options in the lost wallet game [J]. Economics Bulletin, 2009, 29(4): 2870-2883. [28] Battigalli, P., Dufwenberg, M. Dynamic psychological games [J]. Journal of Economic Theory, 2009, 144(1): 1-35.
[29] Cox, J., Servátka, M., Vadovi , R. Saliency of outside options in the lost wallet game [J]. Experimental Economics, 2010, 13(1):66-74.
[30] Selten, R. Die Strategiemethode zur Erforschung des eingeschr?nkt rationalen Verhaltens im Rahmen eines Oligopolexperiments, in H. Sauermann (ed.), Beitr?ge zur experimentellen Wirtschaftsforschung, Tübingen: Mohr, 1967,136-168.
[31] Brandts, J., Charness, G. the strategy verse the direct-response method: a survey of experimental comparisons, Working papers,2010. [32] Casari. M., Cason, T. The strategy method lowers measured trustworthy behavior [J]. Economics Letters, 103(3): 157-159.
〔執行編輯:周冬〕
The Puzzle of Lost Wallet Game: the Challenge of Theory of Reciprocity
Zhao Yu-liang
(Nankai University, Binhai, 300270, China)
Abstract:The theory of reciprocity is one of main topics of behavioral economics and experimental economics in recent several decades. However, lost wallet game proposed by Dufwenberg and Gneezy in 2000 indicated that the reward behavior of wallet owner and the size of the outside option the wallet picker forgone are uncorrelated or weakly correlated. Servátka and Vadovi? (2009) and Cox et al (2010) were trying to use the inequality of outside option and the saliency of outside option to the wallet loser to shed some light on the puzzle of lost wallet game, but their experiments hasn’t solved the asymmetry between the wallet loser’s reward behavior y and the outside option the wallet picker forgone. Therefore,the lost wallet game is still an open puzzle.
Key Words:puzzle of lost wallet game; reciprocity theory; inequality of outside option; saliency of outside option
[中圖分類號]F062.6
[文獻標識碼]A
[文章編號]2095-7572(2016)03-0106-11
[收稿日期]2016-4-2
[作者簡介]趙玉亮,南開大學濱海學院講師,管理學博士,研究方向:制度、產業行為和實驗經濟學,1982年,山東寧津人。