基于蜈蚣悖論的不完全信息動態博弈研究

2016-10-20 07:10:40劉奇玄莉

商情 2016年6期

劉奇玄莉

【摘要】蜈蚣博弈（centipede game）是博弈論（Game Theory）中的一種經典模型，在經濟學、國際關系、軍事戰略等學科都有廣泛的應用。傳統上采用的逆推法在分析完全且完美信息的動態博弈時無疑是有用的工具，然而在蜈蚣博弈問題上邏輯嚴密的逆推法得到的結論卻與直覺相悖。筆者認為經典案例與現實的最大差異在于現實中存在的都是不完全信息的博弈，并舉經濟學中的海盜分金模型和中國古代三國時期的孫劉聯盟分別作為完全和不完全信息之例加以輔證，以期使之在現實生活中得到更廣泛的應用。

【關鍵詞】蜈蚣博弈，悖論，不完全信息動態博弈，海盜分金

“蜈蚣博弈”是羅森塞爾（Rosenthal）于1981年提出的一個動態博弈問題，由于其擴展形很像一條蜈蚣而得名。兩個博弈方A和B，輪流進行策略選擇，可供選擇的策略有“合作”或“背叛”，我們假設A和B均為完全理性人，博弈次數是有限次，且支付給定如下：

A ------ B ------ A --………….-- A ------ B ------ A ------ B ------ （10，10）

| * * * | * * * | * *………* * | * * * | * * * | * * * |

（1，1）（0，3）（2，2）（8，8）（7，10）（9，9）（8，11）

博弈從左向右進行，橫向表示合作，縱向表示背叛，括號中表示（A的收益，B的收益）?？紤]最后一步：B選擇背叛的收益為11，大于合作收益10，則B一定選擇背叛；A知道B這樣想，所以在上一步時不會選擇合作，如此推論下去，結論是A在一開始就不會選擇合作，兩人收益各得1，博弈結束。而直觀上看，如果合作下去兩人的收益似乎都要更多更有利，因此逆推法的邏輯和直覺出現了悖論。

另外一個利用逆推法的經濟學模型是海盜分金。5個海盜搶了100枚金幣，他們通過抽簽來決定順序，每人提出一個分配方案進行全體投票表決，超過半數的人贊成則方案通過，否則提出方案者就要被扔到海里喂鯊魚。假定所有海盜都是聰明的理智人，還是從后往前推：當1至3號都被扔到海里只剩4號和5號時，無論4號提出何種方案5號都可以投反對票以獨吞所有金幣，4號必死無疑，因此他定會無條件支持3號的方案。3號知道4號的想法，因此輪到他時，會提出（100，0，0）的方案，這樣雖然4號一枚金幣都得不到仍然會投贊成票，再加上自己的票，3號的方案會獲得通過。而2號也洞悉了3號的想法，他會提出（98，0，1，1）的方案，這樣4號和5號的結果比3號主持分配時要好，因此2號得到了兩人的支持，方案獲得通過。1號推知2號的方案后，會提出（97，0，1，2，0）或（97，0，1，0，2），這樣3號能得到一枚金幣，比2號的方案要好，4號或5號也能比原先多得到一枚金幣，因此會支持1號的方案，最終結果1號獨得97枚！這樣，排在最前面的人看似不利，有著更高被扔到海里的風險，結果成為這場博弈的最大贏家；而最后的人看似安全，甚至能坐收漁翁之利，卻不得不接受別人的方案只能分得一小杯殘羹。海盜分金可謂是逆推法在完全信息動態博弈中應用的經典案例，但許多人不禁要問：其他四個海盜真的會眼睜睜看著1號把絕大部分金幣收入囊中嗎？其實，我們在這個模型中假設了所有博弈方均能完全了解其他人的策略，倘若有人不，那么博弈定不會在第一步就結束，這就涉及到了不完全信息動態博弈。筆者認為這種情況要比完全信息在現實中利用的更為廣泛，不妨舉三國鼎立時期的孫劉聯盟為例分析。

公元208年，孫劉兩家聯手抗曹，合作時間越長越有利，但其中有個誘使聯盟破裂的因素——荊州。兩人都可以選擇一開始就撕破臉皮開打，這樣協議撕毀，兩人都無法從合作中取得收益。他們也可以選擇擱置爭議，先合作下去，但荊州在劉備手里，擱置時間越長孫權要回來的可能性就越小。不妨假設N年后，孫權就永遠要不回來了。博弈者孫權想，不如在第N-1年的時候撕毀協議把荊州搶回來，孫劉少聯盟一年損失也不太大。另一博弈方劉備想，與其等到第N-1年的時候孫權把荊州搶了，不如先下手為強，在第N-2年的時候翻臉，聯盟時間少那么一年對打敗曹操影響也微乎其微。博弈就這么進行下去，直到孫權想，孫劉聯盟對抗曹操起碼要維持11年，在這之前劉備不敢跟我翻臉，那11年一到，就讓呂蒙搶了荊州。而劉備是博弈中占優的一方，因為他具有荊州的實際控制權，因此行動更為保守，他估計的聯盟時間要比孫權長，孫權擔心時間太久荊州要不回來，故比較激進，終于在公元219年直取荊州，孫劉聯盟破裂。在這個例子中，博弈雙方不知道對方的底線，所以最終只能是在某一時間點一方選擇背叛。孫權除了奪回荊州別無選擇，而劉備不得不繼續占據，否則兩者的地位就會互換，劉備將面臨和孫權一樣的窘境。

其實對于蜈蚣悖論，西方研究博弈論的專家已經嘗試通過實驗來尋求解答。實驗發現，不會出現一開始選擇“不合作”策略而雙方各得收益1的情況，雙方會自動選擇合作性策略，從而走向合作。這種做法違反逆推法的結論，然而我們會發現，即使雙方開始能走向合作，這種合作也不會堅持到最后一步。理性的人出于自身利益的考慮，肯定在某一步采取不合作策略。逆推法肯定在某一步要起作用，使得合作不能進行下去。蜈蚣悖論在現實中的對應情形是，參與者不會在開始時確定他的策略為“不合作”，但他難以確定在何處采取“不合作”策略，孫劉聯盟破裂的例子就是典型。

參考文獻：

[1]張峰. 蜈蚣博弈悖論引發的思考[J].湖南科技大學學報（社會科學版），2005.

[2]嚴天秀. 蜈蚣博弈悖論的探析[J].大觀周刊，2012.

商情2016年6期

商情的其它文章: 淺析物流工程及其技術創新思路; 淺談辦公樓基建維修工程造價審計; 淺談某大型煤炭建設項目中間財務評價; 關于醉駕致人死亡案件的幾點思考; 論司法中利益衡量的缺陷及優化途徑; 淺談憲法權威的維護