張敏 張倩男 邵光祖 孟慧慧 王雪鋒




【摘要】本文根據地圖1分析玩家走最優路徑和其他路徑兩種情況,列出贏得矩陣,根據對手的策略來選擇自己的策略.筆者發現無論對手選擇什么樣的策略,玩家都會選擇最優路徑,因此得到兩人博弈的支配性策略組合(納什均衡):需要在起點購買72箱水、84箱食物.本文根據地圖2確定在悲觀狀態下的天氣情況是除沙暴天氣以外其余全是高溫.三個玩家互相避開在同一時間內挖礦、購買物資和行走相同路徑,最終均分三人總的剩余資金.計算得出:一人在挖礦,兩人直達終點的情況下,總剩余資金是28175元;在3人輪流挖礦的情況下,總剩余資金是26628元.通過對比,我們發現一人挖礦,兩人直達終點的方案最優.根據玩家在最優路線過程中消耗的物資和在行程中購買的物資,我們得知在起點時,玩家A、C均需要購買180箱水、180箱食物.玩家B需要購買137箱水、335箱食物.
【關鍵詞】納什均衡;悲觀準則;樂觀準則
玩家憑借一張地圖,利用初始資金購買一定數量的水和食物(包括食品和其他日常用品),從起點出發在沙漠中行走.游戲途中會遇到不同的天氣,玩家也可以在礦山、村莊補充資金或資源,在游戲設定的規則下和規定的時間內到達終點,并保留盡可能多的資金.
一、問題分析
對于玩家來說,玩家同時從起點出發時會增加玩家“同行”時的消耗,降低玩家“同挖”時的收益,提高玩家“同買”時的價格.
在地圖1的情形下,游戲有2名玩家.對于這2名玩家,他們需要提前設定好行動方案.此外,他們在設定行動方案時要盡可能地避免與其他玩家相遇,因此需要猜測對方玩家的心理,這是典型的博弈游戲.由于最短路徑的消耗量是相同的,2名玩家在做決策時要么選擇走三天的最優路徑,要么選擇走其他路徑.玩家可以列出玩家們的贏得矩陣(支付矩陣)來分析對方采取的策略,以此得到自己的支配性策略,從而確定一般情況下玩家采取的最優策略組合(納什均衡).
在地圖2的情形下,游戲有3名玩家,游戲截止時間是第30天.已知一般情況下沙暴天氣出現的概率是20%,而本游戲中的30天內較少出現沙暴天氣,所以本游戲中出現沙暴天氣的概率低于20%.本游戲討論沙暴天氣的概率是3.33%的情況,即沙暴天氣在30天內只出現1天的情況.從悲觀準則分析,假設30天內有1天沙暴天氣,有29天高溫天氣.從樂觀準則分析,假設30天內有1天沙暴天氣,有29天晴朗天氣.我們分析3名玩家為追求個人的最大利益,均走最優路徑的方案是否可取.如果不可取,那么我們討論3名玩家在合作時互相避開同一時間內挖礦、購買物資和相同路徑移動的情況下,輪流挖礦以及一人挖礦、兩人直達兩種方案的總剩余資金,最終三人均分總剩余資金.
二、模型的建立與求解
(一)地圖1情形下模型的建立與求解
根據以往經驗,我們知道天氣不會對最優路徑造成太大影響.我們通過MATLAB軟件計算得出:去挖礦的所有路徑都不能使玩家到達終點時獲得的剩余資金最大,因此,我們選擇的路徑就是從起點直接到終點,不考慮挖礦.
地圖1情形下有2名玩家,記為A和B.假設2名玩家都是理性決策者,他們就會根據對方的策略來確定自己的策略,找出從起點到終點的最短線路.
由于他們都是理性決策者,他們如果選擇除最優路徑以外的其他路徑,那么一定會選擇從起點到終點的最近路徑.我們把除最優路徑以外的路徑策略記作else,最優路徑的策略記作min.
下面,我們分析玩家A的決策情況.
決策一:當玩家B選擇else時,玩家A可以選擇else或min.若玩家A選擇min,則玩家A勝利;若玩家A選擇else,則兩人平局.玩家A為了贏得本次博弈會選擇min.
決策二:當玩家B選擇min時,玩家A仍然可以選擇else或min.若玩家A選擇min,則兩人平局;若玩家A選擇else,則玩家A失敗.為了贏得本次博弈,玩家A在平局和失敗中會選擇平局,所以玩家A會選擇min.
在這個博弈的過程中,無論玩家B的策略選擇如何,玩家A都會選擇min.
下面,我們分析玩家B的決策情況.
對于玩家B來說,其面臨的博弈局面與玩家A完全相同,所以玩家B也會選擇min.博弈雙方都使用了支配性策略,他們支配性策略的組合就是納什均衡.由于事先考慮到對方可能與自己走相同的路徑,他們在起點帶的食物和水都要滿足支撐他們走最大相同路徑的消耗.我們最終判定最大相同路徑就是(else,else).
利用MATLAB軟件計算,他們需要在起點購買72箱水、84箱食物.
(二)地圖2情形下模型的建立與求解
根據當地的天氣規律及相應的數據記錄,我們計算沙暴天氣的概率是630×100%=20%,據此得到沙暴天氣在該地區一般情況下的概率.在本游戲中,已知在30天內較少出現沙暴天氣,則本游戲中的沙暴天氣的概率必然低于20%.本模型討論的沙暴天氣的概率是3.33%的情況,即沙暴天氣出現1天的情況.
在本游戲中,如果3名玩家都只追求個人利益的最大化,那么他們都會選擇走最優路徑.下面給出3名玩家同時走最優路徑,其中1名玩家物資消耗的情況,如表1所示.
我們從表1中可以看出,第16天消耗的物資將會超過負重上限1200 kg,即在第16天物資耗盡,游戲失敗.當執行策略的玩家面臨多次具有淘汰風險的博弈時,他們會以不可逆的趨勢向合作的方向發展,因此,他們會選擇合作.合作后的三人會將集體獲得的總資金進行均分.
設3名玩家分別是A,B,C.
1.輪流挖礦方案
已知30天內出現1天沙暴天氣,其余29天均為高溫的情況下,一個人挖礦的最大天數是5天.本方案中3人可以走不同路線,即玩家A從起點走最短路徑到達礦山,開始挖礦.在玩家B還未到達礦山時,玩家A已挖礦2天.在玩家B到達礦山后,玩家A撤出,玩家B隨即開始挖礦,玩家B挖礦5天,這時,玩家A直接走向終點,對玩家B和玩家C的路徑、購買物資和挖礦沒有產生影響.在玩家C到達礦山后,玩家B撤出,玩家C隨即開始挖礦,玩家C挖礦5天,這時,玩家B直接走向終點,對玩家C的路徑、購買物資和挖礦沒有產生影響.綜上所述,該方案的總挖礦最大天數是12天.玩家A,B,C的具體行程如表2所示.
我們按照A的行程利用Excel計算得到A最終的剩余資金是8730元;按照B的行程,利用Excel計算得到B最終的剩余資金是9975元;按照C的行程,利用Excel計算得到C最終的剩余資金是7923元.因此,3人輪流挖礦方案的總剩余資金是26628元.
3名玩家在起點購買(購買物資總量的依據是挖礦最大天數和路程消耗量)和在村莊購買(補充物資總量的依據是挖礦最大天數和路程消耗量)的物質,如表3所示.
由表3可知,玩家A、玩家B和玩家C在起點購買的水分別是432箱、110箱、422箱,食物分別是432箱、670箱、778箱.玩家A不經過村莊,玩家B在村莊沒有購買水和食物(即在起點購買的水和食物夠用),玩家C在村莊購買745箱水和895箱食物.
2.一人挖礦,兩人直達方案
本方案考慮兩人從起點直接去終點,即其中2名玩家不經過村莊和礦山.本方案中的玩家A和玩家C從起點直接去終點,對玩家B的路徑、購買物資和挖礦沒有產生影響.在玩家B到達礦山時,玩家B挖礦5天.綜上所述,該方案的總挖礦最大天數是5天.
玩家A,B,C的具體行程如表4所示.
這種方案下直達終點的玩家A和玩家C最終的剩余資金均是9100元,玩家B最終的剩余資金是9975元.因此,一人挖礦、兩人直達方案的總剩余資金是28175元.
玩家在起點購買(購買物資總量的依據是挖礦最大天數和路程消耗量)和在村莊購買(補充物資總量的依據是挖礦最大天數和路程消耗量)的物資,如表5所示.
由表5可知,玩家A、玩家B和玩家C在起點購買的水分別是180箱、137箱、180箱,食物分別是180箱、335箱、180箱.玩家A不經過村莊,玩家B在村莊購買298箱水,沒有購買食物(即在起點購買的食物夠用),玩家C在村莊沒有購買水和食物(即在起點購買的水和食物夠用).
三、結語
在地圖1的情形下,博弈雙方都采用支配性策略,玩家A和玩家B的支配性策略都選擇min.通過MATLAB軟件計算,他們需要在起點購買72箱水、84箱食物.在地圖2的情形下,從悲觀準則和樂觀準則兩個角度出發,首先,我們分析了3名玩家均走最優路徑方案不可行.其次,我們討論了3名玩家在合作時互相避開同一時間內挖礦、購買物資和相同路徑移動的情況下,輪流挖礦以及一人挖礦、兩人直達的兩種方案,得出3人輪流挖礦方案的總剩余資金是26628元;一人挖礦、兩人直達方案的總剩余資金是28175元.
【參考文獻】
[1]嚴蔚敏, 吳偉民. 數據結構(C語言版)[M].北京: 清華大學出版社,2007.
[2]岳超源.決策理論與方法[M]. 北京:科學出版社,2003.
[3]羅伯特·吉本斯. 博弈論基礎[M].高峰,譯.北京:中國社會科學出版社,1999.
[4]謝識予. 經濟博弈論(第三版)[M].上海:復旦大學出版社,2008.
[5]胡運權. 運籌學基礎及應用(第三版)[M].哈爾濱:哈爾濱工業大學出版社,1998.
[6]程理民, 吳江, 張玉林. 運籌學模型與方法教程[M]. 北京:清華大學出版社,2000.
[7]胡運權. 運籌學基礎及應用(第四版)[M]. 北京:高等教育出版社,2004.
[8]谷小娜.從“囚徒困境”到多人多次重復博弈的人性假設[J]. 中國集體經濟(下半月),2007(11):31-32.