劉奇龍 #, 賀軍州 # , 楊 燕, 王亞強,2, 高 磊,2, 李耀堂, 王瑞武,*
(1. 中國科學院昆明動物研究所, 昆明 650223; 2. 云南大學 數學與統計學院, 昆明 650091;
3. 云南中醫學院 現代教育技術中心,昆明 650500; 4. 云南財經大學 統計與數學學院,昆明 650221)
具資源效應的非對稱“鷹鴿博弈”進化穩定分析
劉奇龍1,2,3,#, 賀軍州1,4,# , 楊 燕1, 王亞強1,2, 高 磊1,2, 李耀堂2,*, 王瑞武1,*
(1. 中國科學院昆明動物研究所, 昆明 650223; 2. 云南大學 數學與統計學院, 昆明 650091;
3. 云南中醫學院 現代教育技術中心,昆明 650500; 4. 云南財經大學 統計與數學學院,昆明 650221)
解釋合作行為的演化一直是生命科學及社會學研究的重要問題之一。經典理論研究大都關注于合作雙方對等的情況。然而,在合作系統中的合作雙方通常是不對等的, 由此可帶來博弈雙方支付的非對稱并影響合作雙方的合作行為。該文基于經典的“鷹鴿博弈”模型, 同時考慮非對稱性相互關系和資源壓力的影響, 建立了具有強弱之分的四策略 (實力強且合作、實力強且不合作、實力弱且合作和實力弱且不合作) 非對稱博弈模型。結合演化博弈理論及動力系統穩定性理論分析發現:在系統達到穩定狀態時, 四種策略的比例變化顯著地依賴于博弈雙方的強弱之比、資源壓力及沖突的單位成本收益。對模型的進一步分析顯示, 當資源充足時, 實力強且合作的比例與沖突的單位成本收益負相關;而實力強且不合作、實力弱且不合作的比例都與沖突的單位成本收益正相關,并且隨著系統強弱對比增加, 實力強且合作及實力強且不合作的比例均增加, 而實力弱且不合作的比例將減小。當資源短缺時, 模型得出一個有趣的結論, 即隨著博弈雙方的強弱之比的變化, 經典的“智豬博弈”與“鷹鴿博弈”可相互轉化, 該結論將能為不同均衡狀態之間的相互轉化給出一個動力學解釋。
非對稱; 鷹鴿博弈; 復制動態方程; 進化穩定策略; 智豬博弈
對合作行為演化機制的探討是生物學、社會學和經濟學中一個尚未完全解決的重大問題(Axelrod,1984; Dopfer et al, 2004; Frank, 1998; West et al,2007; Ye et al, 2005)。由 John Maynard Smith 創立的進化博弈理論(Maynard Smith, 1982)為博弈理論的發展注入了活力, 并為研究系統內個體的合作問題奠定了方法學基礎。基于演化博弈理論基礎并利用“鷹鴿博弈”模型, John Maynard Smith (Maynard Smith, 1982)的研究發現:局中人采取混合策略(p, (1 ?p) )是該系統的進化穩定策略, 其中p=v/c(這里合作收益v小于沖突成本c)為博弈局中人采取鷹策略的比例。然而, 在現實的合作系統中, 博弈雙方不會一直處于唯一的一種穩定均衡狀態, 而會因為遺傳突變、公共資源的變化等因素而調整自己的策略(Boyd, 2006; Boyd & Lorberbaum,1987; Heinsohn & Packer, 1995; Hauert & Doebeli,2004; Wang et al, 2008), 從而均衡狀態可能被打破,并隨之建立新的均衡狀態。
經典的“鷹鴿博弈”理論模型不能解釋多種均衡狀態之間的相互轉化, 出現這種困境的原因很可能是經典模型僅考慮了博弈雙方對等的情況。而在現實的合作系統中, 博弈雙方大都具有非對稱性相互關系, 比如蜂后(queens)與工蜂(workers)、猴王與次級猴、雙親與子代、強者與弱者、雌性與雄性等(Maynard Smith, 1982)。大量的實驗觀測及數據分析顯示,幾乎所有的經典合作模式系統都存在著不同程度的非對稱性相互關系(Heinsohn & Packer,1995; Reeve, 1992; Wang et al, 2009, 2010, 2011),這種非對稱相互關系, 很可能是不同均衡狀態之間相互轉化的本質原因。
本文基于經典的“鷹鴿博弈”模型, 同時考慮非對稱性相互關系和資源壓力的影響, 建立了具有四策略(實力強且合作、實力強且不合作、實力弱且合作和實力弱且不合作) 的非對稱博弈模型。結合演化博弈理論及動力系統穩定性理論分析該系統的演化行為發現:在系統達到穩定狀態時, 四種策略的比例變化顯著地依賴于博弈雙方的強弱之比,資源壓力及沖突的單位成本收益。同時發現, 當資源短缺時, 隨著博弈雙方的強弱之比的變化, 經典的“智豬博弈”將與“鷹鴿博弈”之間形成相互轉化關系, 從而為合作系統的不同均衡狀態之間相互轉化給出了一個動力學解釋。
假設兩個理性群體(或個體), 它們都有兩個策略:鷹策略(H)和鴿策略(D), 于是博弈雙方有四個策略組合:(D,D)、(D,H)、(H,D)、(H,H)。在博弈中為了獲得某一收益v, 若博弈雙方都采取鷹策略H, 則雙方應付出沖突成本c, 雙方各自的純收益均為(v?c)/2; 若博弈雙方采取的策略不同,則采取鷹策略方的純收益為v, 而采取鴿策略方的純收益為0; 若博弈雙方都采取鴿策略, 則雙方各自的純收益均為v/2(Maynard Smith, 1982; Drew et al, 2002), 即得如表1所示的對稱支付矩陣。
經典的“鷹鴿博弈”暗含了合作系統中博弈雙方的實力是對等的, 其理論結果是:當收益大于沖突成本(即v>c)時, 該博弈存在一個純進化穩定策略(H,H); 而當收益小于沖突成本(即vc)時,該博弈存在一個混合進化穩定策略(p, (1 ?p) ), 其中p=v/c為博弈方采取鷹策略的比例(Maynard Smith, 1982; Drew et al, 2002)。而在現實的合作系統中博弈雙方的實力一般是不對等的(即實力強弱的非對稱)(Heinsohn & Packer, 1995; Reeve, 1992;Wang et al, 2009, 2010, 2011)。在博弈雙方實力不對等的條件下, 博弈雙方的收益受到雙方強弱之比的影響, 即當博弈雙方發生沖突且沖突成本大于收益(即c>v)時, 博弈雙方受到的傷害程度是不一樣的,也即實力強的參與者受到的傷害小于實力弱的參與者。此時博弈雙方的總損失(收益)會受到資源壓力的影響, 當資源充足時, 總損失(收益)會較小(大),當資源短缺時, 總損失(收益)會較大(小)。而當博弈雙方合作時, 對收益的分配是實力強的博弈方得到更高的收益。據此,我們建立如下非對稱“鷹鴿博弈”模型。
考慮實力不對等的博弈雙方進行“鷹鴿博弈”, 并且假設博弈雙方的實力之比為: :(1 )k?k(假定0.5<k<1, 即前者的實力比后者強), 其中k及1?k可定義為博弈雙方所占據的資源或發生沖突時獲勝的幾率等變量; 沖突成本c大于合作收益v; 當博弈雙方都采取鷹策略, 即發生沖突時, 博弈雙方所受到的傷害程度受對方實力的影響, 同時總的傷害程度受資源壓力a(當a=1時, 表示資源平衡, 當a>1時, 表示資源短缺, 當0<a<1時, 表示資源充足)的影響, 假設此時實力強的一方得到的純收益為a( 1 ?k)(v?c), 實力弱的一方得到的純收益為ak(v?c), 總收益為a(v?c); 當博弈雙方都采取鴿策略, 即合作時, 假設此時實力強的一方得到的純收益為kv, 實力弱的一方得到的純收益為(1?k)v; 當雙方采取不同的策略時, 假設收益與經典的“鷹鴿博弈”模型相同。根據以上假設, 可以得到如表2所示的非對稱支付矩陣。
在具有非對稱性的群體中, 每個個體可能扮演兩種不同的角色(Wu, 2000) (實力強或實力弱), 且這兩種角色分別有兩種不同的策略(合作和不合作),兩兩組合可得四類個體:實力強且合作SC、實力強且不合作SD、實力弱且合作WC和實力弱且不合作WD。為了分析這四類個體在一個系統內的分布情況, 我們虛擬出兩個具有四策略(SC、SD,WC和WD)的對稱博弈方進行隨機選擇配對博弈, 當博弈雙方同時扮演相同的角色時, 雙方的支付矩陣如表 1; 當博弈雙方扮演不同的角色時, 雙方的支付矩陣如表2。于是得到如表3所示的支付矩陣。

表1 對稱鷹鴿博弈支付矩陣Tab. 1 Payoff matrices for the symmetric Hawk-Dove game

表2 非對稱鷹鴿博弈支付矩陣Tab. 2 Payoff matrices for the symmetric Hawk-Dove game

表3 四策略支付矩陣Tab. 3 Payoff matrix with four strategies
假設博弈雙方在進行“鷹鴿博弈”時, 采取策略SC、SD、WC和WD的個體,占群體的數量比例分別為x1、x2、x3和x4。此時群體中采取策略SC、SD、WC和WD的個體的期望收益分別為:

按照生物進化復制動態理論(Taylor & Jonker,1978; Schuster & Sigmund, 1983), 采用策略收益較低的博弈方會改變自己的策略, 轉向(學習或模仿)有較高收益的策略, 因此,群體中采用不同策略個體的數量比例就會發生變化, 特定策略的比例變化速度與其比例和其收益超過平均收益的幅度均成正比。由此得到群體中采用策略SC、SD、WC和WD的比例關于時間t的復制動態方程(Schuster &Sigmund, 1983; Taylor & Jonker, 1978):



表4 文中符號及定義Tab. 4 Symbols and definitions used in this paper



考慮到種群中采取某一策略的個體的數量比例不可能為負值, 于是只需分析系統(1)的非負平衡點。
由假設條件v 為分析系統(1)非負平衡點的穩定性, 可以通過求其線性近似系統在平衡點處對應特征方程的特征值, 由特征值的符號來判斷在該平衡點處系統的穩定性, 并利用Liapunov函數(Gu, 2000; Zhang &Feng, 2000)來證明E1,E2的全局穩定性。應用此法,我們得到在假設條件v 上是全局穩定的; 當ak> 0.5 >a( 1 ?k)時, 非負平衡點E2在 上是全局穩定的(附錄2,見本刊網站Supporting info)。 為了清晰顯示在不同條件下系統(1)的動力學行為, 下面我們采用 Runge-Kutta-Felhberg算法(Xue & Cheng, 2004)近似求解系統(1), 對該系統的穩定性進行定量說明。 取系統中參數a=2、k=0.6,a( 1 ?k) = 0 .8 > 0 .5,數值模擬顯示, 當進化達到穩定狀態時, 實力強且合作與實力弱且不合作的個體分別以1 ? (v/c) = 0.3和v/c= 0 .7的比例共存, 而實力強且不合作與實力弱且合作的個體絕滅(圖 1A); 取系統中的參數a= 0 .5、k=0.6, 此時ak= 0 .3 < 0 .5, 數值模擬顯示,對于不同的初值, 當進化達到穩定狀態時, 實力強且合作、實力強且不合作和實力弱且不合作的個體分別以0.2457、0.4526和0.3017的比例共存, 而實力弱且合作的個體絕滅(圖 1B)。而取系統中參數a= 1 、k=0.6, 此時a( 1 ?k) = 0.4 < 0.5 < 0.6=ak,數值模擬顯示, 對于不同的初值, 當進化達到穩定狀態時, 實力強且合作與實力強且不合作的個體分別以1 ? (v/c) = 0 .3和v/c= 0 .7的比例共存, 而實力弱且合作與實力弱且不合作的個體絕滅(圖1C)。 圖1 四種策略的比例隨時間的變化Fig. 1 The proportion of four strategies changes with time varying 從上面的分析知, 當ak<0.5時, 平衡點E1是全局穩定點, 而由于我們的前提是k> 0.5, 故參數a需滿足a<1, 即資源充足。下面我們將在資源充足的條件下, 討論資源壓力a、強者的實力k和沖突的單位成本收益v/c對平衡點E1對應的各策略比例的影響。 在點E1中x3= 0, 即實力弱且合作的比例為零,顯然它與參數a、k和v/c的選取無關, 于是只需討論a、k和v/c對點E1的其它三個分量的影響。令m=v/c(定義為沖突的單位成本收益), 由上面的求解有因此,x1、x2和x4均可看成a、k、m的函數, 從而得如圖2所示的各參數對x1、x2和x4的影響。 由圖2可以看出, 隨著沖突的單位成本收益m的增大, 實力強且合作(圖2 A-C)的比例減小;而實力強且不合作(見圖 2 D-F)與實力弱且不合作(圖 2 G-I)的比例均增大, 即E1穩定時, 實力強且合作的比例與沖突的單位成本收益負相關;而實力強且不合作、實力弱且不合作的比例均與沖突的單位成本收益正相關。沖突的單位成本收益越大博弈雙方越傾向于選擇沖突的結論與群體(或個體)趨利本性相符(Hauert & Doebeli, 2004; Maynard Smith, 1982)。通過比較圖2各分圖橫軸變量k對各策略比例的影響發現, 實力強且合作(圖 2 A-C)及實力強且不合作(圖2 D-F)的比例隨k的增大而增大, 但實力弱且不合作(圖2 G-I)的比例卻隨之減小。另外, 當a增大時, 實力強且合作(圖 2 A-C)及實力強且不合作(圖 2 D-F)的比例均增大, 而實力弱且不合作(圖 2 G-I)的比例將會減小。以上結果分析表明,博弈雙方的實力之比和資源壓力的增大都不利于實力弱的個體的生存。 圖2 沖突的單位成本收益與強者的實力k對平衡點E1的影響Fig. 2 Effects of the cost-to-benefit of conflict and strength k of strong player on equilibrium point E1 需要指出的是當a( 1 ?k) > 0 .5時, 平衡點E2和E3是局部漸近穩定的(附錄 1,見本刊網站Supporting info), 即當四種策略初始比例在平衡點E3附近時, 解曲線才趨于平衡點E3, 而當四種策略初始比例遠離平衡點E3時, 解曲線將趨于平衡點E2。有趣的是, 當a( 1 ?k) > 0 .5時, 局部漸近穩定點E2和E3的結果恰巧分別對應著經典的“鷹鴿博弈”(Maynard Smith, 1982)和“智豬博弈”(Eric, 2001)的結果。由于在a( 1 ?k) > 0 .5條件下平衡點E2和E3是局部漸近穩定的, 因此,我們有必要探討四種策略的初始值及系統參數與兩局部漸近穩定點E2和E3之間的關系。 “智豬博弈”與“鷹鴿博弈”之間的相互轉化關系可為不同系統的不同合作形式提供一個合理的解釋。比如在狐蒙 (meerkats)社群中, 成員進食時會出現幾個個體輪流放哨鳴警(可將個體的合作行為視為混合策略)以防備撲食者(Clutton-Brock et al, 1999), 這正對應著“鷹鴿博弈”的模型結果; 而在意大利蜂(Apis mellifera)社群中, 蜂后(queens)監督懲罰工蜂(workers)產卵(Oldroyd &Ratnieks, 2000; Ratnieks & Visscher, 1989), 這一結果與“智豬博弈”預測的結果一致。導致不同的合作系統出現不同的合作形式可能根源于這些系統具有不同的非對稱度, 當具有不同非對稱度的合作系統遭遇不同的生境條件時(比如資源短缺時), 我們的研究顯示不同的合作系統將可能展現出多樣化的合作形式。 Axelrod R. 1984. The Evolution of Cooperation[M]. New York: Basic Books Press. Boyd R. 2006. You have to think different[J].J Evol Biol,19(5): 1380-1382. Boyd R, Lorberbaum JP. 1987. No pure strategy is evolutionarily stable in the repeated prisoner’s dilemma game[J].Nature,327(6117): 58-59. Clutton-Brock TH, O’Riain MJ, Brotherton PNM, Gaynor D, Kansky R,Griffin AS, Manser M. 1999. Selfish sentinels in cooperative mammals[J].Science,284(5420): 1640-1644. Drew F, Jean T, Huang T, Guo K, Gong P, Wang YM, Wang Y, Zhong HJ.2002. Game Theory[M]. Beijing: China Renmin University Press.[Drew F, Jean T, 黃濤, 郭凱, 龔鵬, 王一民, 王勇, 鐘鴻鈞. 2002.博弈論. 北京: 中國人民大學出版社.] Dopfer K, Foster J, Potts J. 2004. Micro-meso-macro[J].J Evol Econ,14(3):263-279. Eric R. 2001. Games and Information: An Introduction to Game.Theory[M]. 4th ed. Oxford: Basil Blackwell. Frank SA. 1998. Foundations of Social Evolution[M]. Princeton: Princeton University Press. Gu SS. 2000. Ordinary Ddifferential Equations and Dynamical Systems[M].Shanghai: Shanghai Jiaotong University Press. [顧圣士. 2000. 微分方程和動力系統. 上海: 上海交通大學出版社.] Heinsohn R, Packer C. 1995. Complex cooperative strategies in group-territorial African lions[J].Science,269(5228): 1260-1262. Hauert C, Doebeli M. 2004. Spatial structure often inhibits the evolution of cooperation in the snowdrift game[J].Nature,428(6983): 643-646. Maynard Smith J. 1982. Evolution and the Theory of Games[M].Cambridge: Cambridge University Press. Oldroyd BP, Ratnieks FLW. 2000. Evolution of worker sterility in honey-bees (Apis mellifera): how anarchistic workers evade policing by laying eggs that have low removal rates[J].Behav Ecol Sociobiol,47(4): 268-273. Ratnieks FLW, Visscher PK. 1989. Worker policing in the honeybee[J].Nature,342(6251): 796-797. Reeve HK. 1992. Queen activation of lazy workers in colonies of the eusocial naked mole-rat[J].Nature,358(6382): 147-149. Schuster P, Sigmund K. 1983. Replicator dynamics[J].J Theor Biol, 100(3):533-538. Taylor PD, Jonker LB. 1978. Evolutionary stable strategies and game dynamics[J].Math Biosciences,40(1-2): 145-156. Wang RW, He JZ, Wang YQ, Shi L, Li YT. 2010. Asymmetric interaction will facilitate the evolution of cooperation[J].Sci Chin: Life Sci,53(8):1041-1046. [王瑞武, 賀軍州, 王亞強, 石磊, 李耀堂. 2010. 非對稱性有利于合作行為的演化. 中國科學: 生命科學, 40(8): 758-764.] Wang RW, Ridley J, Sun BF, Zheng Q, Dunn DW, Cook J, Shi L, Zhang YP, Yu DW. 2009. Interference competition and high temperatures reduce the virulence of fig wasps and stabilize a fig-wasp mutualism[J].PLoS One,4(11): e7802. Wang RW, Shi L, Ai SM, Zheng Q. 2008. Trade-off between reciprocal mutualists: local resource availability-oriented interaction in fig/fig wasp mutualism[J].J Anim Ecol,77(3): 616-623. Wang RW, Sun BF, Zheng Q, Shi L, Zhu LX. 2011. Asymmetric interaction and indeterminate fitness correlation between cooperative partners in the fig-fig wasp mutualism[J].J R Soc Interface,8(63): 1487-1496. West SA, Griffin AS, Gardner A. 2007. Social semantics: altruism,cooperation, mutualism, strong reciprocity and group selection[J].J Evol Biol,20(2): 415-432. Wu WK. 2000. Role change in the value net of game theory[J].Nankai Bus Rev,3(5): 18-20. [吳維庫. 2000. 競爭博弈中的角色轉換. 南開管理評論, 3(5): 18-20.] Xue DY, Cheng YQ. 2004. Advanced Application of MATLAB to Solve Mathematical Problems[M]. Beijing: Tsinghua University Press. [薛定宇, 陳陽泉. 2004. 高等應用數學問題的 MATLAB求解. 北京: 清華大學出版社.] Ye H, Wang DD, Lou WD. 2005. On endogenetic preference for altruism behaviors and its implications to economics[J].Econ Res J,(8): 84-94.[葉航, 汪丁丁, 羅衛東. 2005. 作為內生偏好的利他行為及其經濟學意義. 經濟研究, (8): 84-94.] Zhang JY, Feng BY. 2000. Geometric and Bifurcation Problems Theory of Ordinary Differential Equations[M]. Beijing: Peking University Press.[張錦炎, 馮貝葉. 2000. 常微分方程幾何理論與分支問題. 北京:北京大學出版社.] Evolutionary stability analysis of asymmetric hawk-dove game considering the impact of common resource LIU Qi-Long1,2,3,?, HE Jun-Zhou1,4,?, YANG Yan1, WANG Ya-Qiang1,2, GAO Lei1,2,LI Yao-Tang2,*, WANG Rui-Wu1,* (1.Kunming Institute of Zoology,the Chinese Academy of Sciences,Kunming650223,China; Explaining the evolution of cooperation remains one of the important problems in both biology and social science. Classical theories mainly based on an assumption that cooperative players are symmetrically interacted. However,almost all the well-studied systems showed that cooperative players are in fact asymmetrically interacted and that asymmetric interaction might greatly affect cooperation behavior of the involved players. Considering the asymmetric interaction and the selection pressure of resources, we present a model that possesses four strategies: strengthcooperation (SC), strength-defection (SD), weakness-cooperation (WC) and weakness-defection (WD). Combining evolutionary game theory with dynamical stability theory, we find that the evolutionary results closely depend on the asymmetric interaction and selection pressure of resources as well as cost-to-benefit ratio of conflict. When the common resources are plentiful, the cost-to-benefit ratio of conflict is negatively correlated with the probability of SC, while it is positively correlated with the probability of SD and WD. With increasing the strength ratio between the strong and weak players, the proportion of SC and SD will increase, while the proportion of WD will reduce. The model developed here has intrinsically integrated Boxed Pigs game and Hawk-Dove game. When the common resource is at shortage, the Boxed Pigs game will transform into Hawk-Dove game under the increase of the strength ratio between the strong and weak players. Asymmetric; Hawk-Dove game; Replicator equation; Evolutionarily stable strategy; Boxed pigs game Q332;Q111;O225;F224 A 0254-5853-(2012)04-0373-08 10.3724/SP.J.1141.2012.04373 2011-11-20; 接受日期:2012-04-20 國家自然科學基金資助項目具有P-F性質矩陣及其相關矩陣的性質、算法和應用研究(10961027);合作系統中非對稱性和互惠(或親緣)關系的相互作用研究(71161020)和種間合作系統穩定性維持機制的探討(31170408) ;云南省自然科學基金(2009CD104); 中國科學院優秀青年科技專項(KSCX2-EW-Q-9)*通信作者(Corresponding author), E-mail: ruiwukiz@hotmail.com; liyaotang@ynu.edu.cn#共同第一作者(Authors contributed equally to the work)2.2 系統(1)非負平衡點的穩定性分析




3 結果與討論



2.School of Mathematics and Statistics,Yunnan University,Kunming650091,China;
3.Modern Education Technology Center,Yunnan University of Traditional Chinese Medicine,Kunming650500,China;4. Statistics and Mathematics College, Yunnan University of Finance and Economics, Kunming650221, China)