卜振興
(南開大學,天津 300071)
?
運用無限次鷹鴿博弈模型研究國際關系
——以中日關系為例
卜振興
(南開大學,天津300071)
[關鍵詞]中日關系;鷹鴿博弈;無限次重復博弈
[摘要]中日關系是東北亞地區最重要的雙邊關系之一,中日關系的發展對東北亞地區的局勢有重要影響。如何看待和解讀當前的中日關系,如何構建未來的中日關系,不僅關系到中日兩國的國家利益,而且影響到東亞地區的穩定。筆者運用鷹鴿博弈模型分析了中日關系,研究表明自身實力、戰略眼光、利益爭奪、懲罰程度和博弈機制等都是制約博弈戰略的重要因素。
近年來,中日之間圍繞領土爭端、歷史問題等展開了激烈的角逐,大有劍拔弩張,戰爭一觸即發的形勢。那么日本為什么一再采取激進的策略?大國之間相互制約的機制是什么?哪些因素決定了國家的戰略選擇?這就是本文嘗試回答的問題。筆者將以中日戰略博弈為基礎,利用無限次“鷹鴿博弈”模型,分析大國之間進行外交博弈的戰略選擇問題。
一、 理論概述
在進行本文的分析之前,有必要對文中所運用到的理論模型進行簡單的介紹。本文運用的理論模型是基于無限次重復“鷹鴿博弈”模型,下面就相關理論進行簡要介紹。
(一)重復博弈
令G表示一個基本博弈, 如果在相同博弈方、相同的規則和基本相似的環境下,該博弈重復了N次“記為G(N)”,就形成了重復博弈,其中每次博弈可以視為G(N)的一個階段[1]。按照博弈次數是否有終點可以將重復博弈劃分為“有限次重復博弈”和“無限次重復博弈”。有限次重復博弈是指博弈次數有限的重復博弈(稱為“狹義有限次重復博弈”)或人們認為確定有限的重復博弈(也稱為“廣義有限次重復博弈”)。無限次重復博弈是指博弈次數無限的博弈(稱為“狹義無限次重復博弈”)或博弈方主觀認定或預期次數無限的重復博弈(也稱為“廣義無限次重復博弈”)。例如,處于國際關系中的兩個國家之間的博弈由于沒有可以確定的結束時間,可以將他們之間的博弈視為無限次重復博弈。
(二)鷹鴿博弈
鷹鴿博弈并不是指老鷹和鴿子這兩種動物的博弈,而是指博弈中的兩種策略選擇。“鷹”指的是攻擊型策略,即鷹派戰略,“鴿”指的是和平型戰略,即鴿派戰略。鷹鴿博弈模型可用來分析國際關系中廣泛存在的合作與沖突、強硬和緩和、威脅和妥協的關系[2]。
令B表示雙方爭奪的利益,L表示爭奪中失敗一方的損失,B、L取值均大于0。為了簡化起見,我們假設甲乙雙方在博弈中實力對等,因此如果雙方都采取鷹派戰略,那么雙方獲勝和失敗的概率均為0.5,各自的期望利益都是(B-L)/2;如果雙方都采用鴿派戰略,那么雙方能夠分享目標利益,各得B/2單位利益;如果鴿派策略遇到鷹派策略,那么采用鷹派策略的一方獲得全部利益為B,采用鴿派策略的一方得不到任何利益,但也沒有損失。因此進行一次博弈的收益矩陣如表1所示:

表1 鷹鴿博弈收益矩陣表
由納什均衡分析可知:(鷹、鷹)戰略是雙方的純策略納什均衡戰略,也就意味著在一次博弈中雙方采取鷹派戰略是博弈的最佳戰略選擇,但這種策略并不是雙方的利益最大化的決策,因為如果雙方能采取(鴿、鴿)戰略組合,那么對于雙方都是更加有益的。
(三)報復機制
報復機制也稱為違約懲罰機制,是指對違反合作策略的博弈方采取的懲罰性策略,報復機制的建立增加了違約的成本,提高了合作的可能性。重復博弈不同于一次博弈,不僅僅因為博弈次數的差異,更為重要的是在重復博弈中存在報復機制。報復機制又分為“冷酷觸發策略”和“胡蘿卜加大棒策略”。“冷酷觸發策略”是指博弈方首先試探合作,一旦發現對方采取不合作的策略,則另一方在隨后的各期一直采取不合作的策略[3]。但是冷酷觸發策略較為嚴厲,只要有一方采取不合作的戰略時,接下來的報復行為就會一直持續下去,并且這種報復行為對于雙方都是有害的,顯然是不符合利益最大化決策的標準。于是Abreu(1986)[4]提出了一種帶有諒解機制的簡單報復機制,即“胡蘿卜加大棒策略”,一旦發現對方在某一期采取不合作的戰略時,另一方將會在下一期緊接著采取不合作戰略,但是這種帶有報復性的策略是在一個階段中一次性完成的,一旦在這一期完成了這種報復性的策略,在下一期又會回到合作戰略上來。
二、 博弈參數確定
通過上文關于鷹鴿博弈模型的介紹,為了將模型運用于中日關系的研究,我們需要首先確定模型中各參數變量的取值情況。下面本文將結合中日關系的現狀,對中日之間的利益紛爭、中日一旦發生嚴重對抗勝負幾率以及為爭奪發生的損失情況分析如下:
(一)利益沖突(B)
在講到中日之間的利益紛爭的時候,非常有必要對中日關系的歷史進行簡要的回顧。中日兩國一衣帶水、隔海相望,在政治、經濟、文化等方面都有密切的聯系。中日關系的歷史最早可以追溯到東漢時期,據范嘩《后漢書·東夷傳》記載,東漢光武帝年間曾經向倭奴國(即今天的“日本”)贈送過金印,這是中日交往最早的記錄。從東漢光武帝至今,中日關系歷經兩千多年的磨礪,可以說是幾經沉浮,起伏跌宕。在中日交往的歷程中既有和平相處的歷史,也有刀兵相向的時代,有和平友好的“蜜月期”,也有劍拔弩張的危險期。根據中日關系發展的歷程,本文將中日關系劃分為以下幾個階段:
通過對于中日兩國關系歷史的回顧,一方面使我們對中日關系的發展和演變有了一個清晰的印象,中國歷來堅持和平共處,以鄰為伴,與鄰為善的原則,造成目前中日關系緊張的原因在日本,改善中日關系的主動權也在日本;另一方面也使我們歸納出了中日關系沖突的焦點,中日在以下方面存在明顯的利益沖突和矛盾:一是領土邊界問題,包括釣魚島及附屬島嶼的歸屬問題,春曉油氣田的開采區和所有權爭議,以及防空識別區等問題;二是歷史問題,包括日本領導人參拜靖國神社、處理慰安婦、篡改歷史教科書、修改和平憲法及其他歷史遺留問題等;三是意識形態問題,意識形態問題是指,兩個不同社會制度國家之間由于意識形態的差異存在的分歧和矛盾,資本主義社會與社會主義社會關于意識形態的矛盾自社會主義國家建立后就一直存在,并一直延續至今。意識形態問題是兩類不同社會制度的國家共有的問題,中國是社會主義國家,而日本屬于資本主義國家,中日之間當然也存在這種矛盾;四是安全困境問題,安全困境問題是指,由于國際關系基本處于無政府狀態,各國擔心受到對方的侵害,為了自保勢必盡可能追求權力,而這又導致對方的不安,因此雙方競相追求和擴充實力,進一步加劇了安全擔憂,使國家間的不穩定因素不斷增加(封永平2006[5],呂曉莉和鐘準2009[6]等)。安全困境問題則是所有國家在外交關系中都會面臨的問題。但是由于日本處于太平洋上的一個島國,西邊和那邊是漫無邊際的太平洋,東面和北面則是強大的中國和俄羅斯,地理位置的特殊性使得中日之間的安全困境問題尤為突出。
領土爭端、歷史遺留問題、意識形態差異和安全困境都是雙方矛盾和分歧的焦點,四種因素相互疊加,使得中日之間的關系錯綜復雜。為了使我們對于中日關系的分析更加一般化,我們假定中日之間利益爭奪的利益為B。
(二)勝敗幾率(P)
兩國之間一旦存在利益沖突,無非是通過以下路徑來解決,一是通過政治協商,友好談判來解決。如中蒙邊境的劃分,新中國成立后,由于中蒙邊界一直沒有完全勘察界定,因此雙方存在一定的分歧,1962年,中蒙雙方通過友好協商正式簽署《中蒙邊界條約》,中蒙邊界問題順利解決。二是一方通過武力威懾,迫使另一方主動放棄存在爭議的利益。如烏克蘭危機中,關于克里米亞的歸屬問題,美俄之間是存在嚴重分歧和沖突的,但是雙方都沒有指望通過武力解決問題,采取了克制態度。最終俄羅斯通過武力威懾,迫使烏克蘭波羅申科政府接受克里米亞關于獨立的公投決議。三是雙方不惜使用武力解決,如英阿馬島之戰,馬爾維納斯群島又稱福克蘭群島,是南大西洋上的一個島國,歷來存在領土爭議,1982年,阿根廷政府對馬島實施軍事占領,英國隨即進行反擊,英國和阿根廷為爭奪馬爾維納斯群島的主權歸屬的戰爭爆發,戰爭持續了兩個多月,最終英國戰勝阿根廷獲得馬爾維納斯群島的主權。但是無論是以上述哪種方式解決爭端,利益劃分的背后都是以一個國家的政治、經濟、軍事實力為基礎的,這決定了雙方在(鷹,鷹)對抗博弈和(鴿,鴿)合作博弈中獲勝的概率和分享利益的比例。

表2 中日關系發展歷程簡介表
資料來源:根據中華人民共和國外交部網站公布資料整理而得。
具體到中日問題上,根據世界知名的軍事實力排名網站“Global Firepower (世界軍力GFP)*①資料來源:http://www.globalfirepower.com/”的排名,中國軍力位居第三位,而日本為第九位。這份排名主要是根據每個國家常規軍事實力,并參考一國的財政、資源和地理狀況等因素確定的,不包括核武器等因素。另據世界權威防務期刊——英國《簡氏防務周刊》*②資料來源:簡氏防務周刊http://www.janes.com/公布的2014年世界軍事實力排名顯示,中國排名為第四,遠超日本。這份排名同樣綜合考慮了一個國家的經濟基礎、軍費開支、軍事科技和軍事自主研發等一系列的關鍵因素。通過這兩份排名,我們可以明確的是,在綜合軍事實力方面,中國具有絕對優勢。但是同時不可否認的是在海軍實力方面,日本的海軍實力長期以來位居亞洲首位,日本在海軍裝備、海軍科技等領域均具有明顯的優勢。加之中日的戰略同盟關系和中國與周邊很多國家存在領土、領海糾紛,一旦由于釣魚島問題發生激烈對抗,中國能否取得絕對優勢仍然存在很多變數。因此,我們設定中日之間發生沖突后,中日一方獲勝的概率為P1,日方獲勝的概率為P2,且滿足P1+P2=1
(三)損失程度(L)
如果雙方是通過友好協商或者武力威懾方式實現對于爭議利益的處理,所花費的成本相對于爭議利益而言是相對較小的,成本基本上可以忽略不計。如果雙方是通過對抗實現對于爭議利益的處置,那么雙方付出的代價是很大的。以中日為例,一旦中日之間因為釣魚島問題而開戰,或引起局部沖突,那么損失的成本除了各種人員和武器消耗外,由于戰爭導致的經濟衰退和人民生活水平的下降也是重要的成本。由于沖突中的成本一般是無法完全精確衡量的,我們假設中日一旦發生沖突,為利益爭奪而付出的成本為L。并且,我們假定成本是小于爭議利益B的,否則的話,雙方的爭奪就是完全非理性的行為了。
三、 博弈關系分析
由于中日之間的戰略博弈沒有預期可以結束的時間,因此可以視為廣義無限次重復博弈。下面本文將運用無限次鷹鴿博弈模型來分析中日之間的戰略博弈。
(一)收益矩陣
在進行無限次重復分析之前,我們首先需要確定中日雙方在一次博弈中的收益矩陣。通過上一章,我們可以設中日爭奪的利益為B,發生爭奪時付出的代價為L,中日之間發生沖突后,任何一方獲勝的概率為Pi。如果雙方均采用鷹派戰略,則獲勝一方獲得B-L的收益,而失敗一方獲得-L的收益,采用(鷹,鷹)策略組合的中方期望收益為:
(1)
(2)
當一方采用鷹派戰略,一方采用鴿派戰略時,采用鷹派戰略的一方沒有為爭奪利益遭受損失,同時獲得的利益。而采用鴿派戰略的一方沒有任何收益,也沒有任何損失,收益為0。中日雙方一次博弈的收益矩陣見表3。

表2 中日雙方鷹鴿博弈收益矩陣表
(二)博弈分析
通過對模型的分析我們知道,在一次的鷹鴿博弈模型中,(鷹,鷹)組合是中日雙方唯一的純策略納什均衡,但是并不是雙方收益最高的策略組合,顯然采取(鴿,鴿)策略雙方能獲得更大的收益。我們知道(鴿、鴿)這種雙贏的戰略組合在一次博弈中是無法實現的,那么在無限次重復博弈中,有沒有實現(鴿、鴿)戰略組合的可能呢。本文認為是可能實現的,當雙方采取鴿派策略的無限次重復收益大于采用鷹派策略的收益時,雙方必然會主動維持(鴿,鴿)的策略組合。下面我們就將分析這種可能性及其政策含義。
當雙方均采取鴿派策略時,每個國家無窮次重復博弈情況下收益的現值為:
(3)

1. “冷酷觸發策略”

(4)
在“冷酷觸發策略”下,雙方維持和平戰略的條件是采取和平戰略的收益大于采取攻擊型戰略的收益,即:

(5)
2.“胡蘿卜加大棒策略”
胡蘿卜加大棒策略與冷酷觸發策略的報復機制是不同的,胡蘿卜加大棒策略中,報復行為在緊接著背離和平策略發生的那個階段一次性完成。如果在前T-1期雙方均采取和平戰略,那么博弈雙方在第T期,仍然采取和平戰略;但是一旦發現對手在T期采取背離戰略,則雙方會在T+1期均采取不合作的攻擊型戰略,但是到了T+2期,雙方又回到合作的戰略上來。
(6)
因此如果在“胡蘿卜加大棒策略”下博弈雙方能夠維持和平戰略必須的條件同上,即一直采取鴿派策略的收益大于采取鷹派策略的收益,用公式表示為:

(7)
(三) 結果分析

四、 結論及建議
研究表明獲勝概率、博弈機制、折現因子、爭奪利益和博弈損失都是影響博弈戰略的關鍵因素,綜上得出以下結論:
(一)發展自身實力是保障正當權益的物質基礎
我們的研究發現當對方在利益爭奪中獲勝的概率P越大,則雙方實現(鴿,鴿)合作博弈的可能性就越高。而獲勝概率是由一國的政治、經濟、軍事實力決定的。因此為了更好地保障自身正當的權益不受損害,也為了更好地對違反和平策略的一方做出威懾,最重要的就是加強自身能力建設。習近平總書記在黨的十八屆一次全會接見中外記者時講到“打鐵還需自身硬”,本意是要求從嚴治黨,只有建立一個堅強的政黨才能更好地擔負起領導人民群眾實現共產主義的重任,這句話運用到國際關系中仍然具有重要意義。只有加強自身能力建設才能在國際交往中處于主動地位,更好地維護自身權益。改革開放總設計師鄧小平同志也說過“發展才是硬道理”、“發展是解決一切問題的關鍵”,深刻的揭示了發展自身實力的重要性。
(二)具備戰略眼光是維護地區安全的關鍵因素
研究表明折現因子δ越大,維持和平戰略的機制也就越穩定。折現因子是經濟學的概念,在利息理論中表示將未來收入折算成等價現值的比率。在博弈論中,折現表示的是收益的時間價值,也即未來的利益對于參與人的重要程度(張維迎,2004)[8]。折現因子δ∈[0,1],越大說明參與人的耐心越好,越看重未來長遠收益,反之耐心越差,也越短視。一個更耐心,更富于長遠戰略眼光的博弈方,折現因子也就越大。在中日兩國關系中,如果中日雙方從戰略眼光審視中日關系,重視雙方的長期交往和利益,那么中日之間維持和平戰略的可能性也就越高。中日老一輩政治家為維護中日關系的長遠和平做出過很多努力,世代友好,永不再戰,是老一輩政治家為兩國關系確定的基本準則。但是當前的日本領導人為了迎合日本右翼勢力的支持,而一再做出有損于中國人民感情、有損于地區和平的事情,導致中日關系緊張,這實質是違背了中日和平共處的基本原則,是缺乏長遠考慮、缺乏戰略考量的短視做法。我們希望日本領導人能從中日兩國的切身利益考慮,不要一再做出挑釁性的舉動,切實為維護地區穩定做出努力。
(三)求同存異是實現地區長治久安的基礎理念
研究表明雙方爭奪的利益B越大,則參與方違背和平戰略、選擇攻擊型戰略的可能性就越大。因此減少共同利益的爭奪,是維持和平戰略的有效途徑。而如何減少共同利益的爭奪呢?這就需要中日雙方一是遵守原有的國際秩序和國際格局,不要制造新的分歧和矛盾;二是對于現存的矛盾和分歧采取和平協商的辦法進行解決,本著相互諒解、平等互利的原則,堅持求同存異的外交方針,妥善處理雙方的矛盾和分歧。中日目前在歷史、領土等方面存在爭端,因此中日之間應尊重和照顧彼此的核心關切,不激化矛盾、不制造沖突。日本在2012年堅持所謂的“釣魚島國有化”的舉動,實質就是刻意制造矛盾和摩擦,如果日本真的是如日本領導人所宣稱的重視中日關系,那么就應該少做這種激化矛盾的事情,切切實實改正錯誤立場,重新回到友好協商的軌道上來。
(四)提高違約成本是維持和平共處的必要條件
研究表明爭奪中失敗一方的損失L越大,雙方維持和平戰略的幾率也就越大。因此為了維持和平機制的穩定性,必須增加違反和平策略的懲罰力度,讓違反和平策略的一方承擔更大的代價。運用在中日關系中就是,中國應該對日本購買釣魚島、參拜靖國神社等挑釁行為給予強有力的還擊。祈求和平是換不來和平的,只有有效地反擊才是維持和平的最好策略。因此,面對日本的挑釁行為,應該采取多種措施予以回擊,如減少中日之間的高層交往,向國際社會說明日本的挑釁做法,加強軍事震懾力,劃定防空識別區和實現釣魚島巡航的常態化等都是加大懲罰力度的做法。通過這一系列的行動,讓日本明白中國維護核心利益的決心和勇氣,明白違反和平策略是要付出代價的。當然關于加大違約成本的方式有很多種,應該選擇能盡量減少自身損失的方式和方法。在回擊對方的同時,降低對于自身的損害和沖擊。
(五)設置諒解機制是保持睦鄰友好的必然選擇
在我們的研究中發現,“胡蘿卜加大棒策略”比“冷酷觸發策略”更嚴厲,并且更具備可信的威脅,而懲罰越嚴厲,合作機制就越穩定。由于這種嚴厲的威脅,某些在“冷酷觸發策略”中無法維持的和平戰略在“胡蘿卜加大棒策略”下是能夠維持的。“胡蘿卜加大棒策略”增加了維持和平戰略的可能性。因此,在國家交往中設置諒解機制是有利于維持和平穩定策略的。另外一點,正如德國首相俾斯麥所言:“國家之間沒有永恒朋友,只有永恒的利益”,從國家利益的角度而言,設置諒解機制也是非常理智的做法。只要日本愿意正視歷史,真誠的向中國人民道歉,在領土邊界、歷史遺留等問題上做出正確的選擇,中國仍應該選擇與日本保持對話,那種老死不相往來的外交戰略既不現實也不科學。
總之,中日之間要想實現和平共處避免沖突必須堅持以上原則,即堅持以戰略眼光審視中日關系,堅持求同存異的原則解決雙方的分歧和矛盾,對于違背和平戰略的參與方設置懲罰機制,最后如果違背和平戰略的一方能醒悟,并從錯誤的道路或立場中走出來,另一方應該設置諒解機制,通過和平談判,友好協商等辦法,重新為實現地區和平而努力。
〔參考文獻〕
[1]Aumann R J, Maschler M, Stearns R E. Repeated Games with Incomplete Information [M]. MIT Press, 1995, 66-70.
[2]Pilisuk M, Potter P, Rapoport A, et al. War hawks and peace doves: alternate resolutions of experimental conflicts [J]. Journal of Conflict Resolution, 1965:491-508.
[3]謝識予. 經濟博弈論[M] .上海: 復旦大學出版社,2002,189-225
[4]Abreu D. External equilibria of oligopolistic super games [J]. Journal of Economic Theory, 1986, 39(1):191-225.
[5]田久川. 古代中日關系史[M].大連: 大連工學院出版社,1987,1-15
[6]封永平. 中日關系困境解讀[J]. 國際論壇, 2006(01):36-40.
[7]呂曉莉, 鐘準. 中日關系的歷史困境及出路思考[J]. 國際論壇, 2009(01):41-45.
[8]張維迎. 博弈論與信息經濟學[M] .上海:上海人民出版社,1996,213-228.
(責任編輯:周建瑜)
[中圖分類號]F224.32
[文獻標識碼]A
[文章編號]1008-5955(2016)01-0099-06
[作者簡介]卜振興(1986-),男,江蘇徐州人,南開大學博士研究生。
[基金項目]國家社科一般項目”明代中國朝鮮日本三國關系與東亞國際秩序研究”(12BZS037);教育部委托項目“日本核泄露對中國經濟的影響及對策研究”(12JF016)。
[收稿日期]2016-01-05