孫夢男 魏德來 吳迪
[摘 要]近年來,隨著中美經濟依賴程度的不斷加深,兩國間的貿易摩擦也日趨激烈和頻繁。特朗普上臺后,從揚言要退出TPP、WTO,到針對所謂的“中國不公平貿易行為”展開“301”調查,宣布中國為“匯率操縱國”,尤其是近期對中國出口鋼鐵和鋁產品加征關稅等激進舉措,致使原本就一路磕磕絆絆的中美貿易關系再度緊張。在此背景下,以往“小打小鬧”的中美貿易摩擦是否會演變成“大規模”的貿易戰?在貿易雙方合作與懲罰的博弈中,中方應該采用怎樣的應對戰略才能贏得主動、實現個人利益的最大化?文章基于中美兩國間經貿關系的現狀,構建重復博弈模型,分別采用生活中普遍存在的“針鋒相對”和“永不原諒”(觸發戰略)戰略對中美貿易中的博弈行為進行分析。
[關鍵詞]重復博弈模型;中美貿易戰;經貿關系
[DOI]10.13939/j.cnki.zgsc.2018.30.014
1 模型假設和概念界定
重復博弈(repeated game)是指同樣結構的博弈重復多次的動態博弈。例如,工作生活中,與相同的朋友、同事多次打交道。理論上它需滿足三個基本假設前提:一是階段博弈之間沒有物理上的聯系,即前一段博弈的結果不改變后一階段博弈的結構但通常這個特點難以在現實中得到充分滿足,例如,在中美貿易之間重復博弈的過程中,雙方內部結構以及相對地位在各個階段是變化的,在此本文放寬此條件。;二是參與人都能夠觀察到博弈過去發生的事(結果),并可以把今天的選擇建立在其他參與人行動歷史的基礎之上。由于行動歷史的多樣性,導致參與人當前的行動和歷史關聯的方式也多種多樣,每個人的戰略空間被極大擴展;三是參與人得到的最終報酬是各個階段博弈支付的貼現值之和。由于博弈重復多次,參與人不僅關心現階段的收益,還包括未來收益。
重復博弈之所以會導致合作,是因為它可以改變參與人的戰略空間。現實和理論均表明,“針鋒相對”(tit-for-tat)和“觸發戰略”(trigger strategy)兩種戰略是人們使用最為普遍的。前者是指參與人每一次行動都建立在對手前一次行動的基礎上。比如,在中美貿易博弈中,如果美方在今天貿然打破合作格局,那么中方明天就不與美方合作;如果美方明天又與我合作,那么中方后天就再度與美方合作。這就類似生活中常說的“以牙還牙”。后者是指一開始我跟你合作,只要在此過程中你沒有破壞合作,我就會一直合作下去;但只要有一天你破壞合作,從此以后我就永遠不再與你合作。比如,美方在中美貿易往來中一旦做出破壞行為(不合作),中方從此就拒絕任何合作,導致整個合作徹底瓦解。
在前述中提到,重復博弈之所以會產生合作,是因為參與人不僅關心眼前利益,而且關心長遠利益。為計算長遠利益,需要借助下圖描述一般性的囚徒困境博弈。
囚徒困境博弈
如圖所示,在一次性博弈中,如果甲、乙二人合作,每人都得到T;如果兩人都不合作,每人都得到P;如果一個合作、另一個不合作,合作的人得到S,不合作的人得到R。顯然,我們有R>T>P>S。同時,雙方總價值大于一方合作、另一方不合作的總價值以及雙方都不合作的總價值,即(T+T)>(S+R),(T+T)>(P+P)。
現假設甲、乙兩人進行無限次重復囚徒困境博弈。假如兩個人從來不合作,每人每期得到的報酬都為P。反之,如果雙方從開始一直合作下去,每人每期的收入流將是T。
設想雙方之前一直合作,但是到某個時點t,繼續維持合作到永遠對每一方的價值是多少?為了計算這一價值,需要引入個人的貼現因子,也就是明天的1元錢值今天多少錢的問題。我們將用θ<1表示貼現因子,它反映的是參與人的耐心程度,θ越大意味著一個人越重視未來,這樣,維持長期合作關系的貼現值是:
從數學上我們知道,這個價值等于T/(1-θ)。顯然,θ在這里起著關鍵作用。
2 模型分析
2.1 針鋒相對
這個戰略構成一個納什均衡,但不是一個精練納什均衡。在中美貿易博弈中,如果雙方都堅持“針鋒相對”戰略,一種理想情況是,沒有人挑起不合作,雙方每一期的收益都是T,貼現加總后總收益為T/1-θ。更可能的情況是,在第t階段美方挑起不合作,那么中方貫徹這個戰略意味著應該在t+1階段選擇不與美方合作,以對其不合作行為進行懲罰。雙方從t+1期開始的行為變為:
美方的行為:合作;不合作;合作;不合作;……
中方的行為:不合作;合作;不合作;合作;……
比較式(2)和式(3),后者收入流總和明顯大于前者。也就是說,從理論上看,給定美方在某個階段挑起不合作,只要中方相信對方實行的是針鋒相對戰略,那么中方就沒有積極性去實施懲罰,而是選擇原諒對方繼續合作。如果反觀中方處理對美一般性外交事務的過往也的確證實了這一做法。一般來看,在不違反原則、不觸及底線的前提下,中方完全可以按部就班地與美國“講道理”“打太極”,以溫和的姿態、最小的成本化解矛盾,但問題的關鍵在于,中方一味地扮演“老好人”、原諒對方,美方很可能“變本加厲”,認為,既然自己“損人利己”可以被原諒,那么為什么不經常性地挑起不合作呢?所以,在中美貿易雙方的實際博弈中,無底線地“寬容”很可能會演變成“縱容”,最終帶來中方單方面的損失。
2.2 觸發戰略
觸發戰略的主要思想是一旦對方犯錯,你將永遠不原諒。
容易證明,如果θ足夠大,觸發戰略將不僅構成一個納什均衡,而且是一個精練納什均衡。具體來說,假定中美雙方選擇觸發戰略,即在良好的合作中一旦發現美方不合作,中方就永遠不與其合作。設想雙方一直合作,中方t期能夠得到T,之后每期得到的也是T,那么收入流的貼現值是T/1-θ;但此時如果美方選擇破壞合作,本階段使中方吃虧一次,得到R,從下個階段開始,中方永遠不再與美方合作,此時美方能得到的最好結果也是永遠不再合作,那么之后美方每階段就都只能得到P,總的收入流的貼現值就是R+P[θ/(1-θ)]。如果θ值滿足T/1-θ≥R+P[θ/(1-θ)],美方的最佳選擇就是一直保持合作,而不是中途挑起不合作。也就是說,只要θ≥(R-T)/(R-P),每個人都選擇觸發戰略(不先發起不合作)就是最好的。上述條件可以重新表述為:θ(T-P)/(1-θ)≥R-T,其中不等式右邊R-T代表的是某次選擇不合作帶來的當期收入的增加值,不等式左邊θ(T-P)/(1-θ)代表這一不合作行為導致的未來損失的貼現值(其中T-P是每期的損失)。因此,參與人合作與否就取決于長遠收益是否能抵得過眼前收益的誘惑,以及耐心程度的大小。具體來說,給定耐心程度(對未來利益的重視程度),一次不合作的誘惑越大,也就是不合作帶來的眼前收益相對于合作帶來的長遠收益越大,那么參與人選擇不合作的可能性就越大。另外,給定不合作帶來的誘惑和合作能夠帶來的長期利益,未來越重要,合作的可能性就越大。這說明,中美雙方合作與否主要取決于長遠收益是否能抵得過眼前收益的誘惑,以及耐心程度的大小。
3 結 論
自中美建交以來,針對兩國接連不斷、愈演愈烈的貿易摩擦,中國政府一直都在不同場合宣稱中美間貿易摩擦只是個案,互惠共贏仍是中美貿易的“主基調”。近年來隨著中美貿易的快速發展尤其是中國對美國貿易順差的不斷攀升,美國一些行業以及政府官員要求對中國產品采取貿易制裁措施的呼聲日高,國際金融危機的爆發更是助長了美國國內貿易保護主義的熱潮,中方在歷史的貿易摩擦中始終“顧全大局”、保持“大國風范”的克制態度,然而,此次針對美國加增中國出口鋼鋁關稅一事,是典型的單邊主義和貿易保護主義做法,嚴重違反了世貿組織的基本原則和精神,中方堅決反對,正式做出了反擊,已于北京時間2018年4月2日起實施對原產于美國7類128項進口商品加征關稅的決定,中美貿易戰已經擦出火花。
本文的研究結論可以很好地解釋中方對美鋼鋁關稅報復性行為的合理性。此舉措一方面向美方展示了中方誓不妥協的立場,“中國不惹事,也不怕事”,在面對不公平待遇時,我們“絕不坐視”,有信心、有能力應對美方任何貿易保護主義措施;在采取“針鋒相對”的貿易戰略時,短時間的“妥協”,不代表無限期的“縱容”。另一方面,特朗普政府不遺余力單方面破壞中美間良好的貿易格局,表面上看是損人利己、劍走偏鋒的單邊主義做法,實則是鼠目寸光、傷人害己的行為;即使中方采取更為激烈的“永不原諒”戰略,恐怕只會“傷敵一千、自損八百”。因此,在中美雙方的貿易對弈中,中國政府不僅需要彰顯凝神定氣的韜略與智慧,更需要運籌剛柔相濟的才技與術策,力爭讓特朗普“回歸理性”“著眼長遠”,不要在錯誤的道路上越走越遠。
參考文獻:
[1]趙偉.特朗普欲掀中美貿易戰的邏輯[J].浙江經濟,2017(3):12.
[2]鄺艷湘.經濟相互依賴與中美貿易摩擦:基于多階段博弈模型的研究[J].國際貿易問題,2010(11):36-43.
[3]張維迎.博弈與社會[M].北京:北京大學出版社,2013.