陳瑞華

摘要:博弈論是一個古老而有趣的內容,納什均衡是博弈論中非常著名的一個理論。本文首先介紹了納什均衡相關的理論,其次利用該理論探討了不同博弈模型下各個國家貿易政策的選擇,并由此解釋了在世界貿易中各個國家實施貿易保護政策的原因。
關鍵詞:納什均衡 貿易自由 貿易保護
一、博弈論與納什均衡理論簡介
博弈論亦稱對策論,隸屬于應用數學的一個分支,是主要基于數學模型研究在不同條件下的最優決策問題的理論。近代博弈論理論主要由Zermelor、Borel和vonNeumann提出。1928年von Neumann證明了博弈論理論的基本原理,進而宣告了博弈論的誕生。1950-1951年,John ForbesNash,Jr證明了均衡點的存在,為博弈論的一般化奠定了基礎,隨后又給出了現在廣為流傳的納什均衡的概念,將博弈論的研究推向高潮。
博弈論中的納什均衡指的是每個博弈者的平衡策略都是為了達到自己期望收益的最大值的策略組合。其中一個經典的納什均衡案例是“囚徒困境”問題,該案例大意為,有兩個犯罪嫌疑人作案被警察逮捕,分別被帶到不同的審訊室去審訊,對于每個犯罪嫌疑人,警方給出的刑罰政策是:如果兩個犯罪嫌疑人都坦白,那么證據確鑿,每個人都被判刑8年;如果兩個人都抵賴,因證據不足,每個犯罪嫌疑人按妨礙公務罪各判刑1年:如果其中一個犯罪嫌疑人抵賴而另外一個犯罪嫌疑人坦白的話,那么抵賴的將被判刑10年,而坦白的將被釋放。假設兩個犯罪嫌疑人分別為A和B,那么根據他們各自的策略不同,他們的收益矩陣如表1.1所示,其中(x,y)代表A和B分別獲刑x年和y年。
在“囚徒困境”的案例中,A和B最優的策略就是兩個人都抵賴,這種情況下兩個人判刑年數之和是最少的。但由于兩個人處于隔離狀態,因此兩個人在做決策時無法進行討論,而每個人都會選擇對于自己最優的策略。對A來說如果他要選擇對于自己最優的策略,那么在做決定之前就要考慮B的選擇:在B選擇坦白的情況下,若A坦白將被判刑8年,若A抵賴將被判刑10年;在B選擇抵賴的情況下,若A坦白則可獲釋,若A抵賴則獲刑1年。綜合來看,無論B怎么選擇,對于A最優的策略是坦白,同樣地無論A如何選擇,對于B最優的策略也是坦白,因此A和B會選擇表1.1收益矩陣中左上角的策略組合,即A和B都會選擇坦白被判刑8年,但這種組合對于整體來說不是最優的選擇。
二、博弈論在貿易政策選擇中的應用
在世界貿易發展歷史中,貿易保護和貿易自由政策相伴而生。盡管現代經濟學中有共識,貿易自由會提高參與國的福利水平,但由于各種原因,貿易保護政策還是時有發生的,尤其在經濟危機發生時。本小節主要通過構建博弈模型,對貿易保護和貿易自由政策進行分析,探討貿易保護政策盛行的原因。
首先給出博弈模型的假設條件。為了簡化模型和方便分析,假定如下,1)假設僅有兩個國家c和D參與博弈;2)每個國家都從自身利益最大化的角度考慮;3)兩個國家只有兩種策略:貿易保護和貿易自由;4)兩個國家的溝通自由,無信息約束;5)兩個國家的任何策略的滿意度可以用數值來衡量。
假設c國與D國同一時間選擇貿易政策,此時c國和D國的博弈屬于完全靜態博弈模型。他們的不同策略情況下的收益矩陣由表2.1給出。
因為是進行了多次博弈,所以在博弈的過程中會存在合作的可能,但是由于博弈次數是有限的,最終發現最優的博弈策略每次都是(貿易保護,貿易保護)的組合,即每次都會陷入“囚徒困境”。其實這在博弈論中也有相應的理論,即有限次博弈唯一的均衡策略是每次博弈都沿用原博弈均衡的策略。
本文研究的貿易政策選擇模型都假設進行有限次博弈,那么不管是博弈一次,還是博弈有限多次,最終兩個國家都會陷入(貿易保護,貿易保護)的“囚徒困境”,即該貿易策略從每個國家來看對于本國都是最優策略,但從兩個國家的整體效益來看卻不是最優的。