盧周來
二0一六年十二月十三日,諾貝爾經濟學獎得主、著名經濟學家、戰略學家、美國馬里蘭大學教授托馬斯·謝林(Thomas Schelling)辭世,享年九十五歲。我寫作此文時距離謝林辭世已經月余。這一個月中,我留意到,與國際學術界對謝林的高度評價和連篇累牘的文字紀念不同的是,中文世界幾乎沒有什么反應。包括問及幾位圈內人,竟然有人不太清楚這件事;而謝林曾經到過中國講學這件事,就是從事博弈論研究的國內學者,都一無所知。于是,我覺得我的確有責任寫點文字,以圖讓更多人了解這位學界泰斗級人物,并紀念這位受我和朋友之托、為中美學術交流付出過巨大努力的可敬老人。
打開馬里蘭大學公共政策學院網頁,在其最顯著位置,至今仍然是“紀念謝林”專欄,專欄開頭是這樣一句話:“罕有人能同時對真實世界和公共政策研究領域產生如此深遠的影響,而謝林卻做到了!”這句話,我認為是對謝林最到位的評價。
由于從事防務經濟學研究的原因,我最早了解托馬斯·謝林,是其在服務于美國國防部、參謀長聯席會議和蘭德公司時提出的戰略威懾理論。所謂戰略威懾,是指沖突中一方采取有效方式影響對方決策,并期望借此影響對方對自身行為預期判斷的行為模式。謝林認為,沖突主體之間戰略威懾運用的微妙性,類似于著名的“勇敢者游戲”:在一條長長的、筆直的大道上,兩輛汽車分別從兩頭出發,以飛快的速度面對面疾馳而來;此時,每輛車的車主一方面都希望不會發生兩車直接碰撞以致車毀人亡的悲劇,但另一方面又都希望對方能首先避讓,以使自己獲得“勇敢者”名聲。然而,有趣的是,在這種“勇敢者游戲”中,車毀人亡式悲劇發生的概率的確很低。而獲勝的一方,從來都是有辦法讓對方明白“在任何情況下我不可能選擇避讓”的那一方。謝林分析道,一旦有一方通過某種行為率先準確地傳遞了“任何情況下都不避讓”的信息,另一方最后時刻總會選擇退讓。這是因為,即使成為游戲中的“膽小鬼”,也畢竟略勝于車毀人亡。由此,謝林認為,當實力相當的雙方發生利益沖突時,既要保證己方利益,同時又不想將沖突進一步發展為兩敗俱傷的戰爭時,雙方一般都會運用戰略威懾行為,以迫使對方能夠讓步。而沖突雙方誰能通過戰略威懾獲得更大的相對利益,則取決于給對方的戰略威懾的“可置信程度”。一旦對方認為你的威懾是可信的,即在任何情況下你都不會選擇退卻,那么為了避免更壞的結果出現,對方會選擇讓步。
由于謝林長期服務于美國軍方,因而,他提出的戰略威懾運用理論,一直深深地影響著美國的外交政策與軍事斗爭領域。在冷戰時期,美國與蘇聯長期處于沖突的狀態,但卻從來沒有釀成戰爭,但并沒有妨礙美國國家利益的擴張,實際上就是運用戰略威懾的結果。尤其在處理著名的古巴導彈危機過程中,謝林作為危機處理團隊成員,直接參與了決策咨詢。他和成員們提出,要公開讓全世界都知道,要么蘇聯人撤走部署在古巴的導彈,要么美國將不惜任何代價,包括升級為核戰爭的代價,也要對這些導彈進行空中打擊,舍此之外美國沒有其他任何選擇。為了使這一“承諾”變得可置信,謝林等人建議,肯尼迪政府必須通過公共廣播電視系統和公開聲明,把這一“承諾”周知全體美國人、蘇聯政府以及國際社會。這種公開的做法就是告知對方:“我已經將自己置于一個不可能再有其他選擇的地位,否則這屆政府在美國和國際社會將失去所有信用。接下來就看你的啦!”于是,為了避免沖突演變為核戰爭,蘇聯政府最后時刻選擇了退卻。這是“可置信威懾”戰略應用的一個真實范例。
謝林提出的讓對手讓步的策略,后來又被稱為“邊緣政策”:沖突中的雙方盡管沒有真正同歸于盡,但卻是以一方將自己擺在“不惜同歸于盡”的位置上才化解困境的;在兩個國家之間,盡管沒有發生全面戰爭,但卻是以處于戰爭邊緣甚至有限戰爭來化解戰爭的。謝林提出的這一政策主張,后來被大國廣泛用于外交、國家安全、核戰略以及軍控和裁軍等領域,在真實世界中發揮著巨大影響力。在某種意義上,謝林作為學者,與政治家一起,塑造了冷戰前后的世界格局。
與政策層面的影響一樣,謝林在理論研究層面的貢獻同樣深遠。在其經典著作《沖突的戰略》一書中,謝林將其戰略威懾理論系統化,首次定義并闡明了互動決策、可置信承諾、戰略移動等概念,對討價還價和沖突管理理論做了非常細致的分析,為后來經濟學領域發展起的合作博弈理論奠定了基礎。特別是其“不可置信的威脅”啟發了德國經濟學家舍爾頓(Reinhard Selten),后者提出的“子博弈精練均衡”概念就脫胎于此。僅在這一點上,謝林至少可與納什比肩。后者的貢獻主要是在“非合作博弈”領域。也正因此,二00五年,謝林被授予諾貝爾經濟學獎,原因是:“通過博弈論分析改進了我們對沖突和合作的理解?!?/p>
但如果僅僅把謝林的貢獻定位為發展起博弈論的一個分支,還遠遠不夠。一九八0年,在為《沖突的戰略》一書再版作序時,謝林明確寫道:我之所以寫作此書,主要目的是為了建立起一個跨學科領域,該領域可稱為“沖突理論”。足見謝林本人的理論興趣遠超乎博弈理論,而是把目光投向一個更為廣闊的領域。
我們都知道,自亞當·斯密以來,西方主流經濟學都是關于交易的經濟學。從最基本的層面看,交易經濟學所告訴我們的,還是斯密在兩百四十多年前就已經給出過的理論:在交易過程中,追求自我利益最大化的經濟人,通過一只“看不見的手”的引導,不僅增進了自己的福利,而且增進了公共福利。“只要是自愿的交易,肯定能實現由自利到雙贏!”人們常將這一理論稱為“斯密信條”。主流的交易經濟學也因為論證“斯密信條”而給我們勾畫出一個沒有沖突且還能不斷進步的市場社會圖景,即“斯密世界”。
謝林的貢獻在于,他注意到現實世界中沖突無處不在。與“斯密世界”相反,在沖突的世界中,自利行為并不能增進集體福利。相反,一方在沖突中多得到一份福利,意味著另一方同等份額的喪失,這就是“零和博弈”。而更極端的情況,自利的選擇最終將導致“雙輸”,最典型的案例就是“囚徒困境”。當然,謝林更注意到一種情況:沖突雙方的博弈其實往往帶有非零和的性質,此時,雙方可以通過討價還價達成協議,無論產生哪種協議,都比沒有達成協議要好。因此,管理與處置沖突的戰略或藝術就非常重要。而謝林試圖通過自己和他人的努力建立起“沖突理論”,其意義也在于避免現實世界利益沖突最終釀成“雙輸”局面。
謝林本人當然未能完成建立起完整的“沖突理論”這一宏愿。在八十年代他也已意識到,建立“沖突理論”僅靠他本人不夠。所以,在《沖突的戰略》再版序中他寫道:“盡管我致力研究的領域可能不會突飛猛進,但是我相信將會有更多有志之士投入到這一領域的完善和發展之中。”而現實也正如他所預料的一樣。八十年代初期,著名的數理與計量經濟學家英特里蓋特(M. D. Intriligator,《經濟學手冊》總主編)正式提出應當建立“沖突經濟理論”。此說得到經濟學家赫什利弗(J. Hirshleifer)響應。后者在八十年代末與九十年代初首次將已有的成果進行綜合,提出“沖突經濟學”概念與體系。他認為,“沖突經濟學”應該與“交易經濟學”一起,構成微觀經濟學的兩個平行分支。前者研究基于雙方均勢基礎之上的交易與互利行為,而后者研究基于單邊優勢基礎之上的斗爭與互害行為。兩個分支都具備相同的標準的經濟理論要素,但也存在諸多不同。首先,預設的前提不同。傳統的交易經濟學關于理性經濟人、完全信息以及市場出清假設,在沖突經濟學中相應地變成了“機會人”假設、不完全信息假設。所謂“機會人”假設,赫什利弗又稱為“馬基亞維里定理”,是指沖突背景下局中人不會放過任何有利可圖的剝削他人的機會。其次,研究的工具不同,主流的交易經濟學使用的是價格理論。而沖突經濟學主要使用博弈理論(Game Theorem)。再次,研究的重點不同。主流交易經濟學是研究生產的技術。即在生產或消費過程中如何合理配置資源;而沖突經濟學研究的是斗爭的技術,即研究如何將資源配置于斗爭性努力與生產性努力之間,以贏得競爭中的優勢。最后,研究的結論不同。主流交易經濟學的結果是“瓦爾拉均衡”,即總能找到一組價格使交易雙方都滿意。沖突經濟學的結果則是“納什均衡”:“在給定條件下,你不動我也不動,你動我也動。”
當然,時至今日,“沖突的理論”或“沖突的經濟學”也未能與交易理論一樣成熟,而且與謝林建立起跨學科性質的“沖突的理論”這一初衷也不完全合拍。但無論如何,它為我們開拓經濟學的新疆域指明了方向。而這一新疆域的首先發現者和開拓者,就是謝林。因此,把謝林的理論貢獻僅限于博弈論,的確有些委屈了這位有著更宏偉抱負的思想者。
理解謝林的學術觀點,“聚點”(Focus Point)這個概念極其重要。
用非學術語言講,“聚點”就是利益沖突的各方認為各方可能達成妥協的利益分割點的交集?;蛘哒f,在這一點上,一方認為另一方會接受這一解決辦法,而另一方也的確會接受。
但如何才能達成“聚點”是個大難題。仍然以“勇敢者游戲”為例。這個游戲之所以能玩下去,一個前提仍然是理性的雙方都知道必須避免迎面撞上導致車毀人亡。也就是說,“不直接相撞”是這一游戲的“聚點”。兩個沖突中的國家也一樣:“不戰”是雙方最后默認的交集即“聚點”。只有在不撞與不戰的情況下,才談得上謀求利益最大化。但矛盾的是,為了謀求利益最大化,又必須使用“不惜一撞”與“不惜一戰”的邊緣政策。在這里,“邊緣政策”是達成“聚點”的手段。但“邊緣政策”的控制本身就成為突出問題。謝林自己承認,邊緣政策有時非常難以控制,因為只要稍微過度,就會越過邊緣界線,就會導致“同歸于盡”的實質性行動?!斑吘壵摺敝噪y以控制,謝林提出的理由又有兩點:首先是“錯誤的感知”。即雙方都可能誤會對方真正的想法,都認為對方一定會避讓,結果車毀人亡。其次是理性未必可靠。“勇敢者游戲”假設的一個前提是,車手都是理性的,認為生存比榮譽更為重要。但在現實中,并非所有人都有這種理性,恰有人就把榮譽看得比生命還重要,其中也包括恐怖主義與宗教激進力量。
為了避免這種局面出現,找到雙方能接受的解決方案的交集即“聚點”,謝林提出了兩種途徑:默式談判和顯式談判。前者依賴于沖突各方之間事前建立起的“默契”,包括共享經驗、文化與認識。在國際關系中,為了避免國家之間利益沖突轉化為戰爭,必須建立起國際法體系。而國際法體系實際上是各方共同遵守的一種規則,也是共享的一種安排。在人際關系中,為了避免利益沖突造成“囚徒困境”式“雙輸”結局,道德與信任非常重要。而道德與信任也是一種“默契”,是一種“習慣法”。顯式談判的方式則有兩種:調解(Mediation)和溝通(Communication)。謝林認為,如果參與人可以相互溝通,那么他們就可以當面進行討價還價,告訴彼此自己將采取什么行動,行動的邊界在何處。并且通過“分級協調”,相互妥協至雙方能夠接受的解決方案。如果參與人之間無法溝通,則可以由第三方出面進行調解。這個第三方,在國際關系中,可以是聯合國,也可以是能夠為沖突各方接受的中間調停國。在有利益沖突的私人之間,這個第三方可以是中間組織,也可以是有威望的第三者,促成雙方達成互諒。
從謝林關于“聚點”及如何達成“聚點”的論述,我們可以看出其方法論與主流經濟學有著很大的不同。
在與謝林的交談中,我曾專門問及謝林對主流經濟學的看法。他似乎對此問題不感興趣,只是簡單地回答說:“我不是經濟學家,我是研究個體或集團行為的?!彼€建議我看看《沖突的戰略》之外他另外兩本著作,即分別出版于一九七四年的《微觀動機與宏觀行為》和一九八四年的《選擇與結果》。而如果讀完他推薦的兩本著作,我們就會發現,謝林幾乎沒研究過經濟問題,而是研究了我們常見的社會問題和國家行為,包括軍事戰略、軍備控制、能源和環境政策、氣候變化、恐怖主義、團體犯罪、外交援助和國際貿易、種族隔離和種族融合、軍事計劃、健康政策、煙草制品、毒品走私、婚姻關系、棒球比賽、排隊現象等等。
當然,在經濟學界,研究諸如犯罪、婚姻、吸毒、投票等個體行為,并不是謝林的“專利”,恰是長期占據經濟學主流地位的新古典經濟學家所熱衷的事。如加里·貝克爾等人。這種越界行為曾被稱為“經濟學帝國主義”。但同樣是研究行為,謝林與主流經濟學家在方法論上最大的區別在于:后者均基于經濟學中“理性經濟人”假說,即無論是企業(或政治集團)還是個體,其行為都是為了追求自我利益最大化,而且因其足夠理性,也知道如何實現自我利益最大化。而謝林不同,他是把自己的研究建立在人的現實社會性基礎之上,并明確反對前者的做法。因為在現實生活中,“大量存在標準理性模型并不起作用的地方”。
謝林區分了三個層面討論“理性”問題。
首先是個體理性。謝林寫道:“在經濟學中,個體的理性決策是一個被充分討論的領域?!比欢皞€體決策不可能完全根據理性的推測,假如個體指的是活生生的人的話”。原因是,“在單個個體內部,有可能存在一個神經、大腦和身體化學反應的系統,能夠交替產生不同的‘個體,哪一個也不是唯一的人或自我”。“兩個或者更多的自我交替支配同一個個體,它們有著不同的目標和品位,即使每個自我都積極地看待其他自我,也不得不解釋為戰略博弈,而不是聯合優化?!鼻遗c不同個體之間的沖突可以通過溝通與調停達成一個理性方案不同的是,在單一個體內部,“由于不同的自我不能同時到場,所以很難在不同的自我之間進行調?!?。因此,“我們不能指望,個體在對那些可以引起不同價值判斷的事務進行選擇時會表現出理性決策的應有品位來”。
正因為個體內部存在不同“自我”,所以,任何個體的人都有其“人與獸”的兩面。而為了解決這一矛盾,謝林明確提出了道德與自律的重要性。道德與自律作為外在的“非正式社會安排”,可以壓抑個體內部不同“自我”之間的沖突。也因此,正如著名的博弈論學者拉斯繆森(Eric Rasmusen)所評論的那樣,在謝林所研究的合作博弈中,“道德因素是現實的。因為人們經常是道德的,至少假裝如此。人們經常按照他們認為代表圣潔的行為準則去做。即使以金錢為代價。在討價還價的實驗中,即使參與人被賦予提出‘接受或放棄方案的權利,但他往往提出大家平分的方案。有可能這是因為他崇尚公平,或許是他害怕自己拿走大部分收入時,對手及社會投來的鄙夷的眼光”。也是從這個意義上講,在道德與自律框架約束下,“真小人”被迫在行動上不得不“偽裝成君子”,不敢放肆干壞事,甚至不得不跟著做一些好事。這本身是一件好事!
其次是集體理性。在主流經濟學那里,“阿羅不可能定理”已經揭示,即使個體是理性的,也將因為各自“偏好”的不同,而無法達到決策上的集體理性。對此,謝林認為,個體即使行為符合理性假設,尚且無法達到集體理性,何況個體本身就是矛盾體?所以,那些把企業和其他組織行為都視為“最大化”的觀點,在理論上都是靠不住的。如何解決集體“非理性”行為導致的沖突呢?謝林認為需要國家與立法,以“外在權威力量的介入建立起一個管理沖突的系統”。這實際上與“阿羅不可能定理”的現實含義是一致的。
第三個層面就是國際關系的“理性”。當然,國家是“集體”的更高形式。正如前面已經介紹的那樣,國家間行為更是不可捉摸,更談不上“理性”。為了達成“聚點”,謝林認為,國家間更需要溝通。他率先建議,在美國和蘇聯兩國首腦之間設立“熱線”以方便溝通,這一建議在一九六三年成為現實。謝林還提出,為方便調停,要維護聯合國這樣的機構和各方公認的國際法的權威。
總之,盡管當年在維護美國利益中,謝林提出過“戰爭邊緣政策”這一看似強硬派的主張,并且影響了冷戰格局,但總體上,在方法論層面,謝林是個“秩序主義”與“和平主義”者。與主流經濟學迷信個體自由決策不同,謝林更篤信道德與信任,更強調國家與法律,也更主張溝通與調停。正因如此,謝林曾經稱自己是“一個走上歧路的經濟學家”(an Errant Economist)。當然,也正如諾貝爾獎對他的評語所言:“謝林,這位自稱‘走上歧路的經濟學家,被證明是一位非常杰出的、具有開創性的探險者?!?/p>
聽聞謝林辭世的消息后,我花費了一些時間,從過往的記憶以及過往資料中,找回九年前我與他在湖南長沙交流的一些細節。
二00八年初,我與國防科技大學時任社科系主任曾立教授一起,策劃并邀請了謝林的長沙之行。曾立是一個有學術熱情同時又有行動能力的學者。我們一起致力于中國防務經濟學科的發展,我們都特別強調中國防務經濟學科必須能夠與國際一流學者對話。他最先提出了邀請謝林來中國訪學的想法。我非常支持但卻認為可能性不大。原因有三:其一,謝林當時已是八十多歲高齡。按中國民間說法,這個年齡的老人都不應該在外面過夜;其二,當時邀請國外諾貝爾獎得主來中國講學的論壇不少,但都是主辦方出面邀請,且有雄厚的資金支持,而我們以個人名義邀請,以微薄的課題費支撐,這非常困難;其三,謝林本人長期為美國軍方服務,即便我們不對他的身份敏感,他個人也未必愿意來中國。
未料,曾立很快把這種個人行為付諸行動。而謝林幾乎毫不猶豫就答應了。于是,在謝林到達長沙的當日,我也從北京匆忙趕過去,與這位我一向尊敬的大學者見面。
一開始我們的交流并不十分順暢。我們仍然只是出于學術的考慮,希望來到中國的謝林講講他為之做出了原創性貢獻的博弈論領域,講講非零和博弈,尤其講講防務經濟學或沖突經濟學。但出乎我們意料的是,在中國的幾場演講,他講的就一個主題,即核控制與軍備控制。而且,謝林還聲稱:近些年他一直在研究如何達成和平問題。甚至在回答聽眾詢問的一個最為學術性的問題“到底如何理解你提出的‘聚點概念”時,他避開了學術解釋,直接回答說:“國家關系中,‘聚點就是和平。”
行程中我們特地在他下榻的長沙五華酒店安排了一個小范圍討論。幾天來除了演講少有言談的這位高齡老人,竟然滔滔不絕地說了一個半小時。大概是擔心我有語言障礙,在這一個半小時中,他反復對我強調的就一個觀點:核武器的使用應該成為人類的一個禁忌;對有核國家核武器的有效控制極端重要;而相對于美國在核控制方面自身都做得非常不好,中國在核武器控制與使用原則方面為世界樹立了榜樣;未來全球核控制有賴于中國,而中國也有能力有責任在其中擔負更重要的角色。
在與謝林的交流中,我們還談到了推動兩國國防經濟學界的溝通與交流。謝林回國后,就一直積極促成此事。近些年,已有多位國內青年學者前往他所任教的馬里蘭大學公共政策學院訪學,他們如今在國內國防經濟學領域均已擔當大任,國際防務經濟學界開始有中國學者的聲音;而謝林的多位同事,包括曾擔任過美國國防部副部長的雅克·甘斯勒(Jacqes S. Gansler)教授,也曾多次以學者身份到訪中國,參與國防工業政策、武器裝備采辦、軍民融合等領域的學術交流活動,增進了美國有關人士對中國防務政策的理解。
在長沙與謝林告別之后,由于某些原因,我們之間再沒有過深入的交流。但這并不妨礙我此后一直在追尋謝林的學術足跡,試圖更深刻理解謝林思想對于現實世界尤其是中國的意義。中國正在外部倡導建立一個和平世界。中國領導人申言,中國正致力于“打造人類命運共同體”。但要實現世界和平,中國就需要反對國際范圍內廣泛存在于冷戰時代的“先發制人”、以武力相威脅的做法。因為表面上這可以使自己獲得“先動”優勢,并可以獲得一種“恐怖平衡下的冷和平”,但最終卻可能導致更為激進的擴張軍備競賽與更危險的極端行為。中國應該強調謝林提出過的主張,即無論存在多大的利益沖突,多進行溝通與交流,總勝于相互封閉與猜忌。
中國還在內部倡導建設一個和諧社會。在市場經濟利益分化背景下,不同人群的利益沖突從來是客觀存在的。謝林曾提出:“因為邊緣政策所創造的風險是難以控制的,所以強者不要輕易考驗弱者的忍耐程度?!币虼耍诔霈F利益沖突時,如果社會中占強勢的人群,因為自己擁有強大的資源,同時認為弱者總會逆來順受,就肆無忌憚,社會必然會走向動蕩與不穩定,必然會導致“民粹主義”。這提醒我們,政府必須主動充當好利益協調者角色,強者必須懂得適可而止,懂得在必要時讓步,中國社會才會真正走向和諧。