[摘 要] 博弈論正逐漸成為社會科學研究范式中的一個核心工具,被稱作“社會科學中的數學”。博弈論在軍隊政治工作管理中的運用必將為管理的科學化開辟新的研究視域。
[關鍵詞] 博弈論; 軍隊政治工作管理; 科學化
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 06 . 026
[中圖分類號]E22; F224.32 [文獻標識碼]A [文章編號]1673 - 0194(2011)06- 0047 - 02
一、博弈論:社會科學中的數學
博弈論(Game Theory)又稱為對策論,原本是運籌學的一個分支,在20世紀40年代才建立起來,是研究主體行為發生直接相互作用時的決策以及這種決策的均衡問題的理論,后來發展為研究多方的、對立的或非對立的策略選擇。博弈論在經濟學領域的應用日益紅火、非常活躍。1994年諾貝爾經濟學獎授給了3位博弈論專家:納什、澤爾騰和海薩尼,以表彰他們對非合作博弈研究的貢獻。1996年的諾貝爾經濟學獎授給了另一位博弈論專家維克瑞。
目前,博弈論正深入到經濟學、政治學、社會學、法學等領域,被各門社會科學研究所應用,逐漸成為社會科學研究范式中的一個核心工具,可以說博弈論是“社會科學中的數學”,或者說是關于社會的數學。博弈論不僅廣泛深遠地改變了經濟學家的思維方式,而且正在或必將改變所有社會科學家的思維方式。管理博弈論已經成為博弈論的一個分支,對其的研究正在深入地開展。
博弈論目前主要有兩個研究角度:一是從博弈參與人的行動先后順序研究,把博弈分為靜態博弈和動態博弈。所謂靜態博弈是指博弈時,博弈參與人同時選擇行動或雖非同時但后行動者并不知先行動者采取了什么具體行動。所謂動態博弈是指后行動的參與人能夠觀察到先行動者的選擇。二是從參與人信息相互了解程度,分為完全信息博弈和不完全信息博弈。每種博弈都存在博弈均衡問題。這樣就有4種博弈均衡。這就是:完全信息靜態博弈均衡——納什均衡;完全信息動態博弈均衡——子博弈精煉納什均衡;不完全信息靜態博弈均衡——貝葉斯納什均衡;不完全信息動態博弈均衡——精煉貝葉斯納什均衡。
二、博弈論與軍隊政治工作管理中的博弈
軍隊政治工作管理涉及的是部隊生活中每個人和集體的利益關系,在管理過程中應貫徹以人為本的理念,著眼于官兵的全面發展,尊重人、理解人,關注每一個人的利益,構建新型的官兵個人之間、個人與集體之間、集體與集體之間的相互制約和依存關系。而這是典型的博弈關系,也正是博弈論的研究對象。博弈論為軍隊政治工作管理的科學化提供了精巧的分析工具,為我們提供了完整的分析框架。
1. 博弈參與人。博弈參與人是指在博弈過程中獨立決策、獨立承擔結果的個人或組織。在政治工作管理中,主要是指部隊的政治機關或基層的各級組織以及政治工作者和政治工作管理對象個人。博弈參與人在博弈規則面前是平等的主體,都在有意識或無意識地遵循著博弈規則進行策略選擇。但是,這和傳統意義上的管理中的主體與客體不同,他們是相互依存、地位平等的決策主體。政治工作管理中的雙方從“根本”上就是平等的,是平等的思想、行為博弈。這也是我軍“官兵一致”優良傳統的要求。粗暴壓服的結果,只會造成表面上的暫時順從,背后可能隱藏著潛在的不安定因素。一些看上去管理得井井有條的基層單位會發生重大事故就是這個道理。
2. 收益。收益是指參加博弈的博弈各方從博弈中獲得的利益,它是博弈參與人追求的根本目標,也是他們行為和判斷的主要根據。馬克思早就深刻地指出:“人們奮斗所爭取的一切,都同他們的利益有關。”[1]利益作為客觀范疇,對博弈各方策略的選擇起著決定性的作用。利益可以是數量性的利潤、收入,也可以是加以量化的效用,如工作的進步、事業的成功、榮譽的獲得、精神需要的滿足等,又有短期利益與長遠利益、集體利益與個人利益、正當利益與不當利益之分。
能否協調好各種利益關系直接關系到軍隊政治工作管理效果的好壞。由于當代社會比傳統社會的利益沖突要復雜深刻得多,因而我們不能用傳統的態度、簡單的方式對待和處理利益沖突。在軍隊政治工作管理中,一定要依據當代社會發展變化了的官兵的利益關系,教育官兵把生存發展的整體利益與個人利益、全局利益與局部利益、長遠利益與近期利益結合起來,從人與人、人與集體之間的互動關系這樣的較高層面,把握管理的實質。
3. 博弈策略。博弈中博弈各方的決策內容稱為“策略”。博弈中的策略是對行為取舍的選擇。根據博弈的定義可以看出,給出博弈各方可以選擇的全部策略或策略選擇范圍(也稱作“策略空間”),是定義一個博弈時需要確定的最重要的方面之一。管理者與被管理者之間的策略是相互影響的,俗話說的“上有政策,下有對策”就是生動的寫照。
4. 博弈過程。博弈的過程也是博弈結構的重要方面。在博弈論中有許多典型的博弈例子,都是幾個博弈方一次性同時進行決策選擇的,但事實上社會經濟、政治法律活動中也有許多策略較量的博弈問題,是先后、反復或者重復的策略對抗。例如,在管理中,腐敗與反腐敗相互斗爭的過程、上下級的博弈過程,就完全可能是先后進行的而不是同時進行的。博弈過程的這種差異對博弈結果和博弈分析也有非常重大的影響,因此需要注意它們的區別,分類進行研究。
5. 博弈均衡。軍隊政治工作管理過程中的均衡狀態,是指管理者與被管理者雙方經過博弈之后所達到的最優策略的組合。在管理過程中,管理者的思想和行為與被管理者的思想和行為不斷做出邊際調整,以至最后達到誰也不想再改變現狀的均衡。比如“南京路上好八連”,官兵換了一茬又一茬,該連隊能始終保持一種優秀的“均衡”狀態。
上述諸要素構成一個完整博弈的有機整體。在構筑軍隊政治工作管理的博弈模型時,要對以上諸要素加以綜合考慮。
三、博弈論為軍隊政治工作管理開辟理論研究的新視域
運用博弈論研究軍隊政治工作管理,從某種意義上說,就是將管理研究置于科學和理性的基礎上,尋求統一的理論解釋。博弈論為軍隊政治工作管理至少開辟了以下一些理論研究的新視域。
1. 研究軍隊政治工作管理過程中的機制設計問題。譬如,統一思想是管理過程中的一個重要任務和目的,但是用什么方式去實施,就是一個機制設計問題,同時也是一種特殊的不完全信息博弈。統一思想的工作通常是由上級或一級組織委托某個下級代理人或組織來實施。然而要達到目的,必須解決兩個約束問題:一是參與約束,即代理人真正能夠接受的前提,是執行這個任務所得到的效用不少于他不接受這個任務所得到的效用;二是激勵相容約束,即代理人能否采取委托人所希望采取的行動(教育內容、步驟等),取決于他采取這些行動時所得到的效用不小于采取其他行動所得到的效用。顯然,研究管理過程中的機制設計問題,有助于加強管理的有效性。
2. 研究各項規章制度安排是否合理的問題。管理工作涉及的是軍隊中每個人和群體的利益以及權利的合理分配等,不同的規章制度會激發人們不同的策略選擇,進而形成不同的納什均衡。合理的制度抑制機會主義行為,不合理的制度則會誘發機會主義行為。所以,無論內在制度的生成抑或是外在制度的創設,都必須以尊重官兵個人的利益為前提。忽視了這一點,就很容易導致囚徒困境類的結局。如果面對問題僅從思想態度等方面尋找原因,恐有陷入唯心主義誤區的可能。
人們常提到的“上有政策,下有對策”,其實就是對管理者與被管理者之間動態博弈的一種描述。面對上邊的政策,下邊尋求對策是正常的、必然的。從博弈論的角度講,上邊的政策制定必須在考慮到下邊可能會有的對策的基礎上進行,否則,政策就不會是科學的、合理的。
3. 研究軍隊政治工作管理過程中的重復博弈問題。政工干部都有過反復做某個被教育者思想工作的經歷,從博弈論角度研究這種“反復”,實際上就是研究重復博弈問題。不過,雖然人們對反復教育已經司空見慣了,但對此的研究卻很少。研究這種重復博弈,無疑能夠加強政治工作管理的有效性,深化政治工作管理理論的研究。
從博弈論的角度講,當博弈的次數有限時,博益均衡通常會被打破。比如一個一直積極要求進步的戰士,在進步無望而又面臨退伍時,工作面貌可能會與原來判若兩人。這就是為什么老兵復員階段事故多發、人員難以管理的原因。一些人在快調離原單位或快退休時的拙劣表現,也屬此列(包括所謂的“59歲現象”)。從博弈論角度對這些現象加以認真研究,無疑能夠及時分析預測管理中潛在的問題,為科學決策提供幫助。
4. 研究“信息”在政治工作管理中的作用。博弈論非常強調“信息”在決策中的作用。老一輩革命家陳云同志有句名言:“要以90%的時間搞調查,以10%的時間作決策,這樣的決策才比較符合實際”[2]。從博弈論角度講,調查研究就是獲取足夠的信息,以便做出科學決策。沒有關于博弈進程的完全信息,意味著決策和行為必然有一定的盲目性,只能依靠對博弈進程的某種“判斷”、某種概率或期望進行決策。由此也能體會到我黨一貫重視“調查研究”的科學性。
5. 研究分析軍隊政治工作管理問題產生的深層次原因。比如,“政治工作管理中,只對上負責,不對下負責,重過程,不重效益的傾向還比較嚴重。……這是政治工作管理中危害最大的弊端。”[3]實際上,博弈論中許多成熟的模型,為分析此類問題產生的深層次原因提供了非常精巧的工具。
“只對上負責,不對下負責”,從博弈論的角度講,是因為“對上負責”的收益大于“對下負責”的收益。由此可以反省一下我們在干部管理中存在的一些深層次問題。管理博弈論中對此類問題有深入的討論,已經構筑了委托—代理模型,完全可以引入到軍隊政治工作管理的博弈分析中。而“重過程,不重效益”是博弈論中“搭便車”模型討論的典型行為。管理者走過場,被管理者也會“搭便車”,如歷次教育過程中,都有看似認真自我批評、實為巧妙“蒙混過關”的走過場行為。這就是所謂的“上梁不正下梁歪”、“上有所好下必甚焉”。
6. 研究管理中如何能實現合作博弈。非合作博弈條件下的經典博弈模型,無論囚徒困境、公共地悲劇還是狩獵博弈或鷹鴿博弈,都揭示了尋求利益最大化的個人由于各種因素而導致無法獲得個人收益最大化的結果。實現非合作博弈向合作博弈的轉化,是解決管理困境的要求,“排斥零和,走向多贏”是管理的根本目標。所謂排斥零和,是指盡量防止管理導致博弈各方之間出現零和博弈,因為零和博弈意味著收益方必然以對方的“失”作為自己的“得”的前提和交換,意味著博弈雙方的利益走向了難以調和的根本對立和沖突。“走向多贏”則是指博弈各方達成能使各方均獲益的一致性策略選擇。軍隊政治工作管理,就是要在合理的規章制度安排下,促使官兵選擇合作策略,良性互動,實現政治工作管理目標。
總之,運用博弈論方法,有助于開辟政治工作管理新的研究領域,實現政工研究的模型化、數學化和科學化,提高軍隊政治工作管理的針對性、有效性、創造性,推進軍隊政治工作學的研究向更深的層次、更寬的范圍、更有用的方向、更科學的境界拓展,也為軍隊管理的科學性提供了堅強的支持。
主要參考文獻
[1] 馬克思,恩格斯. 馬克斯恩格斯全集(第1卷)[M]. 北京:人民出版社,1965:82.
[2] 裘克人,等. 老一輩革命家創造的我軍政治工作優良傳統[M]. 北京:藍天出版社,2003:78.
[3] 裘克人,等. 新世紀軍隊政治工作的創新與發展[M]. 北京:國防大學出版社,2002:56.