楊亞軒
【摘 要】博弈論是運籌學的一個重要分支,涵蓋的內容廣泛,其中,非合作博弈是現代博弈論中的重要基礎和核心內容。本文簡要介紹了博弈論的相關內容,又重點講述了非合作博弈中最關鍵的部分也即納什均衡,最后以治理污水排放為例說明博弈論在實際經濟生活中的應用。
【關鍵詞】博弈論;非合作博弈;納什均衡;應用
文章編號:ISSN1006—656X(2013)12-0043-01
一、博弈論的概述
博弈論(game theory),又稱對策論,是研究決策主體的行為發生直接相互作用時的決策以及這種決策的均衡問題,也就是一些個人或組織,面對特定的環境條件,在一定的規則約束下,同時或先后,一次或多次,從各自的行為或策略中進行選擇并加以實施,各自取得相應結果的過程。
一個完整的博弈一般包含幾個要素:參與者,行動,策略,結果,均衡等。參與者、行動和結果統稱為博弈規則,博弈分析的目的是使用博弈規則來決定均衡。但是,博弈的行動不等同于博弈的策略,博弈的結果不等同于博弈的均衡。根據參與人的數量,可分為二人博弈和多人博弈;根據參與人是否合作,可分為合作博弈和非合作博弈;根據博弈結果的不同,可分為零和博弈、常和博弈和變和博弈。
博弈論對我們的經濟生活有重要意義,人們之間決策行為相互影響的例子有很多:從國家角度出發,在國際貿易中合理運用博弈論可使本國和其他國家都受益,取得雙贏效果;從個人角度出發,在生活中合理運用博弈論可使自己選擇最優策略,減少不必要的成本開支。
二、非合作博弈——納什均衡
非合作博弈是指不允許存在有約束力協議的博弈。完全信息靜態博弈屬于非合作博弈,該博弈中,每個博弈方的策略都是針對其他博弈方策略或策略組合的最佳對策,具有這種性質的策略組合,正是非合作博弈理論中最重要的一個概念“納什均衡”。
用表示一個博弈,如果有個博弈方,每個博弈方的全部可選策略的集合稱為“策略空間”,用表示;表示博弈方的第個策略,其中可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方的得益用表示,是各博弈方策略的多元函數。個博弈方的博弈常寫成。在博弈中,如果由各個博弈方的每一個策略組成的某個策略組合中,任一博弈方的策略,都是對其余博弈方策略組合的最佳對策,即
,對任意都成立,則稱為的一個“納什均衡”。
納什均衡的求解,常采用得益矩陣法。在囚徒困境中,每個參與者都能猜出對方策略,稱該納什均衡為純策略納什均衡。囚徒困境問題反映了非合作博弈的根本特征,體現了個人理性與集體理性的矛盾。兩寡頭企業選擇產量的博弈就是囚徒困境問題在經濟學上的應用。若兩企業聯合形成卡特爾,選擇壟斷利潤最大化的產量,每個企業都能得到更多利潤。但卡特爾協定不是納什均衡,給定對方遵守協議,每個企業都有增加產量的沖動,最后每個企業只能得到納什均衡產量的利潤,它嚴格小于卡特爾產量下的利潤。
在某類博弈中,每個理性人都不能猜出對方的策略,參與人是以一定的概率選擇某種策略的,這樣的策略稱為混合策略,相應的均衡稱為混合策略納什均衡。純策略是混合策略的特例。相關的例子有日常生活中的打撲克、劃拳等。
三、治理河流污水排放的制度設計
環境保護,人人有責,限制企業的污水排放符合社會各界的呼聲。檢查和制止排污是政府的職責,對于以利潤最大化為目標的企業,其一直采取各種措施盡可能降低生產成本。政府和企業間的關系可用經濟學中的監督博弈來解釋。
該博弈的參與者是政府和企業,政府的策略選擇是檢查或不檢查,企業的策略選擇是排污或不排污。假設是企業治理污水(不排污)增加的生產成本,若排污,為自己多得的收益。是政府檢查所需成本。是政府對企業排污的罰款金額。是企業排污對社會利益的損害。假設且,即政府對排污企業采取重罰措施。對應不同策略組合的得益矩陣可見下表。
政府和企業的得益矩陣
在以上假設條件下,政府和企業都猜不出對方會采取何種策略,因而不存在純策略納什均衡,只能求解混合策略納什均衡。如果假定條件不成立,通過劣策略剔除可得到占優策略,即(檢查,不排污)或(不檢查,排污)為占優均衡。
在得益矩陣中,用表示政府檢查的概率,表示企業排污的概率。給定,政府檢查和不檢查的期望收益分別為:
由,得。即如果企業排污概率小于,政府的最優選擇是不檢查;如果大于,政府的最優選擇是檢查;如果等于,政府隨機地選擇檢查或不檢查。
政府的最終目標是降低企業排污概率并保護環境。據的結果,有兩種措施:一是增大分母,即采取重罰措施,使企業平日不敢排污;二是減小分子,即降低檢查成本。現階段可行做法是設立舉報電話,避免政府盲目檢查,提高辦事效率。
再者,給定,企業選擇排污和不排污的期望收益分別為:
由得,即如果政府的檢查概率小于,企業的最優選擇是排污。現實中,政府對排污的懲罰越重,企業因排污獲得的收益越低,企業的排污概率就越小。反之,企業的排污概率就越大。
企業因排污獲得收益的大小,政府難以準確把握。前面談到的企業都是以利潤最大化為目標的企業,適于民營企業。現實中大多排污者是國有企業,這就涉及企業經營的控制權收益問題。企業因排污獲得的生產成本降低部分可以很容易轉化為企業經營者的控制權收益,這些收益包括獎金、福利或者因企業效益上升而帶來的升遷機會。反過來,如果企業因為排污而受罰,經營者并沒有控制權損失,因為罰款由企業出,經營者只是沒有控制權收益而已。
四、小結
本文以納什均衡為理論基礎,分析了純策略納什均衡和混合策略納什均衡在經濟生活中的應用。但本文探討的只是博弈論中一個很小的方面,對均衡問題中的子博弈精煉納什均衡等沒有涉及到,但它們的應用也很廣泛。在日常經濟生活中,小到購物時的討價還價,大到企業間的競爭與合作、國家間的傾銷與反傾銷等,都可歸結為博弈問題。
參考文獻:
[1]彭祥,胡和平.黃河水資源配置博弈均衡模型[J].水利學報,2006,(10).
[2]張維迎.博弈論與信息經濟學[M].上海:上海人民出版社,1996.