文/丁亞麗,華東政法大學
我國的OTC 金融衍生品在2013年啟動,總成交規模已近3 萬億元,該產品與金融市場實際需求緊密相連,但是隨著金融創新的不斷深化,金融衍生品的創新不再以推動產業升級和提高經濟效率為目的,而是為了掩蓋風險已進行投機套利,加劇了市場風險,成為了市場風險的助推器。
目前,國內有不少學者對OTC 金融衍生品進行了研究。韓韻秋(2017)站在國際化的角度上,將國際金融體系中OTC 金融衍生品的發展進行梳理,從以往的金融衍生品帶來的動蕩中總結經驗,吸取教訓。鮑彩慧(2017)則從民事責任角度出發,對OTC 金融衍生品在買方和賣方之間的風險承擔進行了研究,她提出需要對投資者構建適當民事責任制度來平衡交易雙方利益,落實買者自負理念。曹志鵬,袁志玉(2018)也是以商業銀行的OTC 金融衍生品作為研究對象,利用實際的市場數據分析了該產品市場中的市場風險于信用風險之間的相關性。
我們可以發現,目前的研究并沒有涉及到OTC 金融衍生品市場上交易者與政府監管者之間的博弈策略研究,因此本文采取演化博弈來分析在OTC 金融衍生品市場中交易者和監管者之間各自策略的動態演化機制,通過構建交易者和監管者之間的博弈模型來分析在有限理性約束下它們的策略選擇、演變軌跡以及影響因素。
2.1.1 策略空間
在演化博弈模型中,博弈方分為OTC 市場中的參與者和代表政府進行行政監管的監管者,滿足各博弈方均滿足追求自身利益最大化的有限理性人假設。交易者策略空間為{謹慎交易,投機交易},若交易者選擇審慎交易,則可以合理利用市場信息以獲取穩定收益,能夠促進市場平穩有序發展,若交易者選擇投機交易,則交易缺乏真實交易背景,提升交易風險,容易擾亂市場秩序甚至誘發系統性風險。監管者策略空間為{監管,不監管},若監管者選擇監管,則可以識別并區分出審慎交易的交易者和投機交易的交易者,從而采取相應的獎懲措施,若監管者選擇不監管,則難以識別市場參與者是否進行投機交易,主要依靠行業自律協會監管和市場內部來控制風險。
2.1.2 參數設定
假設交易者采取審慎交易時,其獲得的預期穩定收益為R1,交易者采取投機交易時,其獲得的預期投機收益為R2,由于在投機交易中交易者承擔了套期保值者轉移出來的市場風險,因此會獲取風險溢價R2-R1>0。而交易者在交易過程中所需要承擔的成本包括交易費用T、合規成本C1和違規成本C2,交易費用T 包括交易手續費和繳納的政府稅收等支出,合規成本C1即采取審慎交易的交易者為應對政府監管所需的支出,而違規成本C2則表示采取投機交易的交易者為應對監管所花費的硬性支出和被監管者識別出來后受到監管處罰的損失,假定C2-C1>0。對于監管者來說,在監管者采取監管策略時,需要付出監管成本W1,若交易者選擇審慎交易,由于場外衍生品市場的良好發展,監管者可以獲得政績獎勵、職位升遷等收益A1,若交易者選擇投機交易,監管者由于能夠及時發現并處罰投機交易者,也能夠獲得上級部門的相應獎勵收益A2;監管者采取不監管時,假定需要付出的不監管成本為0,若交易者選擇審慎交易,還是可以獲得收益A1,若交易者選擇投機交易,由于投機交易給整個場外衍生品市場帶來的不穩定性,此時監管者則需要面對W2的批評問責和聲譽下降損失,具體參數經濟意義如表1所示。

表1 演化博弈參數經濟意義設定
假設場外衍生品市場上選擇“審慎交易”的交易者比例為x(0≤x ≤1),那么選擇“投機交易”的交易者比例則為1-x;監管者采取監管的概率為y(0 ≤y ≤1),那么監管者采取不監管的概率就為1-y。兩者的博弈收益矩陣如表2所示。

表2 場外衍生品市場參與者和監管者的博弈收益矩陣
交易者采取“審慎交易”策略的適應度為:

交易者采取“投機交易”策略的適應度為:

交易者平均適應度為:

監管者采取“監管”策略的適應度為:

監管者采取“不監管”策略的適應度為:

監管者平均適應度為:

交易者的復制動態方程為:

對F x 求導可得:

監管者的復制動態方程為:

對F y 求導可得:

動態方程可以構成一組微分方程組,這組微分方程組能夠有效地刻畫市場交易者和監管者之間行為變化過程。令F x =0 且F y =0,可以得到5 個均衡解,分別為E10,0 、E20,1 、E31,0 、E41,1 和E5x*,y*。陳錦磊(2013)、劉賀(2016)、方磊(2018)等學者在研究中認為來自政府的監管和行業自律組織的監管在市場監管中都是不可替代的有機組成,而毛皎暉(2018)、王然(201 8)等學者都認為場外金融衍生品市場的審慎交易對金融市場的穩定性具有重大影響。因此此處我們希望E41,1 即交易者能夠采取“審慎交易”策略,監管者能夠采取“監管”策略的狀態能夠成為演化穩定策略均衡,即E41,1 需要滿足F' x <0 且F' y <0 兩個條件,代入求解得:

對于上述均衡,我們可以直觀地發現:
對于交易者來說,為了使交易者選擇“審慎交易”策略,(2)式應該盡可能地被滿足,即應該盡可能地小。也就是說,當交易者面對監管所花費的成本固定時,交易者采取投機交易的投機收益與采取審慎交易獲得的穩定收益相比的超額收益(R2-R1)應該盡可能地小;當超額收益(R2-R1)固定時,交易者采取投機交易時面對政府監管花費的成本和受到監管處罰的損失與采取審慎交易時面對政府監管花費的成本相比的超額損失(C2-C1)應該盡可能地大。

圖2 交易者與監管者行為博弈動態相位圖
對于監管者來說,為了使監管者選擇“監管”策略,(1)式應該盡可能地被滿足,即應該盡可能地小。當不穩定市場下監管者獲得的上級部門的獎勵和面對批評問責和聲譽下降的損失的數量之和固定時,監管者采取監管的成本(W1)應該盡可能地小;當監管的成本固定時,則應該使不穩定市場下監管者監管而獲得的上級部門的獎勵(A2)盡可能地大,或者面對使其因不監管而需要面對的批評問責和聲譽下降的損失(W2)盡可能地大。
交易者與監管者的動態相位圖如圖2所示,圖中我們可以發現即便我們將E5點無限接近于E2,左上方正方形面積足夠大以使得交易者與監管者采取的策略能夠盡可能地落在其中,最終演化穩定狀態無限接近于{謹慎交易,監管}策略集合,但是在市場中還是會存在一定概率(1-x*)的交易者選擇投機交易。
本文通過構建動態演化博弈模型來探究OTC 金融衍生品市場中的交易者與政府監管機構之間的策略互動,以此來分析如何控制場外衍生品市場中的市場風險。
3.1.1 E41,1 為ESS 所需條件
為使演化穩定狀態達到{謹慎交易,監管}的策略組合,應降低投機交易與謹慎交易產生的收益差額,減少交易者需要花在應對政府監管(人力、財力、物力)上的支出,增加政策對于交易者投機交易和監管者不監管的處罰力度,增加監管者監管的獎勵收益,同時應致力于降低監管成本。
3.1.2 投機交易存在合理性
根據演化博弈的動態相位圖,我們不難發現即便OTC 金融衍生品市場中交易者和監管者都處于最理想的演化穩定狀態之中,還是會存在一定概率的交易者會選擇“投機交易”策略,這與政府監管機構采取“監管”策略的概率無關,只要政府監管的成本存在,就會有相應概率選擇“投機交易”策略的交易者存在。
3.1.3 穩定市場下監管者收益激勵效用無效
從演化穩定策略所需要的條件上來看,在穩定市場條件下,即假定市場上交易者均采取“謹慎交易”策略時,提高監管者進行監管以使得市場趨于穩定合規狀態給予的政績獎勵、職位升遷等收益,對于其選擇“監管”策略并沒有任何影響,在這種情況下,收益激勵完全失效。
3.2.1 健全監管激勵機制
合理確定監管者在采取監管和不監管策略時各自的獎勵收益,確保監管機構和監管人員能夠 履行監管職責,建立健全能夠反映監管績效的評價體系,并充分發揮社會輿論和民間組織對于監管機構的外部監督職能。
3.2.2 降低監管成本
優化監管人員結構,提升監管人員控制OTC 金融衍生品市場風險的專業水平,積極利用計算機網絡技術來提高監管技術,爭取將對于市場的監控能夠達到實時動態的狀態,在兼顧監管效率的同時減低監管成本。
3.2.3 健全信息披露機制
降低市場交易者能獲得的投機交易與謹慎交易產生的收益差額,減少風險收益,減少交易者之間信息不對稱現象,健全交易信息披露機制,確保披露的信息能夠充分反映OTC 金融衍生品的潛在風險,提高市場交易者在衍生品業務與風險管理上的透明度。
3.2.4 增加投機交易處罰力度
強化監管處罰力度,對于市場交易者的投機行為采取嚴厲懲罰,提高交易者進行投機交易的成本,向OTC 金融衍生品市場交易者傳遞政府極度重視場外衍生品市場合規經營的政策信號,維護場外衍生品市場的市場秩序。