高 宇,孫雁南,姚 鑫
西安交通大學經濟與金融學院,陜西西安710061
P2P 平臺作為金融與互聯網科技相結合的金融創新模式,為小額信貸客戶提供基于互聯網的“點對點”資金融通渠道,有效緩解了小微企業和個體投資者的融資難問題,且與傳統金融渠道(例如銀行貸款等)相比,在交易便捷性、受眾普惠性等方面具有顯著優勢。然而,互聯網介質在帶來上述優勢的同時,也加劇了這一金融創新模式潛在交易及運營風險的影響烈度、輻射范圍與爆發強度。自2007年中國第一家P2P平臺成立,發展初期的P2P行業在未能有效解決自身固有缺陷(例如信息不對稱、信息披露不完善等)的前提下,在行業監管缺位階段無序擴張,逐漸呈現出問題頻發的運營態勢。鑒于此,2015 年P2P行業監管政策初步形成,并伴隨行業的發展逐步完善。然而,盡管金融監管機構后續在市場信用、監管制度等方面構建了卓有成效的監管體系,且監管強度持續提升至“高壓監管”,但監管空白期累積的系統性風險已呈積重難返之勢,難以通過強監管手段根除。為了防控系統性金融風險,保護中小投資者的利益,監管機構最終于2020年底對P2P行業進行了“清退轉型”。
P2P行業完全清退的結局令人唏噓,究其原因,除行業自身固有的交易風險、我國個人信用體系支撐薄弱等客觀因素之外,金融監管部門是否在該行業產生期、成長期、成熟期制定具有針對性的法律法規體系以降低風險、規范運營也是一個值得思考的重要因素。P2P平臺全部清退留下的市場空白終會被其他新生金融創新模式所填補。與P2P行業類似,數字經濟發展浪潮下涌現的金融創新不可避免地需要依托互聯網展開,因此較高的風險防控與監管需求會隨之產生,與之對應的“監管方—業務方”博弈也會貫穿行業創新發展的整個歷程。作為近年來我國金融領域風險防范與化解的典型案例,P2P行業專項監管整治的經驗教訓總結、“監管方—業務方”博弈規律的提煉會為我國金融創新與監管的風險識別、政策制定提供有益借鑒。因此,業界和學術界迫切需要對P2P行業發展中監管方與平臺方之間的博弈過程予以深入分析,探究監管政策調整過程中P2P平臺的反應、原因及其潛在異質性,從中總結提煉出互聯網金融模式創新的風險事前防范、事中管控與事后處置分析的經驗教訓。
現有研究在P2P平臺監管政策效應分析、監管方與平臺方的博弈關系等方面進行了廣泛的探索。趙建國等指出,政府監管政策體系的建立有助于緩解由信息不對稱導致的市場失靈,保障P2P 行業市場的有效性。鄒欣指出了監管政策促進P2P 行業優勝劣汰的作用效果。針對監管的具體影響,王雄等發現P2P 行業整改驗收政策會通過影響已有投資者信心降低平臺的成交量。于博等檢驗了監管沖擊下P2P 平臺合規轉型對其成交量的正向影響。張海洋提出加強信息披露監管有助于實現P2P 行業去擔保化。徐淑一等指出P2P行業監管政策效果與項目利率的相關性。但是,上述針對特定時點的監管政策如何影響平臺發展的分析難以刻畫出監管發展歷程的動態性。與之對應,演化博弈方法能夠從群體層面(而非單獨個體)分析研究對象中一方決策過程對他方行為的影響,又能夠兼顧到博弈階段的動態變化,最終獲得的演化穩定策略可表明整個群體結構動態變化的穩定方向。目前,已有博弈研究進行了有益嘗試,例如韓景倜等指出監管政策的制定需要考慮政府與P2P 平臺博弈雙方收益大小的不確定性。劉偉等指出基于平臺初始狀態考量的動態懲罰機制有利于平臺運營行為逐步趨向規范。然而,P2P 平臺等金融創新的風險因素并非孤立存在,而是呈現出時空共存性和影響系統性特征。因此,對“監管政策制訂—平臺運營反應”過程的博弈分析也需全面辨識和界定整體風險因素,分析其集合而非孤立影響??紤]到不同類型的P2P 平臺由于股東背景的差異,在功能設定(例如規模、收益率、運營合規性)、風險性質和風控機制、政策施行效果等方面存在異質性,不同類型平臺應對外部政策變化的舉措會存在顯著差異,進而對“平臺方—監管方”博弈的收斂過程產生影響。因此,有必要將平臺類型作為博弈過程中平臺方風險集合的有效指征變量展開探索。
綜上所述,由于數據可獲性、變量測度和分析方法的限制,現有實證研究難以全面涵蓋監管政策制定的動態過程和平臺系統性風險因素的影響,因而無法開展貼合平臺發展實際的動態博弈過程分析。演化博弈方法對監管政策階段性演進過程中平臺方異質性反應問題的分析可有效彌補上述缺憾。但現有的少數演化博弈研究僅分析了監管方的決策優化,以及監管政策的“動態—非動態”效用對比,鮮有基于平臺類型對其異質性反饋效應展開的探索。鑒于此,本文基于監管政策制定的“成本度量”“強度界定”和“收益分析”,對P2P行業監管政策階段性調整及異質性平臺反應函數進行特征分析,并據此引入“監管方(演化性)—平臺方(異質性)”分階段動態演化博弈分析范式,綜合衡量監管政策制定與評估過程中所對應的監管演變與風險集合特征。
本文突破了以往博弈關系研究的靜態分析范式和企業同質性假設,構造“基于監管演變的行業周期劃分方式”與“基于平臺類型的異質性特征”兩個可行的指征變量,并將其引入同一個博弈分析框架,以期為相關政策博弈規律的理論研究提供新思路。P2P模式的失敗并非金融創新的終點,“監管方—業務方”博弈的新命題也會隨著新興金融創新模式的產生而不斷涌現。本文對P2P行業發展過程中“監管方—業務方”博弈規律的提煉總結,以及據此開展的優化推演為我國金融監管部門事后復盤提供了借鑒依據,也有益于提升我國金融風險防控、金融創新治理能力。
對博弈階段的劃分和雙方策略函數的構建是“監管方—平臺方”博弈分析的基礎。金融監管政策體系的形成與完善是當期宏觀環境與行業監管因素共同作用的結果,不同時期的監管政策在側重方向與強度上會有所差異。給定博弈階段,不同資產背景的P2P平臺由于資質、目標等方面的差異,應對監管政策會產生不同的策略反應。因此,本文總結P2P 行業監管政策的演變歷程,劃分監管階段并厘清平臺類型對其決策函數的影響。首先,構建監管方應對市場風險的決策函數,分析監管政策對不同時期市場風險的整治強度;其次,構建平臺方應對監管政策的反應函數,比較不同類型平臺對特定監管強度的策略反應差異,進而明晰監管政策的強度和速率變化及其對不同類型平臺的異質性影響機理;最后,探討理想狀態下,監管方如何依據P2P 平臺的異質性特征來精細化調整監管政策,對金融創新模式的發展做出持續有效的管控。
1.P2P行業監管政策發展脈絡
現有研究多基于行業生命周期理論對P2P行業的發展歷程進行劃分,例如朱夢娣依據P2P行業發展周期將其劃分為萌芽期、初始發展期、快速擴張期、風險爆發期和政策調整期。但該劃分方式尚未從“監管方—平臺方”博弈的角度關注監管政策變化對平臺發展的影響。因此,本文梳理并解讀了我國P2P行業已出臺的部分重要監管政策(見表1),嘗試從監管政策動態調整的視角劃分P2P行業的發展歷程。

表1 我國P2P行業部分重要監管政策
2.P2P行業監管政策演變時期
本文注重體現監管政策在制定依據、實施強度和施行效果上的系統化度量,并兼顧其監管階段的劃分和特征提煉。為了區分監管政策動態變化對P2P平臺市場表現的影響,本文依據不同時期的監管側重點和強度差異,將監管政策的演變歷程劃分為兩個階段:
(1)監管政策缺位階段(2007—2014 年)。受金融危機帶來的商業銀行貸款額度縮減的影響,我國P2P行業自2007年第一家平臺成立以來發展迅速。而這段時期同樣是監管政策的缺位階段,行業就此無序擴張,呈現爆發式增長,系統性金融市場風險也隨之快速累積,給行業健康平穩發展埋下了巨大隱患。
(2)監管政策調整階段(2015年至今)。為了扼制行業亂象,監管機構從2015年開始加強對P2P行業的監管,先后出臺一系列平穩行業發展的政策、制度,致力于凈化行業運營環境、穩定金融發展秩序。截至2020年底,P2P平臺已全部清退,各類高風險金融機構得到有序處置,防范化解系統性金融風險的攻堅戰取得階段性成果。
本文研究的側重點為2015 年之后的監管政策調整階段。同時,為了更好地探究監管政策制度建立及完善過程中時間和強度尺度的變化機理,本文將監管政策調整階段細分為方向期、警示期和規范期三個時期。P2P行業監管政策的演變歷程見表2。

表2P2P行業監管政策的演變歷程
據網貸之家統計顯示,P2P平臺可歸類為國資系、風投系、銀行系、上市系和民營系5個類別。國資系指由國有企業出資成立或者是與國有企業合資成立的平臺。風投系是指接受風險投資的平臺。銀行系指由商業銀行出資成立或者是與商業銀行合資成立的平臺。上市系指由上市公司出資成立或者是與上市公司合作成立的平臺。民營系指由普通創業者或者具有相關從業經驗的人出資成立的平臺。因資方背景的差異,不同類型的P2P 平臺在利益相關者(企業股東、債券人等)、目標訴求、運營行為、合規程度、風控能力和戰略選擇等方面均呈現出顯著的差異。例如,作為國有控股企業的國資類平臺重視風險防范,具備嚴格的風險預估、計提減值、風險準備金等措施。
金融機構的金融創新行為本身具有一定的社會性,需考慮對社會福利產生的影響。當創新業務的擴張危及社會利益時,出于社會責任的要求,P2P 平臺應及時調整經營方式,遏制金融風險的擴散。同時,金融創新本質而言是金融機構逐利本性的產物,微觀平臺的目標定位無法脫離對利潤的追逐,因此,業務方需要審慎把握社會效益與經濟效益之間適度平衡。然而,社會責任作為企業的無形資產并不能產生直接利潤。因此,不同資本類型平臺在運營目標等方面的差異,會對它們踐行社會責任的能動性產生影響,并由此體現出社會收益在其決策函數中的重要程度差異:國資系平臺在社會主義市場經濟中具有特殊的角色定位,因而需要承擔各種顯性與隱性約束來踐行更多的社會責任。民營系平臺側重于以高風險謀取高收益,更加注重對企業資金收益的追逐。其他類平臺如上市系、銀行系等因需要顧及資本市場反應對企業利潤的影響,在一定程度上也會考慮自身聲譽效應的維護,選擇在保證企業資金收益的前提下,適當關注社會收益問題。
鑒于此,本文依據不同資本類型平臺對社會收益的重視程度差異,將其劃分為三類(見表3):第一類平臺的運營目標以社會收益為主;第二類平臺同時關注社會收益與資金收益,但因其關注社會收益是為了更好地輔助企業獲取資金收益,故該類平臺對社會收益的關注程度低于第一類;第三類平臺的運營目標以獲得資金收益為主,并且具有一定的違規運營傾向以攫取超額收益。

表3 不同類型的P2P平臺分類說明
監管制度體系的建設與完善是一個階段性過程。相應的,不同資本類型的P2P平臺會對特定階段的監管政策產生差異性策略反應,并在下一階段依據政策的變化予以調整。因此,博弈雙方需要通過反復博弈來不斷調整策略以實現自身利益最大化目標。本文將構建不同監管細分時期與不同資本類型平臺的多階段演化博弈模型,探究監管政策調整對不同類型平臺市場表現的異質性影響。
依據監管政策影響下P2P平臺策略行為的演化過程,提出模型前提假設如下:(1)博弈主體。監管機構和P2P平臺,均為有限理性。
(2)主體目標與行為。監管方:降低市場風險、維護金融市場穩定。依據行業不同發展時期的市場風險調整監管強度;平臺方:收益(資金收益與社會收益)最大化以及成本最小化。依據自身目標特征對監管強度的調整做出策略反饋。
(3)策略選擇:監管機構與P2P平臺均有兩種策略選擇。監管方:選擇積極監管策略的概率為(0 ≤≤1),選擇消極監管策略的概率為1-;平臺方:選擇違規經營策略的概率為(0 ≤≤1),選擇合規經營策略的概率為1-。
(4)決策參數:博弈雙方依據當期收益與成本進行策略選擇與調整。積極監管成本高,但能夠發現P2P平臺的違規行為,從而產生監管收益(包括顯性收益及隱性收益);消極監管成本低,但無法辨別平臺的違規行為。同時,違規經營的平臺有(0 ≤≤1)的概率被公眾或者第三方機構曝光,從而造成監管損失(包括問題平臺被曝光對監管部門帶來的負向社會效用)。
依據基本假定條件來構建P2P平臺與監管機構之間的演化博弈模型。博弈模型的決策樹演化如圖1所示,參數說明見表4,博弈支付矩陣見表5。

圖1 博弈雙方支付效用決策樹演化
(1)策略空間:監管機構和P2P 平臺的戰略空間分別為={,}和={,}。其中,代表監管機構的策略集合,代表積極監管策略,代表消極監管策略,代表P2P平臺的策略集合,代表合規經營策略,代表違規經營策略。
(2)監管方收益:假設監管機構實施監管行為產生的隱性監管收益為,同時可通過監管發現P2P 平臺的違規行為并收取罰金。
(3)監管方成本:假設監管機構實施監管行為產生的監管成本為。監管機構在消極監管狀態下,未及時發現P2P平臺的違規行為而造成的損失為。
(4)平臺方收益:假設P2P 平臺正常經營時的營業收入為,平臺合規經營時的產生的額外收益為(等于資金收益與社會收益之和),違規經營時產生的額外收益為。假設無外部監管作用的條件下有≤,P2P平臺有動力違規經營來獲取額外收益。但違規經營的成本會隨著監管強度的增加而增大,即違規經營額外收益與合規經營額外收益的差值(-)會隨著監管強度的增加而不斷縮小,甚至會出現負值(>)的情況。因此,P2P平臺也有動力根據監管政策強度的變化對自身業務進行調整和整改。
(5)平臺方成本:假設P2P 平臺合規經營產生的額外運營成本為(包含整改成本和機會成本),違規經營的罰款為。
(6)監管方決策參數的調整:在金融市場風險累積的作用下,監管機構未及時發現P2P 平臺違規行為產生的損失隨著監管時期(方向期、警示期和規范期)的推移而不斷增加。假設監管機構在方向期、警示期和規范期未及時發現平臺違規行為而產生的損失分別為、、,且<<。
(7)平臺方決策參數的調整:假設不同資本類型的P2P 平臺應對監管政策的變化會有不同的策略反應。依據前述博弈基礎分析中P2P 平臺的分類方式,以不同資本類型平臺對社會收益的重視程度為基準將其分為三個類別,其社會效益分別為、、,且>>。
(8)博弈主體決策關聯:監管強度調整會引致P2P 平臺“收益—成本”函數的變動,不同類型的平臺有動機隨著監管的調整而選擇不同的策略行動,以實現自身最優化目標。

表4 博弈模型參數說明

表5 監管機構與P2P平臺的演化博弈支付矩陣
1. 監管機構穩定策略求解
基于上述假設可以推出監管機構在不同策略選擇下的期望收益。

對()求一階導數可得
'()=d/d=(1-2)[-+(+)]
觀察方程(),可以得到=0,=1和=(-)/(+)為()=0的根。根據演化穩定策略原理,當()=0且'()≤0時,為演化穩定策略(evolutionarily stable strategy,ESS)。
當=(-)/(+)時,取任意值都為穩定狀態,也就是說監管機構的任意策略選擇都為穩定策略。
當≠(-)/(+)時,具體如下:
情形1:若-<0,那么>(-)/(+),=1為唯一的演化穩定策略。
情形2:若0 <-<+,則當>(-)/(+)時,=1 為唯一的演化穩定策略;當<(-)/(+)時,=0為唯一的演化穩定策略。
情形3:若->+,那么<(-)/(+),=0為唯一的演化穩定策略。
2.P2P平臺穩定策略求解
同理,可以推出P2P 平臺在不同策略選擇下的期望收益。合規經營期望收益為UP=(+)×+(+-)×(1-)=+-。違 規 經 營 期 望 收 益 為UP=(+-)×+(+-)×(1-)=+--(1-)。
可得出P2P平臺的平均期望收益為

從而可以構造P2P平臺經營策略的復制動態方程為
()=d/d=(1-)(UP-UP)=(1-)[-(1-)+--+]
對()求一階導數可得
'()=d/d=(1-2)[-(1-)+--+]
觀察方程(),可以得到=0,=1 和=(--+)/(1-)為()=0 的根。根據演化穩定策略原理,當()=0且'()≤0時,為演化穩定策略。
當=(--+)/(1-)時,取任意值都為穩定狀態,也就是說P2P 平臺選擇策略都為穩定策略。
當≠(--+)/(1-)時,具體如下:
情形1:若--+<0,那么>(--+)/(1-),=0 為唯一的演化穩定策略。
情形2:若0 <--+<(1-),則當>(--+)/(1-)時,=0 為唯一的演化穩定策略;當<(--+)/(1-)時,=1為唯一的演化穩定策略。
情形3:若--+>(1-),那么<(--+)/(1-),=1為唯一的演化穩定策略。
通過分析上述模型穩定策略可知,給定不同“成本—收益”關系下博弈雙方的參數值,模型的演化穩定策略會產生不同的變化。
1. 監管機構
當P2P 平臺的違規概率>(-)/(+)時,積極監管=1 為監管機構的演化穩定策略;當P2P平臺的違規概率<(-)/(+)時,消極監管=0為監管機構的演化穩定策略。監管機構策略選擇的動態變化路徑及其演化穩定策略的復制動態相位圖如圖2所示。

圖2 監管機構的復制動態相位圖
推論1:當->+時,監管成本大于監管收益,且超出部分大于對違規經營P2P 平臺的罰款與監管機構未及時發現違規行為的風險損失之和,監管機構的演化穩定策略為消極監管。
實踐映射:P2P行業發展初期,一方面行業相關監管法律法規缺失,監管成本高;另一方面,監管強度過高會在一定程度上阻礙新興行業發展,監管收益較小。此時,政府/監管部門或有意釋放“包容”的監管態度,鼓勵行業發展以幫助市場緩解小微企業借貸難等問題。
推論2:當-<0時,監管成本小于監管收益。監管機構的演化穩定策略為積極監管。
實踐映射:隨著P2P 行業快速發展,行業亂象初見端倪,消費者權益無法得到保障,金融風險迅速累積。此時加強監管有助于穩定行業發展,監管收益增加;隨著各項法律法規以及監管辦法、細則等出臺且不斷完善,監管方向、內容與范圍逐漸明晰,監管成本下降。故監管方開始選擇積極監管以穩定行業秩序。
推論3:當0 <-<+時,監管成本小于對違規經營P2P 平臺的罰款與監管機構未及時發現違規P2P平臺的風險損失之和。此時,監管機構的演化穩定路徑隨著博弈參數的調整而變化。具體而言,隨著監管時期(方向期、警示期、規范期)的推移,監管機構未及時發現違規P2P 平臺的風險損失不斷增加(<<),監管方積極監管的概率從越來越靠近“0”點的位置趨向“1”點。這意味著監管方對高強度監管需要的迫切程度跟隨監管時期的推移而逐步加強,從而會在更早的時間點開始選擇加強監管強度,進入積極監管的演化穩定狀態。不同監管時期的演化穩定路徑如圖3所示。
實踐映射:隨著行業系統性風險的不斷膨脹,監管機構未及時發現P2P 平臺違規行為的風險損失逐漸增加。此時,監管方為了穩定行業發展,需要持續加強監管強度以扼止行業亂象。同時,行業發展時期的推移進一步提升了監管方調整監管強度的緊迫程度。
2.P2P平臺
當監管機構的監管概率>(--+)/(1-)時,合規經營=0為P2P平臺的演化穩定策略;當監管機構的監管概率<(--+)/(1-)時,違規經營=1 為P2P 平臺的演化穩定策略。P2P平臺策略選擇的動態變化路徑及其演化穩定策略的復制動態相位圖如圖4所示。

圖3 不同監管強度時期的演化穩定路徑

圖4P2P平臺的復制動態相位圖
推論4:當--+>(1-)時,->-,即違規經營的額外收益大于合規經營的額外收益,P2P平臺的演化穩定策略為違規經營。
實踐映射:監管初期階段,監管強度較低,P2P平臺違規經營被發現的概率較小,并且由于法律法規、監管細則的缺失與不完善,違規罰款的范圍與金額較小。此時違規經營的額外收益大于合規經營的額外收益,P2P平臺選擇違規經營。
推論5:當--+<0時,-<-,即違規經營的額外收益小于合規經營的額外收益,P2P平臺的演化穩定策略為合規經營。
實踐映射:監管中期階段,隨著系統性金融風險的累積,監管強度逐漸加強,法律法規、監管細則不斷完善,P2P平臺違規經營被發現的概率增加,并且違規罰款的金額大小與范圍逐漸擴大。此時,違規經營的成本增加倒逼企業合規經營,P2P平臺選擇合規經營。
推論6:當0 <--+<(1-)時,-<-,即違規經營的額外收益小于合規經營的額外收益,P2P 平臺的演化穩定路徑隨著博弈參數的調整而變化。具體而言,依據本文對P2P 平臺的分類,不同資本類型平臺策略變化的調整速率呈現出差異。假定違規經營被發現的概率保持不變,則由=+得不同類型的P2P平臺選擇進入合規經營狀態的參數臨界值為()=(--R-+)/(1-),=1,2,3。由不同類型平臺合規經營情形下可獲得的社會收益>>推導可知,隨著社會收益R的增加,平臺選擇違規經營的策略的概率從靠近“1”點位置逐步趨向“0”點。這意味著,社會收益重視程度越高的P2P 平臺會在越早的監管時期選擇合規經營策略,即第一類P2P 平臺最早進入合規經營策略狀態,第三類平臺最后進入合規經營策略狀態。不同類型P2P平臺的演化穩定路徑如圖5所示。
實踐映射:監管后期階段,隨著監管強度進一步加強與監管制度體系的規范與完善,P2P平臺違規經營的期望收益率逐步萎縮,在此過程中P2P平臺會跟隨監管的變化逐步調整其策略選擇以實現最優化目標。同時,由于不同類型平臺對社會收益的關注程度不同,其選擇進入合規經營狀態的時間次序也呈現出差異。

圖5 不同資產背景類型P2P平臺演化穩定路徑
P2P 平臺的季度成交量是指該平臺在一個季度內成功標的所獲得的投資總額,反映P2P 平臺的運營能力及發展狀況。本文使用成交量來衡量P2P 平臺的市場表現,數據來源于2014 年1 月—2019 年12 月網貸之家發布的5 種不同系別(民營系、國資系、上市系、風投系、銀行系)的P2P 平臺成交量季度數據。網貸之家是一個專門面向P2P 平臺和借貸雙方的第三方資訊平臺,也是最大的P2P 行業研究平臺。網貸之家對P2P 平臺的數據展示非常全面,是P2P 借貸雙方參與借貸過程的首選參考平臺,擁有較高的透明度和權威性。
本文探討監管政策的強度變化對不同資本類型P2P 平臺市場表現的異質性影響。根據5 個不同系別(民營系、國資系、上市系、風投系、銀行系)P2P平臺的季度成交量數據對其市場表現進行統計分析,得到2014—2019 年不同系別平臺的市場表現如圖6所示。
1. 不同類型平臺異質性市場表現路徑分析
隨著監管政策的不斷變化,不同資本類型P2P平臺的市場表現趨勢因在企業運營目標上對社會責任的重視程度差異而呈現出異質性效果。
面對逐步加強的監管強度,國資系P2P平臺的市場表現大體上與上述博弈模型中第一類平臺的演化穩定路徑相符合。不同于其他系別平臺,國資系的市場成交量從監管導向剛開始加強的方向期起即處于穩定中稍有回落的狀態。由于對國企擔當和社會收益等因素的考慮,國資系平臺選擇跟隨監管政策導向,采取整改措施、加強風險管控與合規運營,以體現自身社會責任意識。因此,第一類平臺選擇在監管方向期即進入合規經營的狀態。
面對逐步加強的監管強度,風投、上市、銀行三個系別P2P平臺的市場表現大體上與上述博弈模型中第二類平臺的演化穩定路徑相符合。由于市場期望和股東信譽等社會效益因素會影響企業資金收益的獲得,第二類平臺的運營目標更加注重資金收益與社會收益的平衡。在監管導向開始加強的方向期,監管強度相對較弱,企業違規經營被發現的概率相對較小,符合第二類的P2P 平臺有動機利用監管方向期的缺口擴張市場份額,提升市場成交量,謀取一定程度的資金收益。但隨著警示期監管強度的進一步加強,考慮到違規行為對社會收益的不良影響逐漸加強,該類型平臺則傾向于跟隨監管政策的要求逐步趨于合規經營,市場成交量呈快速下降趨勢。因此,第二類平臺選擇在監管方向期違規經營,監管警示期趨于合規經營狀態。
面對逐步加強的監管強度,民營系P2P平臺的市場表現大體上與上述博弈模型中第三類平臺的演化穩定路徑相符合。民營系P2P平臺的運營目標注重資金收益。在監管強度開始加強的方向期,符合第三類的民營系平臺有意借助該期監管政策在法律、規范、細則等方面的不足,違規經營以快速攫取市場利潤,其市場成交量從監管方向期開始加速上升。直至監管強度進一步收緊的警示期前期,該類型平臺仍然持續發力以加快市場成交量的增加速率,企圖在監管完全收緊之前謀取最后一輪資金收益。因此,第三類平臺在監管方向期與警示期都會選擇趨于違規經營狀態。

圖6 不同資本類型P2P平臺市場表現
2. 不同監管時期監管效應分析
監管方向期:監管導向初步釋放,任何個體或群體都無法精準預測未來的監管走向與市場狀態。因此,在未來監管路徑并不明晰的前提下,幾乎所有類型平臺在該期的市場表現都呈現出不同幅度的波動上升趨勢,這種現象說明平臺策略選擇的變化很難超越自身所在的時期,立足于長遠利益對自身行為做出規范與調整,由此體現了平臺的有限理性與逐利性特征。同時,無論何種類型的P2P平臺,應對監管強度變化的策略反應都存在一定程度的滯后,也進一步體現了博弈主體的有限理性。
監管警示期:嚴格監管的導向逐步明晰,各個類型平臺依據自身特征或是進行穩步整改(國資系),或是短期內“火中取栗”謀取資金收益(民營系),或是觀望形勢適當整改(銀行系、上市系、風投系)。各類平臺面對監管強度逐步嚴格的信號導向,做出了符合自身利益特征的策略選擇,也進一步印證了其異質性與逐利性特征。
監管規范期:高強度監管的發展路徑基本明確,各個類型平臺市場成交量顯著縮減,民營系平臺市場表現的下降趨勢尤為明顯,而其他類型平臺雖偶有回升跡象,卻仍然未能逃脫清零的趨勢。這種現象也反映了P2P行業監管缺位階段的系統性金融風險過度累積終究造成了積重難返的局勢。
綜上,5個系別P2P平臺在不同監管時期的市場表現數據佐證了前文博弈模型的結果推論。第一,不同類型的P2P平臺應對監管政策變化的策略調整速率呈現出差異性,其中社會收益重視程度越高的P2P平臺會在越早的監管時期選擇合規經營策略。第二,不同監管時期的監管效應特征進一步反映了博弈主體的有限理性、逐利性與異質性。第三,P2P行業“清退轉型”的結局警示,前期監管缺位帶來的系統性金融市場風險過度積累,很難依靠后期的強監管手段徹底清除。
以前述分析為基礎,構建“監管方—平臺方”決策效用的動態優化推演模型,以進一步探索博弈雙方的策略優化與調整方向。根據前文博弈模型的策略分析相位圖,繪制監管方與平臺方的動態博弈關系如圖7所示。
監管機構策略轉換的臨界值線為=(-)/(+),P2P 平臺的策略轉換的臨界值線為=(-+)/(1-)。當P2P 平臺違規經營的風險超過臨界值時,監管機構選擇從消極監管轉變為積極監管策略;當監管機構的監管強度超過臨界值時,P2P平臺選擇從違規經營轉變為合規經營。
因此,依據“監管方—平臺方”策略轉換臨界值將雙方的博弈過程分割為四個時期:A 時期(消極監管,違規經營)、B 時期(積極監管,違規經營)、C 時期(積極監管,合規經營)、D時期(消極監管,合規經營)。在此基礎上,通過對雙方策略轉換過程的模擬推演,得出其決策效用的周期變動、強度遷移與“規范/功能+考核”多層次治理模式規律。

圖7 監管機構與P2P網貸平臺動態博弈
1. 監管周期變動模擬推演
假設A 時期為監管方向期,B 時期為監管警示期,C 時期為監管規范期。由圖7監管方和平臺方從A時期到C時期過程中策略選擇的變動軌跡,得到監管政策周期變動的模擬推演過程:
A 時期:監管方摸索監管方向,監管強度寬松、約束相對較弱,處于消極監管的狀態,因此P2P平臺選擇違規經營策略。隨著違規行為不斷增加至超過監管機構策略選擇的臨界值,系統性金融風險的累積促使監管方增加監管強度,轉變為積極監管策略。雙方的博弈狀態從A時期向B時期轉移。
B 時期:由于監管強度的提升不能一蹴而就,違規經營的P2P 平臺數量會隨著監管強度的提升而緩慢減少,但違規經營造成的系統性金融風險的絕對值會在該時期內持續累積至超過P2P平臺的策略變化臨界值,雙方的博弈狀態從B時期向C時期轉移。
C 時期:隨著監管體制機制的不斷優化與完善,監管強度不斷增強,P2P 平臺違規經營給企業自身帶來的損失不斷增大甚至超過收益,因此P2P平臺開始積極履行監管要求,順勢而行選擇合規經營策略。
由上述過程可知,監管方與平臺方的穩定策略選擇,會隨著對方狀態(行為)的變化而變動。隨著監管方的監管強度逐步遞增,平臺方的違規概率逐步降低。
推論7:監管方設立強度嚴格的監管導向,有助于行業參與者盡早將期望收益值鎖定在合理范圍內,從而縮減行業風險的積累周期。
政策啟示:在理想狀態下,監管部門盡早設立強度嚴格的監管體系可在一定程度上減少監管方與平臺方的博弈回合,降低行業系統性金融風險的累積周期。在現實情況中,完善的監管體系建設需要一個循序漸進不斷調整的過程,故可通過設立嚴格的“準入門檻”“試運行期考核制度”等預先機制,幫助行業參與者盡早設定合理的期望收益,減少違規行為。
2. 預設基礎性監管框架的穩定模擬
假設監管方在行業發展初期設立了基礎性的監管框架。換言之,如果不存在監管空白期,由監管機構策略轉換的臨界值=(-)/(+)以及P2P 平臺策略轉換的臨界值=(--+)/(1-)可得,此時監管機構策略轉換的臨界值將無限接近于“0”點位置(橫坐標軸),因此監管方與平臺方的博弈只存在于B時期到C時期的狀態之間,并在C時期達到穩定。同時,雙方博弈狀態從B時期進入C時期的時間點,取決于P2P平臺策略轉換臨界值的大小。
假設、、分別代表一個從弱到強的預設基礎性監管框架的強度,那么,()、()、()分別代表與其對應的P2P 平臺策略轉換臨界值。由前述演化博弈模型可知,隨著監管強度的增強,違規經營額外收益與合規經營額外收益之間的差值會逐漸遞減,可得()>()>(),意味著預設基礎性監管框架的強度越高,越有助于行業在更早的時點,進入C 時期的穩定狀態。預設基礎性監管框架的穩定模擬如圖8所示。

圖8 預設基礎性監管框架的穩定模擬
推論8:在行業發展初期設立基礎性監管規范框架,有助于減輕或扼制系統性金融風險的累積程度。同時,隨著預設監管框架強度的提高,其穩定行業后期發展的效果隨之提升。
政策啟示:P2P 行業前期的監管缺位助長了平臺的野蠻生長,在一定程度上導致系統性金融風險的過度累積。新興金融模式的監管政策制定應從中吸取并總結經驗教訓,嘗試在行業發展的初期預設基礎性的監管規范框架,盡早遏制行業參與者的部分不規范行為,避免行業盲目擴張,穩定行業后期發展。
根據上述分析,達到C 時期的監管強度后,模型穩定解(映射)會隨著后續時期監管強度參數的調整而變化。在監管內容(范疇)隨著行業發展持續追蹤與更新的前提下,依照C時期之后監管方對強度參數的不同選擇,監管與平臺雙方的博弈狀態會出現三種不同情形的遷移結果(模型穩定解)。
情形1:假設監管強度維持不變,博弈雙方在C時期達到演化穩定均衡狀態。
情形2:假設監管強度持續增強,部分企業可能會在逐步嚴苛的行業生態環境中喪失盈利能力,退出市場。
情形3:假設監管強度減弱。監管強度隨著合規經營平臺數量的增加而不斷松弛,則博弈雙方的狀態會從C 時期向D 時期轉移,并且隨著監管強度的進一步下降繼而從D 時期向A 時期轉移。因此,雙方的博弈狀態將會陷入從A時期—B時期—C時期—D時期—A時期的循環中。
為了金融市場的穩定以及行業風險的管控,監管的內容需要隨著行業的發展不斷更新,但監管強度不能從強至弱逆向變化。在現實中,針對某項金融產品、服務或市場的監管體系建設與完善理應是一個單向的、不可逆的過程。因此,監管機構與P2P 平臺在C 時期(規范期)達到演化穩定均衡是一個占優狀態(即情形1優于情形2和情形3),本文將該時期的監管強度定義為“穩定強度值”。
推論9:在監管達到“穩定強度值”(規范期強度)之后,監管方仍然保持強度穩定的監管狀態有助于維持監管成果。
政策啟示:理想的監管強度變化應該是逐步增加至“穩定強度值”并保持穩定的。如果監管強度由強至弱逆向波動,則會拉長監管方與平臺方之間的交手回合與博弈周期,不利于維持穩定的監管局勢。
由前述博弈模型的假設條件和求解結果可得,不同類型P2P 平臺策略變化的臨界值()不同。由()=(--R-+)/(1-),=1,2,3,推導可得三個不同類型P2P平臺策略轉換臨界值的次序為(1)<(2)<(3),即第一類平臺最早選擇合規經營策略,第二類平臺晚于第一類平臺選擇合規經營策略,第三類平臺最晚選擇合規經營策略。換言之,在相同監管強度參數的作用下,不同類型的P2P平臺選擇進入合規經營狀態的時點不同。因此,不同類型平臺具有差異性的穩定均衡狀態作用效果:第一類平臺在均衡狀態(C 時期/規范期)的穩定范圍(比例)最大,第二類平臺的穩定范圍(比例)略小于第一類平臺,第三類平臺的穩定范圍(比例)最小。3類P2P平臺的策略均衡狀態如圖9所示。

圖9 3類P2P平臺策略均衡狀態
假設當(0 <≤1)比例的第三類平臺進入C 時期時,行業市場中的平臺數量達到飽和(均衡)狀態,意味著有比例的第三類平臺可在C 時期達到穩定均衡狀態。如果假設比例的第三類平臺進行策略 轉 換 的 臨 界 值 為x(3)=[--(1/)-+]/(1-),并 且 滿 足 條 件>>(1/)>,那么可推導得知(1)<(2)<x(3)<(3)。因此,依據的不同情況會出現三種情形,如圖10所示。
情形:若≈0,則幾乎所有第三類平臺都無法達到C時期的穩定均衡狀態。
監管強度建議:監管方的最高“穩定強度值”為第二類平臺的策略轉換臨界值(2)。
情形:若0 <<1,則有比例的第三類平臺進入合規經營狀態并在C時期達到穩定均衡,有1-比例的第三類平臺被清退轉型。
監管強度建議:監管方的最高“穩定強度值”為比例的第三類平臺進行策略轉換的臨界值x(3)。
情形:若=1,則第三類平臺可全部進入合規經營狀態并在C時期達到穩定均衡。
監管強度建議:監管方的最高“穩定強度值”為第三類平臺策略轉換的臨界值(3)。

圖10 最高“穩定強度值”分類分析
從理論上講,監管強度在超越最高“穩定強度值”后的持續增強缺乏現實意義。一方面,監管強度的提升已無法使更多數量的平臺合規經營;另一方面,會導致已選擇合規經營的平臺隨著監管壓力和運營成本提升而退出市場,行業市場活力下降。鑒于此,監管方可嘗試采取“規范/功能+考核”的多層監管模式來平衡監管效用與公平。
推論10:監管政策在內容上一視同仁,同時在形式和功能角度注重識別行業群體特征的“規范/功能+考核”多層治理模式,有助于在兼顧政策公平性的前提下,維持市場活力、提升監管效用。
政策啟示:政策的公平性是監管政策制訂的重要原則。在運營實踐中,不同類型企業對監管政策強度的變化具有不同的策略反應。一方面,監管方可考慮設置“規范+考核”監管形式,在監管內容上采取“一刀切”的規范要求,針對企業是否符合規范要求分別設置不同的考核形式,例如對不合格的企業適當采取延長考核期、增加監管強度等措施;另一方面,監管方可考慮采取“功能+考核”監管形式,區分具體的功能“事項”(如風險管理、資質管理等模塊)而非監管“個體”本身,并針對企業已達標與未達標的功能事項分別設置不同的考核形式,以兼顧公平性的同時提高監管的有效性。
本文聚焦P2P行業監管發展歷程的經驗與教訓,針對監管政策調整環境下不同類型平臺的異質性市場表現問題。首先,刻畫了監管方與平臺方之間的多階段動態博弈關系,并通過P2P 行業真實市場表現數據佐證了模型推論;其次,模擬推演了“監管方—平臺方”之間決策效用的動態優化路徑,并以此為基礎分析了新興金融創新模式監管政策體系建設過程的動態調整依據及規律。結果顯示:不同資本類型的P2P 平臺應對監管強度的變化具有異質性策略反應;此外,監管方在行業發展初期設立基礎性監管規范框架,有助于縮減行業系統性金融風險的累積周期與程度;監管方在行業發展后期保持“穩定強度值”的監管狀態有助于維持監管成果;監管政策的多層次治理模式,有助于兼顧政策公平性的同時提升監管效用。以此為依據,本文從事前風險防范、事中風險管控、事后風險處置和分析的視角為新興互聯網金融模式創新提出監管政策建議。
首先,事前風險防范角度。P2P行業前期監管政策的缺失以及監管方對新興金融模式發展的寬容態度,造成了行業系統性金融風險的過度累積,進而導致了行業發展后期積重難返的不良局勢。監管部門前松后緊的監管強度,使得參與者對行業的發展期望偏離了穩定預期,拉長了監管方與平臺方之間的博弈進程與交手回合,對行業的平穩發展造成了不必要的損害。因此,監管機構在對未來相關領域金融創新的監管規范中,可從以下兩個方面入手提升監管效率和效果:第一,建立嚴格準入門檻、設立試運行期考核制度。監管部門應從行業發展初期開始制定嚴格的行業準入門檻、合規標準與考核機制,使得新進企業在有效的監管框架下理性與規范發展,防止企業性的違規問題累積成為系統性的金融市場風險。第二,預先設立基礎性監管規范框架,降低系統性金融風險累積的絕對值。P2P 行業前期的監管空白助推了系統性金融風險的過度累積。監管方可由此總結經驗,參考相關成熟行業監管體系的基礎性條款,在新興金融創新模式發展初期預先設定一個基礎性的監管規范框架,包括但不限于企業資質認定、運營規范、信用制度、信息披露、數據與信息管理、消費者權益保護等方面的基本監管原則。在建立硬性約束的同時釋放監管態度,引導行業參與者將期望收益鎖定在合理合規范圍內,抑制行業的無序擴張,縮減行業系統性金融風險的累積周期與程度。
其次,事中風險管控的角度。監管機構“一刀切”的做法忽略了不同類型P2P平臺對監管政策的異質性反應。監管方實現對行業風險的精細管理、精準打擊、有效管控,需要有效識別影響不同類型個體或群體策略選擇的關鍵因素,但同時也需要審慎考慮政策的公平性問題。第一,設置“規范+考核”機制。在監管內容一視同仁的基礎上,將監管形式細化為規范階段和考核階段,以提升監管的精準性與有效性。一方面,在達到規范階段標準后進一步設置考核要求,考核合格的平臺方可正常運營,對考核不合格的平臺則適當采取延長考核期限、加強監管力度等措施;另一方面,建立動態積分考核辦法,并依據企業表現定期進行積分更新與等級評定:對達到一定級次的企業逐步放開業務運作范圍;對未達到考核標準的企業及時警示和規范,同時對超越調整期限仍未達標的企業及時進行整改、清退。第二,注重“功能+考核”監管模式。將監管內容細化分為風險管理、經營管理、資質管理等具體的功能事項,并設置相應的功能標準,區分企業已達標和未達標的功能事項分別設置不同的考核措施。由于現實中被監管主體的特征并不是單一的,監管方采取區別監管“事項”而非監管“個體本身”的功能事項監管形式,既方便實操標準的設置,又有助于避免歧視,促進行業整體的規范發展。第三,建立多維度監管體系,降低行業整體風險。一方面,利用行業自律組織等方式約束行業參與者的違法違規行為,提高企業自律意識,促進行業的長久健康發展;另一方面,除了對投資人、金融產品等進行風險評估與等級劃分外,還應加強對行業內企業的風險評級管理,作為投資人從企業層面辨識投資風險的參考依據。此外,引入數字經濟情景下的互聯網監管科技手段來輔助監管的動態調控,提升監管方對行業風險的把控能力與監管效率。
最后,事后風險處置與分析角度。完整的新興金融創新模式監管體系的內容建設,理應包含對風險事后處置問題的考量。例如,監管方采取措施強制高風險平臺進入破產接管、清算等程序,并對此過程進行持續地監督,及時撤銷對風險企業的業務授權,同時針對具體情況發布監管聲明(內容包括但不限于主要風險警示、后續安排及監管措施等),以防止既定風險損失的不斷擴大。另外,監管方、業界與學術界應注重對以往金融創新模式的經驗教訓進行分析與總結,并以此為鑒,將對行業監管體系的改進與完善滲透在行業發展的全過程之中。
平臺在特定時期經營行為的界定不僅涉及“是否違規”問題,在其被界定為違規的同時,也存在著“違規程度”的細分問題。然而,由于監管政策需要依據市場運行現狀而靈活調整、不斷發展,很難在這樣一個動態推演的過程中同時找到兩個基準,能夠界定平臺某階段行為是否違規的同時,在其違規程度的測度上也具有一致性的標準。這意味著,基于本文研究內容所設定的監管時期動態推演的分析框架,對“違規程度”問題的測度更容易因為監管政策的變化而產生爭議,也更容易因為同一行為在“當期”與“后期”規范標準上的不一致而產生界定差異問題。例如,某特定平臺在2015 年的合規行為置于2020 年的監管框架下有可能會被界定為嚴重違規行為。因此,本文研究選擇“是否違規”這一基準來描述平臺策略空間的最基本規律。后續研究可以從博弈方法論的角度,基于對“違規程度”的細分,針對特定時點違規行為的當期和后期界定差異如何影響動態博弈結果這一問題展開進一步的探索與討論。同時,雖然在強監管的作用下大部分P2P 平臺退出了市場,但仍有小部分平臺成功實現了轉型,轉型方向有網絡小額貸款或消費金融公司等。未來研究可嘗試基于行業轉型發展路徑分析這些平臺轉型成功的原因及其對行業的影響。