韓景倜 陳群



摘要:本文在博弈雙方收益大小不完全確定的框架下,基于演化博弈的思想并考慮P2P網貸平臺與政府監管兩大博弈群體的有限理性特征,建立不完全信息P2P網絡借貸行業中平臺與政府兩大群體非對稱演化博弈的動態復制系統,分析系統在不同情形下的演化穩定狀態,以期為P2P網貸行業運營與監管的長期演化趨勢做出更為真實和準確的預測。研究表明:在不同的參數取值條件下,隨著對方行為策略的不斷調整,系統將趨向于不同的均衡狀態或周期振蕩狀態,此結論可為P2P行業監管部門監管政策與獎懲機制的設計提供一定依據。
關鍵詞:P2P;網絡借貸;博弈;有限理性
中圖分類號:F83文獻標識碼:A
一、引言
在由美國次債引發的國際金融風暴的背景下,傳統金融機構融資低迷的同時以Prosper & Lending Club為代表的P2P網貸業務發展迅速。作為金融創新的一種模式,P2P網絡借貸為調節信貸市場的供需失衡提供了新途徑。P2P網貸短周期、高利率的特點得到投資者的廣泛青睞,無抵押的貸款模式也吸引了眾多因信用狀況不佳而被銀行拒之門外的中低收入人群[1]。相較于傳統的銀行貸款形式,P2P網貸具有三大特點:借款人的每一筆貸款可以有多個投資者、投資者的行為會受到其他投資者的行為影響,且投資者不具備甄別借款人信用的能力[2]。Herzenstein et al.[3]、Yum et al.[4]等學者的研究均表明在P2P網絡借貸中投資者并不是完全理性的,投資者在進行投資決策的過程中存在相互模仿的羊群效應。Zhang & Liu在Herzenstein研究的基礎上進一步證實了投資者的羊群行為是理性的。由信息不對稱造成的逆向選擇[5]問題在P2P行業中尤為突出[6],很多學者用實證的方法研究了借款人提供的軟信息對網絡借貸成功率、借貸利率以及違約率的影響[7]。為解決信息不對稱問題,還有學者通過挖掘借款人的朋友、團隊等社交網絡關系來甄別借款人的信譽質量。Chen[8]等利用785個拍拍貸的在線出借人數據探究了哪些因素驅動了出借人對貸款者的信任。
相較于國外,國內部分學者也開展了P2P網貸平臺的實證研究。李焰等[9]研究了借款人描述性信息對投資人決策的影響,研究發現描述性信息中包含的不同特征對投資人決策的影響不同,表明自己是穩定的更有助于成功借款。廖理等[10]基于人人貸平臺數據發現我國信貸市場中的投資者具有良好的風險判斷能力,投資者能夠借助借款人的公開信息識別相同利率背后所包含的不同違約風險。王會娟和廖理[11]從信息不對稱的理論框架出發,研究網絡借貸平臺的信用認證機制對借貸行為的影響。莊雷和周勤[12] 研究了P2P網絡借貸平臺的身份歧視現象。國內較多學者對P2P網貸行業中凸顯的監管缺失問題進行關注,這與P2P平臺在我國的發展緊密相關。繼2007年我國第一家網貸公司上線以來,出借人的缺乏、壞賬的攀升、還本退息的承諾,增大了P2P平臺資金鏈斷裂的危機,P2P平臺跑路事件頻發。2011年7月,哈哈貸因市場信用問題、運營資金短缺等原因宣布關閉,其“善后”方案僅僅是墊付截至8月20日借出者的未收回款。后有貝爾創投、淘金貸、融宜寶、尤易網等多個網貸平臺頻繁出現風險的事件,涉及金額數千萬元。2013年,東方創投、家家貸、力合創投等15家P2P公司相繼倒閉,“福翔創投”的網貸平臺更是創造了開業不到3天即“跑路”的最短“跑路史”。2014年,國臨創投、富豪創投出現提現困難。同年,國內首家擁有“擔保”背景的旺旺貸平臺跑路,卷走資金700萬元。
P2P平臺的倒閉潮對金融監管體系與腐敗防治體系提出了巨大挑戰,成為了2015 年兩會的熱點話題,促使央行出臺對互聯網金融進行適度監管的新措施。我國P2P網貸行業中凸顯的監管缺失問題不僅受到了政界的巨大關注,也引起了國內學者的研究熱情。很多學者從理論層面展開了論述分析,為P2P行業的監管提出了合理可行的建議。也有少數學者采用博弈論的方法對P2P網貸行業的監管問題進行了有益的探索與研究。帥青紅[13]構建了監管機構與P2P網絡借貸公司的靜態博弈模型,在完全理性的前提下分析了監管機構與P2P網絡借貸公司雙方的最優效用,研究了監管機構與被監管公司的博弈策略。宮曉林[14]在系統支付矩陣收益完全確定的條件下,運用前景理論和演化博弈論分析了P2P平臺的主要風險,探討了政府、P2P網絡借貸平臺和貸款人這三大網絡借貸利益相關方的策略選擇論述了政府監管的必要性。當前基于經濟學模型對P2P網貸行業監管問題的研究有待深入探討。鄒輝霞和劉義[15] 將信號傳遞博弈模型引入到P2P 網絡借貸行為的研究當中,分析小微企業和出借方在追求各自利益最大化的前提下達到雙方利益均衡的博弈過程。
當前相關研究一般假定博弈雙方收益大小是完全確定的,而忽略了博弈雙方收益大小不完全確定的現實情況。因此,本文在博弈雙方收益大小不完全確定的框架下,考慮P2P網貸平臺與政府兩大博弈群體的有限理性特征,基于演化博弈的思想建立P2P網貸平臺選擇合規運營與違規運營、政府對P2P網貸平臺強監管與弱監管各自兩種策略的非對稱動態復制系統。收益大小不完全確定的條件給系統動態博弈穩定性的分析帶來了困難,通過分析不同的參數取值條件,我們解析了系統在九種不種的參數取值情形下的演化穩定狀態,為P2P網貸行業運營與監管的長期演化趨勢做出更為真實和準確的預測,為監管部門監管政策與約束機制的設計提供參考。
二、 模型參數說明
博弈方為兩類群體:一方為P2P網貸平臺,另一方為監管官員。在P2P網貸平臺與監管官員反復博弈的演化過程中,博弈雙方具有有限理性特征,雖無事先預測能力但有事后判斷能力。當博弈方在所得利益較差時遲早會發現改變策略才能對自己更有利,并開始模仿另一種策略的博弈方。因此,博弈雙方的策略選擇是一個動態演化的過程,在P2P網貸平臺與和監管官員兩大群體成員隨機配對反復博弈的演化過程中,博弈雙方的行為都是在不斷調整和改進的,即博弈雙方的策略類型比例均是隨時間動態變化的。
為分析P2P網貸平臺與監管機構官員群體成員通過模仿學習向優勢策略轉變的漸進過程,探討系統演化的均衡點及其穩定性,本文作了如下假設:假設每次博弈都由監管官員與P2P網絡借貸平臺隨機配對進行,P2P網貸平臺的行為集為(合規運營,違規運營),監管官員的行為集為(強監管,弱監管);假設在強監管力度下,違規運營的P2P網貸平臺一定能被政府官員發現。而在弱監管力度下,違規運營的P2P網貸平臺有一定概率被媒體曝光。
模型中使用的符號及說明見表1。
三、 P2P網貸平臺和政府監管演化博弈支付矩陣構建
本文在由P2P網貸平臺和監管官員兩大類有限理性博弈方組成的群體成員隨機配對反復博弈的分析框架內分析該博弈。基于上一節的假設,分析雙方的收益:當監管官員選擇強監管時,P2P網貸平臺在合規運營的效用為Μ-cH,違規運營的效用為N-cL-Ζ;當監管官員選擇弱監管時,P2P網貸平臺在合規運營的效用仍為Μ-cH,而選擇違規運營則可能被媒體曝光,其得到的效用為N-cL-θΖ。
分析監管官員的效用值:當P2P網貸平臺合規運營時,此時監管官員選擇強監管的效用值為S+-ωH,選擇弱監管的效用值為-ωL;當P2P網貸平臺違規運營,此時監管官員選擇強監管時的效用值仍為S++ΔS-ωH,選擇弱監管時官員的效用值為-ωL-θS。綜上,可以得出P2P網貸平臺和政府官員在不同策略選擇下的支付矩陣如表2所示。
代表P2P網貸平臺在有θ概率被媒體曝光的可能性下,違規運營相較于合規運營的差額效用,該差額效用與違規運營被媒體曝光的概率θ負相關;ΔZ代表在政府官員采取強監管力度時,P2P網貸平臺違規運營相較于合規運營的差額效用;ΔP代表當P2P網貸平臺采取違規運營策略時,監管官員選擇強監管相較于弱監管的差額效用;ΔQ代表當P2P網貸平臺采取合規運營策略時,監管官員選擇強監管相較于弱監管的差額效用,且存在ΔR>ΔZ,ΔP>ΔQ。
情形一:ΔZ>0且ΔQ>0
此種情形表示:①不管監管官員采取何種監管策略,P2P網貸平臺違規運營的效用始終比合規運營的效用高;②P2P網貸平臺選擇合規運營時,監管官員選擇強監管的效用大于弱監管效用。此時系統4個穩定狀態的穩定性分析見表4。
從表4分析可知,(0,1)是系統的演化穩定策略,即P2P網貸平臺的策略選擇將全部趨向于違規運營,同時監管官員的行為將全部趨向于強監管。這說明,監管官員努力監管得到的激勵較高,因而會采取強監管策略。但同時不管官員采取何種行為策略,P2P網貸平臺采用合規經營策略的效用始終要低于違規經營的效用,因此違規運營將成為P2P網貸平臺群體的理性選擇。
此種情形表示:①P2P網貸平臺在有θ概率被媒體曝光的可能性下,違規運營的效用高于合規運營的效用,但是在監管官員采取強監管力度的條件下,P2P網貸平臺違規運營的效用低于合規運營的效用;②P2P網貸平臺選擇合規運營時,監管官員選擇強監管的效用大于弱監管效用。系統4個穩定狀態的穩定性分析見表5。
從表5分析可知,(1,1)是系統的演化穩定策略,即P2P網貸平臺的策略選擇將全部趨向于合規運營,同時監管官員的行為將全部趨向于強監管。這說明,監管官員努力監管得到的激勵較高,因而會采取強監管策略,但同時在官員的這種行為策略下,P2P網貸平臺采用違規經營策略的效用要小于合規經營的效用,因此合規運營將成為P2P網貸平臺群體的理性選擇。
情形三:ΔR<0且ΔQ>0
此種情形表示:①不管監管官員采取何種行為策略,P2P網貸平臺選擇違規運營的效用始終低于合規運營的效用;②P2P網貸平臺選擇合規運營時,監管官員選擇強監管的效用大于弱監管效用。系統4個穩定狀態的穩定性分析見表6。
從表6分析可知,(1,1)是系統的演化穩定策略,即P2P網貸平臺的策略選擇將全部趨向于合規運營,同時監管官員的行為將全部趨向于強監管。這說明,監管官員努力監管得到的激勵較高,因而會采取強監管策略。但同時對于P2P網貸平臺而言,不管監管官員采取何種行為策略,P2P網貸平臺選擇違規運營的效用始終低于合規運營的效用,因此合規運營將成為P2P網貸平臺群體的理性選擇。
情形四:ΔZ>0且ΔQ<0<ΔP
此種情形表示:①不管監管官員采取何種監管策略,P2P網貸平臺違規運營的效用始終比合規運營的效用高;②P2P網貸平臺選擇合規運營時,監管官員由于沒有額外的獎勵致使其選擇強監管的效用低于弱監管,而當P2P網貸平臺采取違規運營被監管官員發現時,監管官員因為有額外的獎勵、社會對官員認可度致使其選擇強監管的效用高于弱監管。系統4個穩定狀態的穩定性分析見表7。
從表7分析可知,(0,1)是系統的演化穩定策略,即P2P網貸平臺的策略選擇將全部趨向于違規運營,同時監管官員的行為將全部趨向于強監管。這說明,P2P網貸平臺違規運營的效用比合規運營的效用高,因而會采取違規運營策略。但同時而當P2P網貸平臺采取違規運營一定會被監管官員發現,此時監管官員因為有額外的獎勵、社會對官員認可度致使其選擇強監管的效用高于弱監管,因此強監管將成為監管官員群體的理性選擇。
情形五:ΔZ<0<ΔR且ΔQ<0<ΔP
此種情形表示:① P2P網貸平臺在有θ概率被媒體曝光的可能性下,違規運營的效用高于合規運營的效用,但是在監管官員采取強監管力度的條件下,P2P網貸平臺違規運營的效用低于合規運營的效用;② P2P網貸平臺選擇合規運營時,監管官員由于沒有額外的獎勵致使其選擇強監管的效用低于弱監管,而當P2P網貸平臺采取違規運營被監管官員發現時,監管官員因為有額外的獎勵、社會對官員認可度致使其選擇強監管的效用高于弱監管。系統4個穩定狀態的穩定性分析見表8。
從表8分析可知,所有的穩定狀態都不是系統的演化穩定策略,這說明這種情形下P2P網貸平臺群體與監管官員群體無法趨向于一個穩定點,整個系統處于周期振蕩狀態。
情形六:ΔR<0且ΔQ<0<ΔP
此種情形表示:①不管監管官員采取何種行為策略,P2P網貸平臺選擇違規運營的效用始終低于合規運營的效用;② P2P網貸平臺選擇合規運營時,監管官員由于沒有額外的獎勵致使其選擇強監管的效用低于弱監管,而當P2P網貸平臺采取違規運營被監管官員發現時,監管官員因為有額外的獎勵、社會對官員認可度致使其選擇強監管的效用高于弱監管。系統4個穩定狀態的穩定性分析見表9。
從表9分析可知,(1,0)是系統的演化穩定策略,即P2P網貸平臺的策略選擇將全部趨向于合規運營,同時監管官員的行為將全部趨向于弱監管。這說明,P2P網貸平臺違規運營的效用比合規運營的效用低,因而會采取合規運營策略。但同時而當P2P網貸平臺采取合規運營時,監管官員由于沒有額外的獎勵致使其選擇強監管的效用低于弱監管,因此弱監管將成為監管官員群體的理性選擇。
情形七:ΔZ>0且ΔP<0
此種情形表示:①不管監管官員采取何種監管策略,P2P網貸平臺違規運營的效用始終比合規運營的效用高;②不管P2P網貸平臺采取何種運營行為,監管官員選擇強監管的效用始終低于弱監管的效用。系統4個穩定狀態的穩定性分析見表10。
從表10分析可知,(0,0)是系統的演化穩定策略,即P2P網貸平臺的策略選擇將全部趨向于違規運營,同時監管官員的行為將全部趨向于弱監管。此時市場將是一個不誠信的失敗狀態。這說明,P2P網貸平臺違規運營的效用比合規運營的效用高,因而會采取違規運營策略。但同時監管官員選擇強監管的效用始終低于弱監管,因此弱監管將成為監管官員群體的理性選擇。
情形八:ΔZ<0<ΔR且ΔP<0
此種情形表示:① P2P網貸平臺在有θ概率被媒體曝光的可能性下,違規運營的效用高于合規運營的效用,但是在監管官員采取強監管力度的條件下,P2P網貸平臺違規運營的效用低于合規運營的效用;②不管P2P網貸平臺采取何種運營行為,監管官員選擇強監管的效用始終低于弱監管的效用。系統4個穩定狀態的穩定性分析見表11。
從表11分析可知,(0,0)是系統的演化穩定策略,即P2P網貸平臺的策略選擇將全部趨向于違規運營,同時監管官員的行為將全部趨向于弱監管。由于監管官員選擇強監管的效用始終低于弱監管,因此弱監管將成為監管官員群體的理性選擇。而當監管官員采取弱監管時,P2P網貸平臺在有θ概率被媒體曝光的可能性下,違規運營的效用高于合規運營的效用,因而采取違規運營策略將成為P2P網貸平臺的理性選擇。
情形九:ΔR<0且ΔP<0
此種情形表示:①不管監管官員采取何種行為策略,P2P網貸平臺選擇違規運營的效用始終低于合規運營的效用;②不管P2P網貸平臺采取何種運營行為,監管官員選擇強監管的效用始終低于弱監管的效用。系統4個穩定狀態的穩定性分析見表12。
從表12分析可知,(1,0)是系統的演化穩定策略,即P2P網貸平臺的策略選擇將全部趨向于合規運營,同時監管官員的行為將全部趨向于弱監管。這說明,P2P網貸平臺選擇違規運營的效用始終低于合規運營的效用,同時監管官員選擇強監管的效用始終低于弱監管,因此合規運營、弱監管將分別成為P2P網貸平臺與監管官員群體的理性選擇。
五、 總結與展望
P2P網貸平臺運營與監管的均衡狀態是由P2P網貸平臺與監管官員的行為共同決定的。 P2P網貸平臺與監管官員有著各自的效用函數和策略空間,在P2P網貸平臺與和監管官員兩大群體成員隨機配對反復博弈的演化過程中,博弈雙方的行為在不斷調整和改進。本文在P2P網貸平臺運營與監管博弈支付矩陣中各方收益大小不完全確定的框架下,分析了9種情形下系統穩定狀態的演化穩定性。綜合這9種不同的參數取值條件的分析,本文將監管部門的兩個決策參數(強監管力度下監管部門給官員的正向激勵效用,以及政府對違規運營網貸平臺的懲罰)對系統演化穩定策略的影響進行了歸納,如表13所示。
從表13可看出,在強監管力度下政府官員可得到的正向激勵效用,以及違規運營的網貸平臺被政府發現所遭受的效用損失對系統演化起著至關重要的作用。在不同的參數取值條件下,隨著對方行為策略的不斷調整,系統將趨向于四種不同的均衡狀態或進行周期振蕩狀態。
參考文獻:
[1]Livingston L S. could peer to peer loans substitute for payday loans?[J].Accounting & Taxation,2012,4(2): 77-92.
[2]Juanjuan Zhang P L. Rational Herding in Microloan Markets[J].Management Science,2012,5(58): 892-912.
[3]Herzenstein M,Dholakia U M,Andrews R L. Strategic Herding Behavior in Peer-to-Peer Loan Auctions[J].Journal of Interactive Marketing,2011,25(1): 27-36.
[4]Yum H,Lee B,Chae M. From the wisdom of crowds to my own judgment in microfinance through online peer-to-peer lending platforms[J].Electronic Commerce Research and Applications,2012,11(5): 469-483.
[5]Spence M. signaling in retrospect and the informational structure of markets[J].Amer. Econom. Rev,2002,92(3): 434-459.
[6]Mingfeng Lin N R P S. Judging Borrowers by the Company They Keep: Friendship Networks and Information Asymmetry in Online Peer-to-Peer Lending[J].Management Science,2013,1(59).
[7]Gonzalez L,Loureiro Y K. When can a photo increase credit? The impact of lender and borrower profiles on online peer-to-peer loans[J].Journal of Behavioral and Experimental Finance,2014,2:44-58.
[8]Dongyu Chen F L Z L. A trust model for online peer-to-peer lending: a lenders perspective[J].Information Technology and Management,2014,15(4): 239-254.
[9]李焰,高弋君,李珍妮,等.借款人描述性信息對投資人決策的影響——基于P2P網絡借貸平臺的分析[J].經濟研究,2014(S1): 143-155.
[10]廖理,李夢然,王正位. 聰明的投資者:非完全市場化利率與風險識別——來自P2P網絡借貸的證據[J].經濟研究,2014(7):125-137.
[11]王會娟,廖理. 中國P2P網絡借貸平臺信用認證機制研究——來自“人人貸”的經驗證據[J].中國工業經濟,2014(4):136-147.
[12]莊雷,周勤. 身份歧視:互聯網金融創新效率研究——基于P2P網絡借貸[J].經濟管理,2015(4): 136-147.
[13]帥青紅. P2P網絡借貸監管的博弈分析[J].四川大學學報:哲學社會科學版,2014(4):133-148.
[14]宮曉林. P2P網絡借貸風險與監管——基于有限理性假設的分析[J].投資研究,2014(6): 29-40.
[15]鄒輝霞,劉義.P2P網絡借貸模式下的小微企業融資問題研究[J].商業研究,2015(2): 1-7.
Abstract:Using the framework in which both utility are not completely determined, and considering limited rationality characteristics of P2P lending platform and government supervision, the paper establishes non symmetric evolutionary game dynamic replication system of incomplete P2P lending platform and government based on Evolutionary Game Theory. Then it analyzes and explains the system′s evolutionary stable state under different circumstances, which can make accurate prediction of the long-term evolution trend for government supervision. Research shows that, with the adjustment of the opponent′s behavior strategies, the system will tend to different equilibrium state or periodic oscillation state under different parameter conditions. The research conclusion can provide certain basis of reward and punishment mechanisms for the government.
Key words:Peer to Peer; network lending; game; limited rationality
(責任編輯:李江)