


摘要:如何在P2P網絡借貸中實現收益和風險的最優化組合是投資者關注的核心問題。本文將投資者的投資組合最優化決策轉化為在一定預期收益率下的風險最小化問題,利用核回歸刻畫歷史貸款與新貸款的相似度,以相似度為基礎構建實例模型,支持投資者進行投資組合的最優化決策;進而以在線網絡借貸平臺人人貸2015年散標交易數據為樣本,對使用實例模型的可行性進行實證研究,結果表明,實例模型表現出良好的預測能力,有助于P2P借貸平臺的投資者進行投資組合的最優化決策。
關鍵詞:網絡借貸;實例模型;投資組合;最優化
中圖分類號:F83 文獻標識碼:A
作者簡介:譚袁月(1995-),女,河南漯河人,東北財經大學金融學院研究生,研究方向:互聯網金融。
P2P互聯網借貸(Peer-to-Peer Lending)是一種將投資者的資金聚集起來直接貸給資金需求者的借貸方式。與傳統的銀行借貸不同,P2P網絡借貸不需要第三方中介參與,借貸雙方直接交易。在P2P網絡借貸中,借款者在網絡平臺上提交貸款申請,標明貸款額度及愿意支付的最高利率,投資者對感興趣的貸款投標,若貸款額度在規定時間內被投滿,借貸關系形成。為了降低投資風險,投資者往往選擇分散、小額投資的方式。由此,投資者如何在不同貸款間分配投資金額,在實現預期收益的同時最小化風險尤為重要。
一直以來,P2P貸款的投資決策多依據評級模型(Rating-based model),評級模型根據風險水平不同將貸款分為七個等級,每個等級貸款風險水平和收益率相同。投資者可根據網絡借貸平臺給出的評級估計新貸款的收益率和風險水平。但這種等級劃分比較粗糙,每個等級中包含貸款較多,無法體現出同級貸款間的差別,所以投資者僅根據評級模型難以做出選擇。與評級模型不同,實例模型(Instance-based model)根據歷史貸款和新貸款分別發生逾期的概率,通過核回歸確定歷史貸款和新貸款的相似度,對不同歷史貸款賦予不同的相對權重,以相似度為基礎預測每筆新貸款的收益率和風險水平。相較于評級模型,實例模型預測新貸款的收益率和風險水平精確度較高,進一步優化了投資組合。本文以人人貸網站2015年散標交易數據為數據集進行實證,驗證實例模型對投資者進行投資組合最優化決策中的作用。
一、文獻綜述
P2P網貸是一種基于互聯網的新興商業模式,對于借款者而言,小額度的資金聚集起來借給有資金需求的人群,提高了金融效率(Berger & Gleisner,2009)[1]。對于投資者而言,將有限的資金分散投資給不同的資金需求者,旨在追求較高的收益率和較低的風險水平。由于P2P貸款大多數不需實物抵押且借款者背景復雜,所以投資者在確定投資組合時,如何較為準確地預測新貸款的收益率和風險水平至關重要。張正平和胡夏露(2013)分析了拍拍貸和宜信的運營模式,并根據青島地區的網貸平臺多采用抵押的特點,提出了青島模式[2]。但是,國內大多數P2P網貸平臺均不需借款者提供實物抵押,例如國內主要網絡借貸平臺宜人貸、拍拍貸、安心貸、紅嶺創投、宜農貸等。大多數的網絡借貸平臺不以實物抵押形式發起借貸行為,可能增大投資者的投資風險,投資者如何進行投資決策成為眾多學者關注的問題。
國內學者多將P2P網絡借貸平臺上的單筆貸款投資決策作為研究對象。陳冬宇(2014)從投資者的角度構建P2P放貸行為模型。通過實證分析,發現投資人的風險偏好、借款請求信息完整度、借款人的社會資本及網絡借貸平臺的整體逾期率是影響投資者單筆投資決策的關鍵因素[3]。郭艷紅等(2016)從投資者歷史投資的收益率、風險偏好以及投資經驗三個維度構建投資者檔案,輔助投資者進行單筆投資決策,并以美國P2P網絡借貸平臺Prosper交易數據進行實證研究[4]。鮮有學者對P2P網絡借貸中投資者的投資組合決策進行相關研究。
在P2P網絡借貸中,投資決策風險有多種評估方法。徐喆(2015)采用邏輯回歸法研究影響貸款逾期的主要因素,進而預測貸款的風險水平[5]。與邏輯回歸法的效果相同,Puro & Teith(2009)通過貸款投標次數的多少衡量貸款相似度,構建了一個可根據新貸款的投標次數尋找過去相似貸款,并以此為依據來預測新貸款償還情況的模型[6]。這一思路為本文研究提供了基礎思路,歷史貸款與新貸款的相似度是下文構建實例模型的關鍵。但是,Puro & Teith的模型只關注與新貸款相似度較高的歷史貸款,考慮到高相似度會導致樣本容量較小,此類模型預測誤差較大。所以本文將相似度定義為貸款間發生逾期的概率的相對距離,采用核回歸[7],根據相似度大小對一定時期內所有歷史貸款賦予不同的相對權重,歷史貸款相對權重的大小取決于相似度的高低,從而顯著擴大樣本容量,解決在樣本量較少的情況下預測精確度較低的問題。
Guo & Luo(2015)運用實例模型預測貸款的收益率和風險水平,并采用美國網絡借貸平臺Prosper數據進行實證研究,證明了實例模型在預測貸款收益率和風險水平上精確度較高[8]。本文在該研究的基礎上,采用中國網絡借貸平臺人人貸散標交易數據進行實證研究,進一步驗證實例模型實用的可行性。
二、模型構建
(一)實例模型的基礎思路
在P2P網絡借貸關系中,每個借款者的交易量有限,樣本較少。為了擴大樣本容量,利用核回歸方法,將一定時期內的所有歷史貸款均引入模型,根據歷史貸款與新貸款的相似度的大小,賦予不同的相對權重,對歷史貸款的收益率加權平均以預測新貸款的收益率;并以收益率為基礎,測算新貸款的風險。
相似度以歷史貸款與新貸款發生逾期概率的距離d來衡量,相似度越高,該貸款被賦予的相對權重越大。借鑒徐喆(2015)邏輯回歸的做法,本文選取借款者的信用評分、貸款金額、該借款者在過去六個月中貸款申請次數、借款者的負債—月收入比和借款者的房產擁有情況作為借款人的基本因素,構建歷史貸款發生逾期的概率p和上述基本因素的解釋方程,得出歷史貸款和新貸款發生逾期的概率的估計值:
Zj為借款人的基本因素。其中,Z1j為借款者的信用分數,Z2j為借款者六個月中的借款次數,Z3j為借款金額,Z4j為借款者是否擁有房產(0=沒有,1=有),Z5j為借款者的負債—月收入比。根據該解釋方程可得出歷史貸款j和新貸款i發生逾期的概率的估計值。假設歷史貸款發生逾期的概率為pj(j=1,…,n),新貸款發生逾期的概率為pi(i=1,…,m),二者貸款發生逾期概率的距離為dij,即pi和pj的差的絕對值:
dij越小,說明貸款i和貸款j相似度越高,對應的核權重wij越大。通過核回歸計算出核權重wij,其基本思想如圖1所示,假設共有兩筆歷史貸款L1和L2,需預測貸款L3的收益率和風險水平,首先通過邏輯回歸分別計算出貸款L1、L2和L3發生逾期的概率1、2和3,然后分別計算貸款L1、L2與貸款L3發生逾期的概率的距離,即d13和d23,進而計算出貸款L1和L2的相對權重w13和w23。新貸款的收益率μi由歷史貸款的收益率μj加權平均后計算得出,其中歷史貸款的收益率μj源于歷史貸款的交易利率。考慮到貸款風險與貸款收益率的波動性呈正比關系,收益率波動大,風險就大,反之亦然。因此,貸款的風險以貸款收益率的方差σ2近似量化。
計算出新貸款的收益率μi和風險σi2的估計值后,投資者可根據估計值確定投資組合的期望收益率μ*,將投資組合決策轉化為在一定期望收益率下的風險最小化問題,以確定對每筆貸款的投資比例λi。
(二)實例模型的構建
本文將實例模型分為收益率預測模型和風險預測模型,分別估計出新貸款i的收益率μi和風險水平σi2,進而根據收益率和風險的估計值構建最優化方程組,確定在一定期望收益率μ*下風險最小化的投資組合。
1.收益率預測模型的構建
假設過去有n筆貸款,收益率為μj(j=1,2,…,n),基于實例模型的理論基礎,相似度越高的歷史貸款被賦予的相對權重越大,采用對過去n筆貸款收益率加權平均的方法預測任意給定貸款i的投資收益率μi:
μi=∑nj=1wijμj(3)
歷史貸款j的相對權重wij通過核回歸(Nadaraya, 1965)測算得出,核回歸是一種衡量兩個隨機變量間非線性關系的統計學方法[9]。假設每組觀測值包含兩個變量,預測變量X和反應變量Y,并對n個事例進行觀測,{(xf,yf)|f=1,2,…,n},根據觀測值x得出的y的估計值為:
核回歸中,參數h為核回歸的“帶寬(bandwidth)”,為了提高模型的擬合度,帶寬h需基于訓練數據集H做最優化處理。Clark(1975)提出了舍一交叉驗證最小二乘法[10]。通過最小化交叉驗證誤差計算出帶寬h:
CV(h)=1n∑ni=1(h(x-i)-yi)2(6)
(x-i)為yi的舍一估計值。
為了計算出最優的帶寬h,Silvermen(1986)提出:
h0=(43n)1/5δ(7)
δ是預測變量的標準差,并指出最優h值在0.25h0和1.5h0之間[11]。
通過核回歸計算最優帶寬h時,歷史貸款發生逾期的概率為預測變量,歷史貸款的收益率為反應變量,它們的觀測值表示為{(pj,μj)|j=1,2,…,n}。公式(6)可寫為:
CV(h)=1n∑nj=1∑nk=1,k≠jK(pj-pkh)μj∑nk=1,k≠jK(pj-pkh)-μj2(8)
通過核回歸計算權重wij時,新貸款發生逾期的概率為預測變量,新貸款的收益率為反應變量,它們的觀測值表示為{(pi,μi)|i=1,2,…,m},公式(4)可寫為:
μi=∑nj=1K(pi-pjh)μj∑nj=1K(pi-pjh)(9)
將公式(9)與公式(3)聯立,可計算出權重wij為:
wij=K(pi-pjh)∑nj=1K(pi-pjh)=K(dijh)∑nj=1K(dijh)(10)
上式驗證了與新貸款發生逾期的概率越接近的歷史貸款在預測模型中對應的相對權重wij較大的觀點。
計算出wij后,可根據公式(3)得出貸款i的收益率的值μi。
2. 風險預測模型的構建。新貸款的風險近似處理為歷史貸款收益率的方差:
σi2=∑nj=1wij(μj-μi)2(11)
μi為公式(3)計算出的n筆歷史貸款加權平均數,即貸款i的收益率。
3. 投資組合最優化的決策模型。投資者對P2P網貸平臺上的貸款進行投資時,不僅需要預測并比較貸款發生逾期的概率和收益率,還需要將投資額分散至不同的貸款以實現收益率和風險的最優化組合。所以,投資者在P2P網貸平臺上選取合適貸款進行投資的問題實質為投資組合最優化問題,目的是在一定收益率下最小化投資組合的風險。
∑iλiσi2(12)
s.t.λi0,∑iλi=1,μ*=∑iλiμi(13)
μ*為投資者的期望收益率。λi表示投資者對第i筆貸款的投資額占總投資額M的比例,λi0。P2P網貸平臺規定投資者單筆投資的最小金額為a。同時,投資者對第i筆貸款的投資不能超過貸款需求金額ei。即:
aλiMeiλi=0 otherwise(14)
(三)投資組合最優化的決策過程分析
投資組合最優化過程需要兩個數據集和三個參數。兩個數據集指訓練數據集H和檢驗數據集I。三個參數指最小投資額a、投資者投資總額M、預期收益率μ*。在對數據的初步處理中,可得出訓練數據集H的樣本容量n,單筆貸款的收益率μj。具體過程如下:
(1)根據數據集H,通過邏輯回歸法得出貸款發生逾期的概率p的解釋方程。
(2)i=11+e-(0+1X1i+2x2i+…+pxpi)[] ,通過該公式,估計檢驗數據集I中的貸款i發生逾期的概率。
(3)通過核回歸計算出最優帶寬值h。
(4)計算貸款間發生逾期的概率的距離dij。
(5)通過核回歸計算權重wij。
(6)計算出貸款i的收益率μi和風險水平σi2。
(7)構建投資組合,計算出每筆貸款的投資比重λi。
三、實證結果分析
(一)網站描述及數據選取
本文選取人人貸2015年散標交易數據作為本實證研究的數據集。人人貸網站成立于2010年5月,投資者最小單筆投資額為50元。2015年人人貸平臺處理了超過40萬筆貸款申請,共成交了115 071筆貸款,成交金額為7 518 323 100元,其中逾期貸款占比不足1%。本文選取的數據集包括借款者的信用評分(由人人貸平臺測算)、貸款金額、該借款者在過去六個月中申請貸款的次數、借款者的負債—月收入比和借款者的房產擁有情況。將2015年1月至2015年11月的數據設為訓練數據集H,2015年12月的數據設為檢驗數據集I。
(二)實例模型和評級模型的對比分析
評級模型根據風險不同將貸款分為七個等級(AA、A、B、C、D、E、HR),每個等級的貸款風險水平和收益率相同。實例模型通過貸款間逾期的概率的相似度預測新貸款的收益率和風險水平。為了驗證實例模型是否能夠更準確地估計新貸款的收益率和風險,對兩個模型進行以下對比分析:(1)比較兩個模型的解釋能力,即比較兩個模型的R2和歐幾里得距離;(2)比較通過實例模型和評級模型構建的最優化的投資組合的收益率水平。
(三)實證結果
1. 實例模型和評級模型的解釋能力。分別采用實例模型和評級模型估計數據集I中每筆貸款的收益率μi和風險σi2,計算歐幾里得距離和R2,結果如表1所示,實例模型的R2大于評級模型的R2,實例模型的歐幾里得距離小于評級模型的歐幾里得距離。相較于評級模型,實例模型解釋能力強,對收益率的預測精確度較高。
2.實例模型對投資組合決策的優化。將數據隨機分為5個小組,分別計算根據實例模型和評級模型構建的最優化投資組合的收益率和夏普比率。假設投資總額M=15 000元,預期收益率為μ*=11%,無風險收益率為三年期國債利率2.5%。從表2可看出,雖然在第5組數據中,通過評級模型構建的投資組合收益率略高于通過實例模型構建的投資組合的收益率,但整體來說,實例模型的表現優于評級模型。根據實例模型預測收益率和風險,得出的最優投資組合的實際收益率的平均值高于評級模型,標準差較小,夏普比率明顯較大。說明實例模型預測精確度較高,能更好地幫助投資人進行投資組合決策。
為了驗證實例模型在不同參數組合下的表現,本文設置了10組不同的參數,參數組包含不同的投資總金額M和預期收益率μ*,第10組為前9組的平均值,如表3所示,無風險收益率仍為三年期國債利率2.5%。
在這十組不同參數下,測算分別根據實例模型和評級模型構建投資組合的收益率,結果如圖2所示。在這十組參數下,根據實例模型構建的投資組合收益率均高于通過評級模型構建的投資組合的收益率。
總的來說,實證研究表明,實例模型在預測貸款的收益率和風險方面精確度較高。從而通過最優化方式構建投資組合時,得出的投資組合的收益率水平高于通過評級模型構建的投資組合的收益率水平。
四、結論
針對P2P網絡借貸中的投資組合決策問題,本文提出了將投資者在P2P網絡借貸平臺上的投資組合決策視為一定收益率下的風險最小化的問題,采用實例模型,估計新貸款的風險水平和收益率,構建投資組合最優化方程組;將相似度量化為歷史貸款和新貸款發生逾期概率的距離,根據平臺歷史交易信息,采用邏輯回歸法估計歷史貸款和新貸款發生逾期的概率,計算出二者發生預期的概率的距離,并通過核回歸確定每筆歷史貸款在新貸款收益率預測中所占的相對權重,估計出新貸款的收益率,新貸款的風險水平近似量化為歷史貸款收益率的方差;投資者根據預測結果確定投資組合的預期收益率,在一定期望收益率下最小化風險,得出最優投資組合。基于人人貸2015年散標交易數據進行實證研究驗證了實例模型有兩方面的優勢:第一,與傳統評級模型不同,實例模型考慮了每筆歷史貸款的不同,將歷史貸款根據不同的相似度賦予不同的相對權重估計新貸款的情況,而評級模型只是將歷史貸款進行簡單分級,忽略了同級貸款的差異性,所以實例模型所估計出的收益率和風險精確度更高,從而根據實例模型構建的最優投資組合的收益率較高;第二,實例模型根據歷史貸款發生逾期的可能性來判斷貸款的相似度,貸款發生逾期的概率可通過邏輯回歸測算得出,不需知道該借款者過去貸款的詳細交易信息及具體償還情況,對數據的要求低,投資者可通過網站提供的歷史交易數據估計新貸款的收益率及風險,構建最優投資組合。
實證研究結果表明,相較于評級模型,實例模型可更有效地幫助投資者預測新貸款的收益率及風險,進而做出投資組合最優化的決策。
參考文獻:
[1] Berger S. & Gleisner F. Emergence of financial intermediaries in electronic markets: the case of online P2P lending[J].Business Research, 2009, 2(1).
[2] 張正平,胡夏露. 網絡借貸平臺的發展:文獻述評[J].華東經濟管理,2013(9).
[3] 陳冬宇. 基于社會認知理論的P2P網絡放貸交易信任研究[J].南開管理評論,2014,17(3).
[4] 郭艷紅,劉偉,雒春雨. 在線網絡借貸投資決策模型及實證研究[J].運籌與管理,2016(4).
[5] 徐喆. 邏輯回歸模型在互聯網金融P2P業務信用風險的應用[J].統計科學與實踐,2015(11).
[6] Puro L., Teith, J.E., Wallenius. Borrower decision aid for people-to-people lending [J].Decision Support Systems, 2009, 49(1).
[7] Zhang & Shi. Credit risk evaluation using multi-criteria optimization classifier with Kernel, fuzzification and penalty factors [J].European Journal of Operational Research, 2014(237).
[8] Guo & Luo. Instance-based credit risk assessment for investment decisions in P2P lending [J].European Journal of Operational Research, 2016(249).
[9] Nadaraya & E. A. On non-parametric estimates of density functions and regression curves [J].Theory of Probability & Its Applications, 1965(10).
[10]Clark. A calibration curve for radiation dates [J].Antiquity, 1975(49).
[11]Silverman. Density estimation for statistics and data analysis[M].Chapman & Hall, 1986.
Abstract:In P2P lending, how to realize the optimal combination of income and risk is the core issue of investor concern. In this paper, the optimization of investment portfolio optimization is transformed into a risk minimization problem under a certain expected rate of return. The kernel regression is used to describe the similarity between historical loan and new loan, to construct an instance model based on similarity, and support the optimization decision of investor to make the investment portfolio. The feasibility of the example model is empirically studied by taking 2015 data of Chinese online network lending platform Renrendai as a sample. Result shows example model shows good forecasting ability, and it is helpful for the investors to make the optimal decision of the investment portfolio of P2P lending platform.
Key words:P2P lending; instance-based model; investment portfolio; optimization
(責任編輯:嚴元)