萬常選 游運 江騰蛟 劉喜平 廖國瓊 劉德喜
(江西財經大學信息管理學院 南昌 330013)(江西財經大學數據與知識工程江西省高校重點實驗室 南昌 330013)
P2P借貸是基于因特網的一種新型金融模式,該模式將擁有閑散資金的社會成員與資金的需求方聯系起來,不僅為中小企業融資和小額借貸提供了一個新的解決方案,也為社會成員提供了一種新的投資途徑.由于P2P借貸市場具有能拓寬傳統金融機構的融資渠道,降低借貸交易成本,提高借貸交易效率和投資者投資回報等特點,該類市場發展迅猛,也吸引著越來越多的潛在投資者.對于潛在的投資者來說,要保證其投資效益,其中關鍵的決策問題就是如何從眾多的投資項目中選擇真正符合自己投資偏好的投資項目,并在此基礎上進行投資額的合理分配.
在P2P平臺中,貸款人(也稱為投資者)在進行投資項目的選擇時,借款人和借貸項目的風險水平往往是其決策的重要市場信號.目前,關于借款人和借貸項目風險的研究較多[1-3].這些研究通過對平臺中的借款人、借貸項目的風險及其相關因素進行研究,以幫助潛在的投資者進行有效決策.然而,隨著平臺發展規模越來越大,借貸項目品種的日益繁多,信用風險的相關信息量劇增.“信息過載”將使得投資者,特別是眾多的非專業的投資者陷入決策困境.
文獻[4]設計了一個基于實例的信用風險評估模型來評估每個借貸項目的風險和回報,將P2P借貸投資決策問題設計成一定約束條件下的優化投資組合問題,以提高P2P借貸市場投資者的投資性能.但該方法是根據P2P借貸市場數據驅動的投資決策總體框架,即向所有的投資者推薦若干全局最優產品,因此忽視了不同投資者在投資偏好、風險類別等方面的差異性對其投資行為的影響.
文獻[5]針對不同投資者,重構投資決策過程,首先,根據借貸項目信用評估結果及投資者歷史交易數據,為每一位投資者產生一份推薦投資項目列表;其次,根據投資組合理論,對該推薦列表中的每一個投資項目的投資份額進行優化.該方法考慮了不同投資者當前的投資狀態的差異性,提出了基于風險管理的個性化推薦策略.然而,該方法存在2個局限性:1)在確定推薦投資項目列表時,主要是從借貸項目與投資者之間的投資關系、借款人與借貸項目之間的從屬關系等角度出發進行算法設計,忽視了P2P平臺在線社交網絡中貸款人之間的朋友關系及其對投資者投標行為的影響,這將降低投資項目推薦的準確率和召回率,影響推薦結果的有效性;2)忽視了投資者風險偏好差異性對其投資決策的影響.
文獻[6]通過在大型的P2P借貸網站上進行研究發現,朋友網絡可帶來管道效應、棱鏡效應和羊群效應,會極大地影響相關投資者的投標行為及投資偏好,即當一個投資者的親密朋友對項目A投標后,該投資者對項目A的投資偏好將會受到一定程度的影響,導致其可能也隨之投標.
文獻[7]發現投資者的投資組合與他們的投標偏好密切相關.因此,在確定推薦投資項目時可在前人研究的基礎上,進一步考慮P2P平臺在線社交網絡中投資者之間的朋友關系及其對投資者投標行為的影響,以便準確地把握投資者真正感興趣的借貸項目,改善投資組合推薦的最終效果;二是在進行P2P投資項目投資組合優化分析時,文獻[7]與大多數P2P投資推薦相關研究類似,忽視了不同投資者風險偏好的差異性對其投資決策的影響.在金融領域中,投資者對待風險的態度一般通過投資者的效用函數來測定,在面臨不確定的環境狀態時,投資者往往更愿意選擇使其預期效用最大化的決策方案.
基于以上分析,為了能夠提高組合投資推薦的各方面性能,本文根據來自Prosper平臺的相關數據,構建P2P關聯網絡模型,分析其中的投資者之間的朋友關系,基于朋友關系網絡計算投資者的朋友投標行為影響因子,并在此基礎上設計基于預期效用理論的個性化推薦方案.
本文的貢獻主要包括以下4個方面:
1) 根據Prosper平臺相關數據,構建了反映平臺各對象之間相互關聯的P2P關聯網絡模型,并在此基礎上分別計算借貸項目和投資者的概念特征,得出相應的概念模型;
2) 分析P2P關聯網絡模型中投資者之間的朋友關系,并在此基礎上探討投資者直接朋友的投標行為對其投資偏好的影響,設計基于投資者朋友關系的朋友投標行為影響因子,并將之應用于投資者的項目投資興趣度的預測,以提高投資推薦的有效性;
3) 在Prosper平臺歷史交易數據基礎上,考察投資者風險厭惡系數及風險承受能力,結合預期效用理論,構建基于預期效用理論的P2P借貸平臺投資組合優化模型,實現投資者投資額在推薦投資項目列表中的合理分配;
4) 整體設計了基于投資者朋友關系和預期效用最大化的投資組合推薦算法,并提出了新的評價指標,以評估投資推薦模型的推薦效果以及投資決策滿意度、經濟效益和效用.
對于P2P借貸平臺來說,如何為潛在的投資者提供有效的投資信息,幫助他們進行投資項目的選擇及投資額的分配,以降低他們的投資風險,提高他們的投資回報,關系到P2P借貸平臺的長遠而有效的發展,關于這方面的研究主要體現在以下3個階段.
通過借貸項目違約風險評估,可在一定程度上幫助投資者擺脫由于信息不對稱等信息問題所產生的不利選擇困境,規避投資決策風險.目前關于這方面的研究較多,大多從2個方面著手:1)從借貸項目違約風險的相關特征出發,研究傳統的財務指標[8-9]、非財務指標[10]及社會網絡信息[11-13]等對借貸項目違約風險的影響;2)從借貸項目違約風險預測方法的角度展開研究.關于市場風險預測的方法有很多,大致可分為4類:1)統計模型,如邏輯斯蒂回歸、k近鄰方法和生存分析等;2)人工智能方法,如神經網絡、支持向量機和遺傳算法等;3)運籌方法,如線性規劃法、二次規劃法等;4)混合方法.以上這些研究工作主要集中于研究借貸項目違約風險預測,卻很少有將預測結果應用到其他應用場景或投資決策分析.
隨著P2P借貸市場的飛速發展,借貸項目品種變得日益繁多,而投資者非專業性及處理信息的能力有限.因此,對于投資者而言,僅擁有關于各個借貸項目違約風險的相關信息遠不足以保證其投資決策的有效性,因為信息過量往往會使決策者陷入困境,因此有必要提高投資者信息分析的效率,并為之提供有效的投資策略.
文獻[14]根據來自多目標項目的靜態特征和動態特征,對借貸項目進行多視角風險分析,并在此基礎上為投資者提供2種投資組合優化策略,即加權目標優化策略和多目標優化策略.文獻[15]提出數據驅動的投資決策框架,利用投資者的投資組合理論來增強P2P投資決策性能.文獻[4]通過設計一個基于實例的信用風險評估模型來評估每個借貸項目的風險和回報,并在此基礎上將P2P借貸投資決策問題設計成一定約束條件下的優化投資組合問題,以提高P2P借貸市場的投資性能.以上方法是根據P2P借貸項目風險評估建立投資決策總體框架,向所有的投資者推薦若干全局最優產品,因此忽視了不同投資者投資偏好的差異對其投資行為的影響.
推薦系統按所使用的數據來分類,可以分為內容過濾、協同過濾和社會化推薦系統等.已有的推薦算法雖然取得了一定的推薦效果,但主要局限于一些特定的領域,如旅游業、電子商務、電影傳媒推薦等.關于P2P借貸領域的個性化投資推薦的研究較少.
文獻[16]通過對借貸項目進行風險評估,并在此基礎上,結合經濟學剩余價值理論,提出剩余價值最大化投資推薦框架,具有一定的有效性;但對P2P在線平臺各對象之間的相互關聯研究較少,同時也忽視了投資者之間的朋友關系及其對投資者投資偏好的影響,導致難以準確把握投資者的當前投資需求,影響推薦的效果.
文獻[5]根據借貸項目信用評估結果及投資者歷史交易數據,從借貸項目與投資者之間的投資關系、借款人與借貸項目之間的從屬關系等角度出發為投資者推薦投資項目列表,并在此基礎上結合投資者當前的投資環境,對推薦列表中的每一個投資項目的投資份額進行優化.該方法考慮了不同投資者投資環境的差異性,提出了基于風險管理的個性化推薦策略.但該方法忽視了P2P平臺在線社交網絡中投資者之間的朋友關系及其對投資者投資偏好的影響,導致難以準確把握投資者真正感興趣的借貸項目,影響投資推薦的有效性.同時,該方法忽視了投資者風險偏好差異性對其投資決策的影響.由于不同的投資者對待風險的態度的差異,如風險厭惡程度不一樣,甚至風險類別不同,在面對風險不同的同樣貨幣預期值的投資收益時,產生的效用水平往往不同,而這很有可能會影響投資者的投資組合策略.
目前,在P2P借貸領域社交網絡的研究大多集中在風險預測、融資效率及經濟行為影響等方面;關于P2P借貸領域投資推薦的相關研究中,在進行個性化投資推薦算法設計時,往往忽視了投資者社交關系對投資者投標行為的影響.由于P2P借貸市場存在信息不完全與非對稱、歷史投資數據稀疏、投資者與投資項目特征難以有效匹配等問題,傳統的推薦方案往往難以滿足該市場的個性化投資需求.
基于在線社會網絡的數據分析結果表明,考慮社會網絡用戶之間的直接或間接的社會關聯信息的社會化推薦方法,可有效提高推薦系統性能[17].隨著當前在線社會網絡的不斷發展與應用,結合投資者社交網絡信息進行推薦算法設計,將有望成為提高P2P借貸市場個性化投資服務性能的重要途徑之一.
因此,本文根據投資者的歷史交易數據,構建反映平臺各對象之間相互關聯的P2P關聯網絡模型,分析其中的投資者之間的朋友關系及其對投資者投資決策行為的影響;同時,考慮投資者歷史風險承受能力及風險系數,從投資者的預期效用最大化出發,設計個性化投資組合推薦方案,以期提高投資推薦的有效性和投資者的決策滿意度.
本節將依據P2P借貸市場中各對象之間的相互關系,構建P2P關聯網絡模型,并在此基礎上分別分析借貸項目和投資者的概念特征,得出相應的概念模型,為后續設計個性化投資推薦模型提供支持.
微觀社會資本理論認為,社會網絡中的個體行動者的社會地位狀況及關系指向特征將影響其決策行為與經濟結果.朋友網絡是P2P借貸市場中的一種重要的在線社會網絡,有別于傳統的社會網絡,該網絡中的注冊用戶之間可以不受時空的限制自由地組織聯系、快速地進行信息分享和市場交易,并由此建立各種關聯.基于微觀社會資本理論和P2P平臺歷史交易信息,通過分析P2P借貸市場中各對象之間的相互關聯,構建相應的P2P關聯網絡模型,如圖1所示,以分析其中各對象之間的關聯特征.

Fig. 1 Example of P2P relationship network圖1 P2P關聯網絡示例
圖1定義了P2P關聯網絡中互為關聯的相關對象的關系圖G=(C,P,E),其中P表示借貸項目的集合,其屬性特征包括借款類別、借款數量、借款期限、借款利率、信用等級等內容;C={L,B}表示P2P借貸平臺貸款人(即投資者)L和借款人B的集合,其屬性特征包括成員角色、關鍵字、債務收入比、所在城市、受教育程度等內容;E={E1,E2,E3}表示借款人、借貸項目、貸款人之間的P2P平臺參與人(主要指借款人和貸款人)之間的直接朋友關系E1、借款人-項目之間的從屬關系E2、貸款人-項目之間的投資關系E3的集合.
如圖1示例所示,l1,l2,l3∈L,b1,b2∈B,p1,p2,p3∈P,其中,(l2,b1)∈E1表示貸款人l2與借款人b1之間的直接朋友關系,對此可用一個變量R1描述P2P平臺參與人之間是否是直接朋友關系,如R1(l2,b1)=1表示貸款人l2與借款人b1之間是直接朋友關系;(l2,p1)∈E2表示貸款人l2對項目p1進行了投資,即存在貸款人-項目之間的投資關系,可用一個3維向量R2描述貸款人與項目之間的投資關系特征,如是否投資、投資數額、投資回報率,如R2(l2,p1)=(1,50,2.2%)T表示貸款人l2對項目p1進行了投資、投資額為50、投資回報率為2.2%;(b2,p1)∈E3表示項目p1屬于借款人b2,即存在借款人-項目之間的從屬關系,可用變量R3描述借款人與項目之間的從屬關系特征,如R3(b1,p1)=0,則表示項目p1不屬于借款人b1.



(1)





其中,h為調節參數.

(2)
在預期效用一定的情況下,式(2)也反映了該投資者在一定風險系數下,過去投資預期回報率與所承擔的歷史投資風險之間的關系:

(3)

(4)

由式(4)可知,投資者的風險厭惡系數與其單位風險溢價成正比,與投資者歷史投資風險成反比.
文獻[18]指出投資者進行投資決策時往往更多地受到社會資本因素引起的羊群行為的影響.文獻[19]通過研究發現,在P2P借貸市場中,由于投資者面臨異構偏好或者因獲取及分析相關決策信息需要花費大量成本,會出現羊群行為,此時朋友投標將對其決策行為產生重要影響.因此,投資者lj是否愿意對借貸項目pi投標,除了與其初始投資偏好有關,還會受到其朋友(特別是直接朋友)投資行為的影響,一般投資者的直接朋友投資能力越強,其投資決策對該投資者的投資行為的影響會越大.
本節基于P2P關聯網絡模型,分析投資者之間的朋友關系,發掘用于反映投資者對某一借貸項目的投資偏好受到其直接朋友投標行為的影響程度的相關因素,稱為投資者的朋友投標行為影響因子,并將其引入個性化投資推薦模型的設計中,以期能更為準確地把握投資者的當前投資偏好,提高投資項目推薦的有效性.
(5)
其中,|Lj|為投資者lj的直接朋友個數.
首先從基于用戶協同過濾(user-based collabo-rative filtering, UCF)的個性化推薦方法出發,綜合考慮項目投資相似度和項目投資者能力[5],結合投資者的朋友投標行為影響因子,確定每一位投資者的推薦投資項目列表;其次,考慮投資者風險厭惡系數和歷史投資過程中所反映的風險承受能力,從投資者預期效用最大化出發設計投資推薦優化方案,確定其投資額在推薦投資項目列表中的分配.
在傳統的UCF推薦方法中,對于借貸項目pi,投資者lj在時刻t的投資興趣大小主要是通過計算其與截至時刻t已投資該項目pi的投資者之間的投資相似度來確定:
(6)


(7)

文獻[5]綜合考慮項目投資相似度和項目投資者能力對投資者投資偏好的影響,將投資者lj對項目pi的興趣度表示為
(8)
然而,投資者的投資偏好不僅與項目投資相似度和項目投資者能力相關,而且在很大程度上還會受到其朋友(特別是有投資能力的直接朋友)投資決策的影響.因此,本文在文獻[5]所提出方法的基礎上,進一步考慮投資者朋友關系網絡中投資者lj的直接朋友的投資能力及其對項目pi的投資情況,分析其對投資者lj的投資偏好的影響,并將投資者lj對投資項目pi的興趣度調整為

(9)
一般認為,γt(lj,pi)越大,表示在時刻t投資者lj對項目pi的興趣度越大,投資者lj在進行投資項目選擇時越有可能選擇項目pi.對于每一個投資者lj,可由γt(lj,pi)值的大小排序,產生一個粗略的推薦投資項目列表T1j.

經濟學中往往將市場參加者的風險偏好分為三大類,即風險厭惡、風險中性和風險愛好.預期效用理論常用于分析在風險條件下“理性人”的決策行為,即在面臨不確定性的決策環境時,投資者的決策往往是追求財富的預期效用最大化過程.在現實生活中,絕大多數的投資者是理性的風險厭惡者,但不同的投資者風險厭惡程度有所不同,因此其對應的效用函數中的風險厭惡系數將有所不同.對于一個投資者來說,其風險厭惡系數越大,一個單位的風險為其所帶來的效用損失將越大,反之越小.針對不同風險厭惡程度的投資者,文獻[20]引入了指數效用函數,用于對投資者行為決策過程進行分析,取得了顯著的效果.在此,本文將在指數效用函數假設基礎上,結合2.3節所分析的投資者風險厭惡系數及其風險承受能力,構建基于預期效用最大化的P2P借貸平臺的投資組合優化模型.
對于投資者lj,假設其總投資金額為Mj,由3.1節所確定的推薦投資項目列表為T2j;并將投資者lj的總投資金額Mj在推薦投資項目列表T2j中的分配金額列表記為
vj=(vj1,vj2,…,vj|T2j|),

基于預期效用的P2P借貸平臺投資優化模型的目標是:在3.1節所確定的投資者推薦投資項目列表的基礎上,考慮投資者風險厭惡系數和歷史投資風險,確定推薦列表中每一個投資項目的投資額,以使得該投資者預期效用最大化:

(10)

vj i≥0,i=1,2,…,|vj|.
(11)
本節描述基于投資者朋友關系和預期效用最大化的投資推薦過程,如算法1所示,包含2個輸入數據集和2個參數.其中,SetH是訓練數據集,由過去的是否違約已知的借貸項目組成;SetT是測試數據集,在該數據集中包含了當前潛在投資者可投標的借貸項目,這些借貸項目是否違約是未知的;r*表示投資者在無風險情況下的收益率,如購買國家公債或銀行儲蓄收益率,本文假設r*=0.025.
算法1. 基于投資者朋友關系和預期效用最大化的投資推薦.
輸入:訓練數據集SetH,測試數據集SetT,以及分別包含的借貸項目樣本數量n1,n2;無風險情況下的投資收益率r*;投資者的投資能力與實際回報率之間的調節參數h(實驗時設為0.05);
/*初始化及模型訓練*/



/*建立SetH和SetT中各項目pi的概念模型*/



/*建立投資者集合L中各投資者lj的概念模型*/




/*確定SetT中接受投資推薦的各投資者lj(j=1,2,…,mac)的推薦投資項目列表T2j*/


/*確定SetT中各投資者lj(j=1,2,…,mac)的推薦投資項目列表T2j的投資額分配列表vj*/

基于投資者朋友關系和預期效用最大化的投資推薦過程可描述如下:


步驟4. 基于投資者朋友關系確定投資者的推薦投資項目列表(行).首先,針對每一位投資者lj,結合SetT中借貸項目pi的投標情況,分別計算在時刻t投資者lj與項目pi的其他投資者的相似度s(lj,lk),其中為截至時刻t已投標了項目pi的所有投資者的集合.其次,綜合考慮項目投資相似度s(lj,lk)、項目投資者能力和基于朋友關系網絡的投資者的朋友投標行為影響因子針對每一位投資者lj,計算其對SetT中借貸項目pi的投資興趣度;最后,根據投資者lj對SetT中各借貸項目pi的投資興趣度及投資者支持組項目,確定推薦投資項目列表T2j.
步驟5. 基于投資者風險偏好和預期效用理論,確定投資者的推薦投資項目的投資額(行).針對每一位投資者lj,根據步驟3所估計的投資者風險厭惡系數和預期投資風險從預期效用最大化出發,建立投資組合優化模型,確定投資者lj的總投資額Mj在推薦投資項目列表T2j中的分配金額列表vj.

Fig. 2 Conceptual association between lending projects and investors圖2 借貸項目和投資者相關概念關聯
實驗數據來源于美國Prosper網絡借貸平臺2006-01—2012-01期間的開放數據.該數據集包含相互關聯的7類對象信息,分別是項目類別、群組、注冊成員、列表項目、投資項目、投標、角色,信息量巨大.其中,注冊成員1 309 510個,列表項目371 896個,投標數為9 638 888.
為了便于訓練和測試,首先,對該數據集進行了初步過濾,選取已完結且違約狀態明確的25 229個借貸項目及與這些項目相關的列表項目、投資項目、投標和注冊成員等信息,針對每一個借貸項目,根據列表項目數據、平臺投標數據和注冊成員數據統計計算其借款人和投資者的相關信息,同時,針對每一位投資者,根據平臺投標數據、注冊成員數據中的朋友屬性列表分別統計其投標信息和直接朋友關聯信息,以此作為構建P2P朋友關系網絡的基礎數據集;其次,考慮到數據的完整性,從基礎數據集的25 229個借貸項目中選取了最終違約狀態明確且相關數據完善的23 488個借貸項目,針對每一個借貸項目,計算傳統財務指標特征值,并進行數值化、規范化處理,以此作為樣本數據集;最后,將樣本數據集按時間劃分為2個數據集,其中,2006-01—2008-12期間的借貸項目的集合構成訓練數據集SetH,在該數據集中包含了19 156個借貸項目,將2009年1月之后最終違約狀態明確的4 332個借貸項目構成測試數據集SetT.擬采用文中所設計的投資推薦方法計算對應的投資者對測試數據集SetT中的4 332個借貸項目的投資興趣度,確定其推薦投資項目列表及投資額的分配.
通過隨機選取Prosper平臺上的300個借貸項目進行統計分析發現,借貸項目的預期回報率與其違約風險顯著正相關,如圖2(a)所示,它們的Pearson相關系數為0.889.這表明對于潛在的投資者來說,如果他們想賺得越多,就需要試著選擇高風險的借貸項目.根據金融經濟學理論,風險厭惡系數越大,投資者則越厭惡風險,這對其風險投資的妨礙就越大.如果投資者風險厭惡系數較大,投資太過保守,則其實際投資收益往往較低,如圖2(c)所示,當投資者風險厭惡系數大于2.3,其實際回報率則低于0.11.然而通過對平臺投資者的投資預期風險和實際回報率進行分析發現,并非投資者承擔較大的風險就一定能獲得更高的投資收益,如圖2(b)所示,很多的投資者所承擔的風險很大,但它們的實際回報率卻很低.從圖2(c)中也可以發現,對于大多數P2P借貸平臺的投資者,其風險厭惡系數較低,介于0.46~2.1之間,表示愿意投資風險較高的借貸項目,但是他們中僅有部分人實際回報率較高,獲得較好的投資收益,究其原因,可能是由于經驗不足而冒險選擇了單位風險溢價較低的投資項目.
本文所提出的基于投資者朋友關系的投資推薦為FNI_OF模型,該模型按照3.1節的式(9)計算每一位投資者針對測試數據集SetT中的4 332個借貸項目的投資興趣度,確定其推薦投資項目列表.為了檢驗FNI_OF模型的有效性,以LR模型[21]、UCF模型[22]、REC_G模型[5](簡稱為RGP模型)作為基準模型,即按照3.1節的式(8)計算每一位投資者針對SetT中的4 332個借貸項目的投資興趣度,確定其推薦投資項目列表;其中,LR模型是依據文獻[21]所用的邏輯斯蒂回歸方法對SetT中的4 332個借貸項目進行違約風險評估,并在此基礎上確定全局推薦投資項目列表.為了消除由于推薦投資項目數量的不同選擇及隨機取樣所帶來的偏差,保證驗證結果的可信度,我們設置了不同的推薦投資項目數量,并分別計算每一位投資者的相應指標值,然后再求平均值.
首先,為了檢驗FNI_OF模型所確定的推薦投資項目列表與投資者實際投資決策的切合程度,本節采用投資推薦中較為常用的precision,recall,F-measure指標對上述2種方法的推薦結果進行對比,實驗結果如圖3所示.根據圖3(a)、圖3(b)和圖3(c)不難發現,隨著推薦投資項目數量k的增加,4種模型的推薦準確率(即precision_LR,precision_UCF,precision_RGP,precision_FNI)都隨之下降,但4種模型的推薦召回率(即recall_LR,recall_UCF,recall_RGP,recall_FNI)和F-measure指標(即F_LR,F_UCF,F_RGP,F_FNI)都隨之上升;與LR,UCF,RGP基準模型相比,考慮投資者朋友關系的FNI_OF模型的各項指標都要更優,這表明本文提出模型所確定的推薦投資項目列表更能符合投資者的投標興趣和偏好,從而有助于提高推薦的有效性.

Fig. 3 Comparison about investment recommendation effect圖3 投資推薦的效果比較
其次,為了檢驗推薦模型所推薦結果的投資決策效果,即向投資者推薦符合其投資需求的非違約項目的能力,本節提出requality1指標、requality2指標進行實驗評估.一般認為,模型所確定的推薦投資項目列表中非違約的項目越多,該模型越有助于投資者規避風險;模型所確定的推薦投資項目列表中投資者最終投標且沒有違約的項目越多,該模型越有助于投資者正確地選擇滿足自身投資需求的項目.其中,requality1指標用于反映推薦模型所確定的推薦投資項目列表中投資者最終投標且沒有違約的項目數占其投資項目數的比例;requality2指標反映投資者最終投標且沒有違約的項目數占推薦投資項目數的比例.
4種模型針對requality1,requality2指標的實驗評估結果如圖3(d)所示.根據圖3(d)可以發現,與LR,UCF,RGP基準模型相比,對于不同的推薦投資項目數量k,考慮投資者朋友關系的FNI_OF模型的requality1(即requality1_FNI)、requality2(即requality2_FNI)指標都要更優,這表明本文提出模型所確定的推薦投資項目列表在提高推薦性能的同時,還有助于投資者規避投資決策風險,保證投資決策的有效性.
本節以文獻[5]中所提出的REC_G模型(簡稱為RGP模型)作為基準模型,該模型首先通過3.1節的式(8)計算每一位投資者(即貸款人)針對測試數據集SetT中的4 332個借貸項目的投資興趣度,確定其推薦投資項目列表,并在此基礎上利用傳統的投資組合推薦方法進行投資額的分配;FNI_OF模型是在RGP模型的基礎上進一步考慮投資者朋友關系的投資組合推薦方法,即該方法首先利用3.1節的式(9)計算每一位投資者針對SetT中的4 332個借貸項目的投資興趣度,確定其推薦投資項目列表,并在此基礎上利用傳統的投資組合推薦方法進行投資額的分配;FNI模型則是在FNI_OF模型確定的推薦投資項目列表的基礎上,進一步考慮投資者預期效用最大化進行投資額的分配.針對以上3種模型,本節采用5個指標對各種模型的推薦經濟效果進行對比分析,以便對本文所提出的FNI模型的推薦經濟效果進行全面評價.
第1個指標是投資推薦的真實回報率,這是衡量投資組合推薦經濟效果的一個重要指標.
在投資組合推薦過程中,如果投資者在推薦結果中的實際回報率與其預期回報率之間的差異越小,同時推薦的準確率和召回率越高,投資者投資的經濟效益將越好.第2個指標PAQ(precision and return quality)和第3個指標RAQ(recall and return quality)是在文獻[5]所提出相關指標的基礎上改進得到,目的是考察投資者在推薦結果中的實際回報率與其預期回報率之間的差異對其投資滿意度及經濟效益的影響:

(12)

(13)

在投資組合推薦過程中,如果投資者承擔單位風險所獲投資實際回報率與其預期回報率之間的差異越小,同時推薦的準確率和召回率越高,投資者決策的經濟效用將越好.因此,除了以上介紹的3個指標之外,本文提出了第4個指標RPAQ(under the unit risk precision and return quality)和第5個指標RRAQ(under the unit risk recall and return quality),目的是考察投資者承擔單位風險所獲投資實際回報率與其預期回報率之間的差異對其決策滿意度及經濟效用的影響:

(14)

(15)

第4個指標RPAQ定義為投資推薦準確率乘以投資者承擔單位風險所獲投資實際回報率與其預期回報率之間的差異.第5個指標RRAQ定義為投資推薦召回率乘以投資者承擔單位風險所獲投資實際回報率與其預期回報率之間的差異.這2個指標值越大,表明投資者的決策滿意度越高、經濟效用越大.
為了消除由于推薦投資項目數量的不同選擇以及隨機取樣所帶來的偏差,保證驗證結果的可信度,我們設置了不同的推薦候選投資項目數量,并分別計算每一位投資者的相應指標值,然后再求平均值,最終結果如圖4和圖5所示.

Fig. 4 Actual return rate of investors under different circumstances圖4 不同情況下投資者實際回報率的比較

Fig. 5 Recommendation economic performance of different models圖5 不同模型推薦的經濟性能比較
首先,分析各模型的推薦結果為投資者帶來的實際回報率.在圖4中,real_RGP,real_FNI_OF,real_FNI分別表示RGP,FNI_OF,FNI這3種模型的推薦結果為投資者帶來的實際回報率.根據圖4可以發現,在本文實驗數據集中,對于不同的推薦投資項目數量k,3種模型的推薦結果為投資者帶來的實際回報率都要高于投資者自行投資決策所獲得的實際回報率.而與RGP基準模型相比,FNI模型的推薦結果為投資者帶來的實際回報率最高,其次是FNI_OF模型.這表明本文所提出的基于投資者朋友關系和預期效用最大化的投資組合推薦方法能有效地提高投資者的實際收益率,使其投資組合推薦的經濟效果更好.
其次,評價各模型的投資組合推薦的質量及經濟意義.在圖5(a)和圖5(b)分別對比了在不同的推薦投資項目數量的情況下,各模型的PAQ指標和RAQ指標的性能.分析發現,FNI模型的投資組合推薦的PAQ指標和RAQ指標的性能都是最好的,其次是FNI_OF模型.這表明在投資推薦過程中,考慮投資者朋友關系對其投資偏好的影響,同時從投資者預期效用最大化出發建立投資組合優化模型,可有效地提高模型的投資組合推薦質量,使其推薦結果更具經濟意義.
最后,評價各模型的投資組合推薦為投資者帶來的決策滿意度及經濟效用.在圖5(c)和圖5(d)分別對比了在不同的推薦投資項目數量的情況下,各模型的RPAQ指標和RRAQ指標的性能.分析發現,FNI模型的投資組合推薦的RPAQ指標和RRAQ指標的性能都是最好的,其次是FNI_OF模型.這表明在投資組合推薦過程中,考慮投資者朋友關系對其投資偏好的影響,同時從投資者預期效用最大化出發建立投資組合優化模型,可有效提高投資者的決策滿意度,使其推薦結果更具經濟效用.
根據美國Prosper市場中的交易數據,在分析P2P借貸市場中各對象之間的相互關聯關系的基礎上構建了P2P關聯網絡模型,并基于P2P關聯網絡模型分別計算借貸項目和投資者的概念特征,得出相應的概念模型;基于多維社會資本理論,在前人研究的基礎上進一步考察了P2P關聯網絡模型中的投資者朋友關系網絡,分析了投資者的直接朋友投標行為對其投資偏好的影響;在計算投資者對借貸項目的投資興趣度時,除了考察投資者與借貸項目已投標者的平均投資相似度和借貸項目已投標者的投資能力對投資者投資偏好的影響之外,同時還引入了基于朋友關系的投資者的朋友投標行為影響因子,并根據該影響因子調整投資者對借貸項目的投資興趣度,結合投資者支持組中的新項目信息,以確定面向投資者的個性化的推薦投資項目列表;在指數效用函數假設基礎上,考察投資者風險厭惡系數及歷史風險承受能力,構建基于預期效用最大化的P2P借貸平臺投資組合優化模型,確定投資者的總投資額在個性化的推薦投資項目列表中的分配,并對基于投資者朋友關系和預期效用最大化的投資組合推薦算法進行了整體設計;提出了新的評價指標,以評價投資推薦模型的推薦效果以及投資決策滿意度、經濟效益和效用.
實驗結果表明:在投資推薦效果方面,與LR模型、UCF模型和RGP模型等基準模型相比,本文提出的考慮投資者朋友關系的FNI_OF模型,不僅在考察推薦情況與投資者實際投資決策的切合程度的傳統指標precision,recall,F-measure上都要更優,而且在本文提出的考察推薦模型向投資者推薦符合其投資需求的非違約項目能力的requality1,requality2指標上也都要更優,這表明考慮投資者朋友關系的投資推薦方法更能反映投資者的真實投標偏好和投資需求,從而更有助于提高推薦的有效性;在投資組合推薦的經濟性能方面,與RGP基準模型相比,考慮投資者朋友關系的投資組合推薦的FNI模型的投資者實際回報率以及PAQ,RAQ,RPAQ,RRAQ指標都要更優,這表明基于投資者朋友關系和預期效用最大化的投資組合推薦方法在優化模型投資組合推薦效果的同時,還能有效地提高投資者的實際投資收益和投資決策滿意度,即其推薦的結果更具經濟效益和效用.
另外,本文雖然是基于美國Prosper市場交易數據進行研究,但該研究的方法具有一般的借鑒意義.P2P作為互聯網金融的主流模式之一,都存在平臺信息不完全、“硬”信息質量不高、總體安全性低、平均風險性高的共性,因此,針對不同的P2P社交網絡模式,只要適當地調整對應的P2P社交網絡關聯模型及概念特征指標的計算公式,則可將其應用于其他的P2P借貸市場中的投資項目投資組合推薦,以提升推薦的效果及推薦的經濟性能.
在未來的工作中,我們打算進一步分析非P2P平臺的社會資本信息,以便提取更多的影響投資者行為的社交網絡特征指標,并將之應用于P2P平臺的個性化投資組合推薦中,結合算法的改進,進一步提高投資推薦的效果及經濟性能,為投資決策提供更好的服務.