999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于標簽傳播的P2P網絡借貸平臺分類

2018-07-05 04:33:02鄧旭東童澤平武漢科技大學管理學院湖北武漢40065武漢科技大學服務科學與工程研究中心湖北武漢40065智能信息處理與實時工業系統湖北省重點實驗室湖北武漢40065
計算機應用與軟件 2018年6期
關鍵詞:分類

劉 翱 胡 超 鄧旭東 童澤平 任 亮(武漢科技大學管理學院 湖北 武漢 40065)(武漢科技大學服務科學與工程研究中心 湖北 武漢 40065)(智能信息處理與實時工業系統湖北省重點實驗室 湖北 武漢 40065)

0 引 言

截至2017年3月31日,我國P2P網絡借貸行業全國成交額2 180.29億元,P2P網絡借貸平臺數量達4 804家,其中運營平臺1 810家,問題平臺達2 994家[1]。一方面,P2P網絡借貸平臺良莠不齊,影響了P2P網絡借貸行業的長遠和健康發展;另一方面,部分P2P網絡借貸投資者沒有投資經驗,且對收益率、流動性和風險有著不同的偏好,普通投資者難以選擇合適的網絡借貸平臺和借貸標的進行投資。因而,如何結合P2P網絡借貸平臺的運營數據進行平臺分類,識別其中的優良平臺,就顯得尤為重要[2-5]。這既有利于P2P網絡借貸行業健康發展,也有利于投資者進行投資決策和風險控制。

目前,關于P2P網絡借貸的研究主要集中在信息、學歷、地域等因素對借貸交易的影響[6-9],P2P網絡借貸行業缺乏對P2P網絡借貸平臺的定量效率評估和評級研究[2-5],少部分研究以定性分析為主[10-11]。盡管網絡借貸天眼、網絡借貸之家等第三方網站開始對網絡借貸平臺進行評級活動,但是2015年的短融網狀告融360的網絡借貸評級糾紛案凸顯了P2P網絡借貸評級的復雜性和爭議性。P2P網絡借貸行業數據難以獲取、第三方評級獨立性、科學性和公正性存疑等問題,無疑增加了普通投資者的投資難度和投資風險。

標簽傳播LP(label propagation)算法是一類基于圖的半監督學習方法,對非平衡和非正態數據具有較好的學習效果,具有可調參數少、原理簡單、容易實現等優點[12-13]。

鑒于此,本文從投資者視角出發,結合P2P網絡借貸平臺的運營數據,引入標簽傳播算法,開展P2P網絡借貸平臺分類研究,為缺乏經驗的投資者提供投資決策和風險控制輔助支持工具。值得指出的是,本文是首次將標簽傳播算法應用于P2P網絡借貸平臺分類研究。

1 標簽傳播

監督學習主要研究如何同時利用有類別的標簽數據和無類別的非標簽數據來學習有用信息,并改進學習性能,已成為機器學習領域的重要主題[12-13]。記有類別的標簽數據和無類別的非標簽數據分別為L={(x1,y1),(x2,y2),…,(xl,yl)},l∈{1,2,…,C}和U={xl+1,xl+2,…,xl+u}。其中l≤u,n=l+u為樣本量,C表示類別數。半監督學習是指利用L和U預測{xl+1,xl+2,…,xn}的標簽{yl+1,yl+2,…,yn}。

標簽傳播算法是一類基于圖的半監督學習算法,它通過將樣本映射為節點構造圖并定義節點相似性,在相似節點間傳播標簽分類,適用于具有少有帶標簽數據的分類問題[14]。

1.1 圖的構建

樣本Xi映射為節點,建立圖G=(V,E),任意樣本xi和xj定義為E中的一條邊,邊的權重wij定義為二者之間的相似度。

一種常見的基于RBF的相似度定義為[12]:

(1)

式中:σ為尺度參數。

標簽傳播算法通過節點之間的邊來傳播標簽,邊的權重越大,表明節點相似性越高,標簽傳播的概率越大。定義概率轉移矩陣如下:

(2)

式中:Pij為節點i向節點j傳播標簽的概率。

1.2 標簽傳播

定義L×C標簽矩陣YL=[ylic]L×C,第i行表示樣本xi對應的標簽向量,滿足:

(3)

定義軟標簽矩陣F=[fic]n×C,fic表示樣本xi屬于類別c的概率。

標簽傳播算法通過計算軟標簽矩陣F,將概率最大的類作為樣本類別。基本流程如下:

1) 以概率P進行標簽傳播:F=PF;

2) 重置有類別數據的標簽:FL=YL。

重復1)和2),直到F收斂為止。

2 基于標簽傳播的網絡借貸平臺分類算法

結合P2P網絡借貸平臺分類的實際情況,本節提出基于標簽傳播的P2P網絡借貸平臺分類算法。算法流程如下:

1) 應用z-score進行數據標準化:

(4)

2) 使用主成分分析對z進行特征提取[15]:

b=Az

(5)

3) 考慮到P2P網絡借貸平臺的不同分類之間相似性較低,因而傳播的概率較低。采用KNN思想來構造稀疏的KNN圖模型,即標簽只在K個最近鄰居之間傳播,轉移概率定義如下[14,16]:

(6)

4) 應用標準的標簽傳播算法進行P2P網絡借貸平臺的分類標簽傳播,確定P2P網絡借貸平臺的類型。

3 仿真實驗

3.1 數據準備

為驗證標簽傳播算法在P2P網絡借貸平臺分類中的可行性和效果,本節利用八爪魚數據采集器從網貸天眼網站采集2017年3月份50個網絡借貸平臺(編號為P1-P50)的運營數據和評級結果,數據匯總如表1所示,包括償兌性等共9個運營指標X1-X9及相應的等級。

表1 150家P2P網絡借貸平臺的運營數據

3.2 實驗環境

實驗環境:Windows 7, CPU 奔騰T4400,主頻2.2 GHz,內存為2 GB,編程語言為MATLAB 2014b。

3.3 實證分析

3.3.1 描述性分析

表2匯總了50家網絡借貸平臺運營數據的描述性統計結果。從表2可以看出,這些網絡借貸平臺在9個運營指標上具有較大的差異。可以預期,不同的P2P網絡借貸平臺的效率和風險等具有較大差異。因而,對P2P網絡借貸平臺進行合理分類,有助于區分網絡借貸平臺的優劣,并輔助普通投資者進行風險控制和個性化投資決策。

3.3.2 基于標簽傳播的網絡平臺分類

接下來,以表1的8家網絡借貸平臺P1-P8為標簽數據,其余42家網絡借貸平臺為未標簽數據,展示基于標簽傳播的平臺評級主要步驟和結果。

(1) 數據標準化

表3 部分P2P網絡借貸平臺標準化后的z-score

(2) 主成分分析

利用50家平臺的z,對其進行主成分分析,得出主成分分析的負荷矩陣A如表4所示,根據負荷矩陣算出50個平臺的主成分得分矩陣b,如表5所示。

表4 主成分分析的負荷矩陣

表5 部分P2P網絡借貸平臺的主成分分析的得分矩陣

(3) 標簽傳播分類結果

實驗過程如下:將等級{A+,A,B+,B}依次編碼為{1,2,3,4},從50家平臺中每類平臺選取2家平臺,利用得分矩陣和評級作為有類別的標簽數據,其余的平臺去掉標簽組成無類別的非標簽數據;其次,分別構造基于RBF和KNN的圖模型(分別記為RBF-LP,KNN-LP)進行標簽傳播;最后統計分類正確率,以測試算法效果[14,17-18]。

限于篇幅,表6列出了P1、P2的轉移概率。

表6 P1和P2基于KNN的轉移概率

表7分別統計了基于RBF和KNN的標簽傳播的分類正確率。從表中可知,盡管基于RBF的標簽傳播最好的分類效果優于KNN,但是從最差值、平均值和標準差來看,基于KNN的標簽傳播分類效果卻要優于RBF,也就是說,基于KNN的標簽傳播分類在平均性能和魯棒性等是要優于RBF。

表7 基于RBF和KNN的標簽傳播分類準確率

圖1展示了基于RBF和KNN的標簽傳播過程,該圖統計了50次試驗中每次標簽傳播的平均分類正確率和標準差。

圖1 基于RBF和KNN的標簽傳播過程對比

從圖1中可以看出:1) KNN的標簽傳播分類平均性能要優于RBF,且隨著傳播過程的進行效果越好,標準差也逐漸變小,也就是分類的魯棒性越好;2) RBF的標簽傳播分類效果在初期較好,隨后效果變差,在后期分類效果又逐漸增強,這也表明了基于RBF的標簽傳播分類效果不太穩定,魯棒性較差。

為進一步驗證標簽傳播的有效性,我們對比分析Naive Bayes、KNN、Random forest的分類效果。從表8結果可以看出:在同樣樣本數據下,標簽傳播算法的分類效果要優于其余對比算法。

表8 各算法的標簽傳播分類準確率

4 結 語

P2P網絡借貸行業在迅猛發展的同時,風險事件時有發生。合理且科學的P2P網絡借貸平臺分類有助于能為普通投資者提供投資決策和風險識別輔助支持。鑒于此,本文從投資者視角出發,結合P2P網絡借貸平臺的運營數據,首次開展基于標簽傳播的P2P網絡借貸平臺分類研究,提出了基于RBF和KNN的P2P網絡借貸平臺分類算法。實驗結果表明,基于標簽傳播的P2P網絡借貸平臺分類算法具有較高的識別正確率,且基于KNN的分類算法在平均性能和魯棒性上均優于基于RBF的分類算法。

需要指出的是,本文只是使用機器學習算法進行P2P網絡借貸平臺分類的初步研究,驗證機器學習算法應用到P2P網絡借貸平臺分類的可行性,在算法改進和效果上仍有改進空間。未來仍需深入研究P2P網絡借貸平臺分類的特征提取、標簽算法的抗噪聲性、穩定性、敏感性和振蕩性等問題[14,17-21]、貝葉斯學習[22]、極限學習機[23]、隨機森林[24]、SVM[25]、粗糙集[26]等方法對P2P網絡借貸平臺分類的應用研究。

[1] 網貸之家. 3月網貸行業報告[EB/OL].[2017-04-08.].http://news.p2peye.com/article-494445-1.html.

[2] 朱宗元, 王景裕.P2P網絡借貸平臺效率的綜合評價:基于AHP-DEA方法[J].南方金融, 2016(4): 31- 38.

[3] 王正位, 向佳, 廖理,等.互聯網金融環境下投資者學習行為的經濟學分析[J].數量經濟技術經濟研究, 2016(3): 95- 111.

[4] 于曉虹, 樓文高. 基于隨機森林的P2P網貸信用風險評價、預警與實證研究[J]. 金融理論與實踐, 2016(2): 53- 58.

[5] Guo Y, Zhou W, Luo C, et al. Instance-based credit risk assessment for investment decision in P2P lending[J]. European Journal of Operational Research, 2015, 249(2): 417- 426.

[6] 廖理, 吉霖, 張偉強. 借貸市場能準確識別學歷的價值嗎?——來自P2P平臺的經驗證據[J]. 金融研究, 2015(3): 146- 159.

[7] 王會娟, 廖理. 中國P2P網絡借貸平臺信用認證機制研究-來自"人人貸"的經驗證據[J]. 中國工業經濟, 2014,13(4): 136- 147.

[8] 廖理, 張偉強. P2P網絡借貸實證研究: 一個文獻綜述[J]. 清華大學學報(哲學社會科學版), 2017, 32(2):186- 196.

[9] 廖理, 李夢然, 王正位. 中國互聯網金融的地域歧視研究[J]. 數量經濟技術經濟研究, 2014, 31(5): 54- 70.

[10] 田民, 劉思峰, 卜志坤. 灰色關聯度算法模型的研究綜述[J]. 統計與決策, 2008(1): 24- 27.

[11] 虞曉芬, 傅玳. 多指標綜合評價方法綜述[J]. 統計與決策, 2004(11): 119- 121.

[12] Zhu X, Ghahramani Z, Mit T J. Semi-Supervised Learning with Graphs[C]// International Joint Conference on Natural Language Processing. 2005: 2465- 2472.

[13] 劉建偉, 劉媛, 羅雄麟. 半監督學習方法[J]. 計算機學報, 2015, 38 (8): 1592- 1617.

[14] 汪西莉, 藺洪帥. 最小代價路徑標簽傳播算法[J]. 計算機學報, 2016, 39(7): 1407- 1418.

[15] Yang J, Yang J Y. Why can LDA be performed in PCA transformed space?[J]. Pattern Recognition, 2003, 36(2):563- 566.

[16] Zhang M L, Zhou Z H. M L-KNN : A lazy learning approach to multi-label learning[J]. Pattern Recognition, 2007, 40(7):2038- 2048.

[17] 王世旭, 呂干云. 基于標簽傳播半監督學習的電壓暫降源識別[J]. 電力系統及其自動化學報, 2013, 25(4): 34- 38.

[18] 趙卓翔, 王軼彤, 田家堂,等. 社會網絡中基于標簽傳播的社區發現新算法[J]. 計算機研究與發展, 2011, 48(3): 8- 15.

[19] 石夢雨, 周勇, 邢艷. 基于LeaderRank的標簽傳播社區發現算法[J]. 計算機應用, 2015, 35(2): 448- 451.

[20] 石立新, 張俊星. 基于勢函數的標簽傳播社區發現算法[J]. 計算機應用, 2014, 34(3): 738- 741.

[21] 趙文濤, 趙好好, 孟令軍. 基于相關拓撲勢的社團發現算法[J]. 計算機應用與軟件, 2017, 34(1): 258- 262.

[22] 蘇志同, 李楊. 改進的增量貝葉斯模型的研究[J]. 計算機應用與軟件, 2016, 33(8):254- 259.

[23] 楊毅, 盧誠波. 一種基于極限學習機的缺失數據填充方法[J]. 計算機應用與軟件, 2016, 33(10): 243- 246.

[24] 姚立, 張曦煌. 基于主題模型的改進隨機森林算法在文本分類中的應用[J]. 計算機應用與軟件, 2017, 34(8): 173- 178.

[25] 王丹丹, 祖穎, 朱平. AABC-SVM模型及其在商品評論情感分類中的應用[J]. 計算機應用與軟件, 2017, 34(9): 33- 37.

[26] 王興柱, 顏君彪, 曾慶懷. 基于熵重要測度權重粗糙集的阿爾法多層凝聚入侵分類[J]. 計算機應用與軟件, 2016, 33(3): 320- 323.

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 亚洲精品无码日韩国产不卡| 亚洲人成高清| 91在线一9|永久视频在线| 鲁鲁鲁爽爽爽在线视频观看| 国产乱肥老妇精品视频| 91美女视频在线观看| 国产尤物视频在线| aⅴ免费在线观看| 国产精品无码久久久久久| 亚洲AV无码乱码在线观看裸奔| 日日拍夜夜操| 五月婷婷综合网| 亚洲精品欧美日韩在线| 亚洲欧美h| 亚洲成人网在线观看| 97超级碰碰碰碰精品| 麻豆国产精品视频| 亚洲国产日韩欧美在线| 一级毛片在线播放| 久久久精品无码一区二区三区| 中文字幕天无码久久精品视频免费 | 亚洲AV电影不卡在线观看| 一区二区三区四区精品视频| 99久久国产综合精品2020| 国产精品毛片在线直播完整版| 国产精品女主播| 欧美精品亚洲精品日韩专区| 国产在线八区| 91蝌蚪视频在线观看| 人妻无码AⅤ中文字| 免费国产高清视频| 免费a在线观看播放| 凹凸精品免费精品视频| 久草青青在线视频| 国产成人亚洲无吗淙合青草| 色妞www精品视频一级下载| 久久黄色毛片| 久久中文字幕不卡一二区| 欧美a级在线| 精品色综合| 久久中文无码精品| 一级香蕉视频在线观看| 高清欧美性猛交XXXX黑人猛交| 激情综合五月网| 九九精品在线观看| 伊人精品成人久久综合| 四虎免费视频网站| 成人亚洲国产| 国产91av在线| 欧美精品二区| 日韩AV无码一区| 日韩在线视频网站| 亚洲成人网在线观看| 在线视频亚洲色图| 青青青伊人色综合久久| 亚洲色欲色欲www在线观看| 国产一区二区人大臿蕉香蕉| 99无码熟妇丰满人妻啪啪| 国产成人精品免费视频大全五级| 啪啪永久免费av| 午夜激情婷婷| 五月婷婷导航| 久久国产精品娇妻素人| 久久激情影院| 日韩在线欧美在线| 四虎国产在线观看| 国产在线视频欧美亚综合| 国产网友愉拍精品| 成人日韩视频| 美女无遮挡被啪啪到高潮免费| 美女潮喷出白浆在线观看视频| 精品無碼一區在線觀看 | 久久综合丝袜长腿丝袜| 91无码视频在线观看| 永久成人无码激情视频免费| 亚洲AV色香蕉一区二区| 国产美女91视频| 青青草91视频| 大陆精大陆国产国语精品1024| 免费看的一级毛片| 亚洲精品无码高潮喷水A| 免费国产在线精品一区 |