馮旭日,張晶晶
(遼寧工程技術(shù)大學(xué) 工商管理學(xué)院,遼寧 葫蘆島 125105)
基于Fisher判別法的P2P網(wǎng)絡(luò)借貸平臺(tái)信譽(yù)等級(jí)評(píng)價(jià)模型
馮旭日,張晶晶
(遼寧工程技術(shù)大學(xué) 工商管理學(xué)院,遼寧 葫蘆島 125105)
P2P網(wǎng)絡(luò)借貸是一種新興的互聯(lián)網(wǎng)金融,平臺(tái)的信譽(yù)是影響投資者選擇平臺(tái)的主要影響因素之一。選取成交積分、人氣積分、營(yíng)收積分、分散積分、杠桿積分、透明度、品牌、流動(dòng)性、收益積分9個(gè)影響因素作為判別平臺(tái)等級(jí)預(yù)測(cè)的評(píng)價(jià)指標(biāo),同時(shí)對(duì)這9個(gè)評(píng)價(jià)指標(biāo)做主成分分析,提取出3個(gè)主要成分,用Fisher判別法進(jìn)行訓(xùn)練預(yù)測(cè),建立了基于主成分分析的網(wǎng)絡(luò)借貸平臺(tái)信譽(yù)等級(jí)預(yù)測(cè)的Fisher判別模型。通過對(duì)“網(wǎng)貸之家”公布的37組平臺(tái)數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù)集進(jìn)行模型的訓(xùn)練,12組數(shù)據(jù)作為該預(yù)測(cè)模型的測(cè)試數(shù)據(jù),進(jìn)行網(wǎng)絡(luò)借貸平臺(tái)信譽(yù)等級(jí)的預(yù)測(cè),同時(shí)通過其他預(yù)測(cè)模型預(yù)測(cè)結(jié)果的對(duì)比,驗(yàn)證了Fisher判別法在網(wǎng)絡(luò)借貸平臺(tái)信譽(yù)等級(jí)的預(yù)測(cè)中具有較低的誤判率,其誤判率僅為1/12。
P2P網(wǎng)絡(luò)借貸;平臺(tái)信譽(yù);主成分分析;Fisher判別法
P2P(peer-to-peer lending)網(wǎng)絡(luò)借貸,是指?jìng)€(gè)人與個(gè)人之間,不以銀行等金融中介機(jī)構(gòu)為媒介,直接通過第三方中介平臺(tái)進(jìn)行的網(wǎng)絡(luò)借貸交易,借款人在平臺(tái)發(fā)放借款標(biāo),投資人競(jìng)標(biāo)成功后向借款人放貸的行為[1-3]。P2P網(wǎng)絡(luò)借貸致力于將社會(huì)閑散資金收集起來,為急需小額貸款的個(gè)人、企業(yè)解決融資難問題,使更多窮人得到金融服務(wù)。2014年“互聯(lián)網(wǎng)金融”首次進(jìn)入政府工作報(bào)告,各地關(guān)于互聯(lián)網(wǎng)金融的指導(dǎo)意見相繼出臺(tái),這意味著P2P網(wǎng)絡(luò)借貸平臺(tái)將更加合法化、合規(guī)化。截至2014年上半年,我國(guó)P2P網(wǎng)貸平臺(tái)數(shù)量約達(dá)1184家,網(wǎng)貸行業(yè)成交量約為818.37億元,行業(yè)整體累計(jì)借款人數(shù)18.9萬,累計(jì)投資人數(shù)44.36萬。網(wǎng)貸行業(yè)現(xiàn)處于未飽和狀態(tài),還存在較大發(fā)展空間。
受穆罕默德?尤努斯創(chuàng)建的小額貸款項(xiàng)目的啟發(fā),2005年世界首家P2P網(wǎng)絡(luò)借貸平臺(tái)——Zopa在英國(guó)成立,2007年中國(guó)借鑒國(guó)外成功平臺(tái)的成功案例,結(jié)合國(guó)內(nèi)互聯(lián)網(wǎng)金融的現(xiàn)狀,將P2P網(wǎng)絡(luò)借貸引入中國(guó),建立了國(guó)內(nèi)首家網(wǎng)絡(luò)借貸平臺(tái)——拍拍貸。目前國(guó)外知名的P2P網(wǎng)絡(luò)借貸平臺(tái)還包括:美國(guó)的Prosper和Lengding Club、德國(guó)的Auxmoney、日本的Aqush、韓國(guó)Popfunding、西班牙的Comunitae以及巴西的Fairplace等[4]。英美國(guó)家P2P在線交易正成長(zhǎng)為可替代傳統(tǒng)儲(chǔ)蓄投資工具的一種新型投資模式;歐亞國(guó)家,許多P2P借貸網(wǎng)站開始對(duì)公眾服務(wù)[5]。國(guó)內(nèi)則形成了以拍拍貸、宜信、紅嶺創(chuàng)投為代表的三種不同模式的P2P網(wǎng)絡(luò)借貸平臺(tái)[4]。2014年,中國(guó)銀行業(yè)監(jiān)督管理委員會(huì)接手P2P網(wǎng)絡(luò)借貸行業(yè)的監(jiān)管,這對(duì)存在亂象、監(jiān)管不健全等現(xiàn)象的網(wǎng)絡(luò)借貸行業(yè)是一個(gè)新的機(jī)遇和挑戰(zhàn)。
然而,受2013年“跑路潮”和“倒閉潮”的影響,網(wǎng)貸行業(yè)成交總量呈現(xiàn)明顯下降趨勢(shì),人們對(duì)P2P網(wǎng)絡(luò)借貸平臺(tái)的質(zhì)疑聲也越來越大。網(wǎng)貸平臺(tái)在提供服務(wù)時(shí)代表著借貸雙方的利益,為了幫助借貸雙方選擇正確、可信的投資平臺(tái),本文從網(wǎng)貸之家收集數(shù)據(jù),建立了基于Fisher判別法的P2P網(wǎng)絡(luò)借貸平臺(tái)信譽(yù)等級(jí)評(píng)價(jià)模型,為促進(jìn)平臺(tái)又好又快的發(fā)展做出貢獻(xiàn)。
目前關(guān)于P2P網(wǎng)絡(luò)借貸的研究主要集中在以下方面:
第一,借款者違約行為研究。陳霄、丁曉裕和王貝芬將影響逾期行為的因素分為信用、個(gè)人、標(biāo)的及往期借款四個(gè)特征維度研究借款者違約風(fēng)險(xiǎn)[6]??娚徲⒑完惤瘕堁芯可鐣?huì)資本對(duì)借款者違約行為的影響[7]。李廣明、諸唯君和周歡則對(duì)P2P網(wǎng)絡(luò)融資平臺(tái)中具有拖欠貸款行為的小額貸款者的基本特征進(jìn)行分析,提取具有拖欠貸款可能性的小額貸款者的關(guān)鍵特征[8]。Lin等通過樣本分析,認(rèn)為社交網(wǎng)絡(luò)能夠增加融資成功的概率,并使融資成本即借款利率降低,同時(shí)也能降低事后違約率[9]。
第二,投資者投資決策研究。陳冬宇、李偉軍和丁婕采用數(shù)理統(tǒng)計(jì)方法從出借人的出借意愿角度,對(duì)影響借貸成功率的關(guān)鍵因素及其影響程度進(jìn)行了研究。結(jié)果表明,網(wǎng)絡(luò)借貸市場(chǎng)的投資行為有其內(nèi)在特征,以網(wǎng)絡(luò)購(gòu)物為基礎(chǔ)的傳統(tǒng)電子商務(wù)領(lǐng)域的研究成果在網(wǎng)絡(luò)借貸市場(chǎng)中并不完全適用[10]。朱浩和鄭海超等以拍拍貸網(wǎng)站用戶為研究對(duì)象,分析信任和感知風(fēng)險(xiǎn)對(duì)出借意愿的影響及前導(dǎo)因素[11]。Mingfeng Lin等研究指出,借款人的個(gè)人信息是投資者對(duì)貸款人還款可能性進(jìn)行評(píng)估的主要影響因素,影響投資者的投資決策[12-13]。
第三,借貸成功率研究。溫小霓、武小娟的研究表明借款利率、借款人歷史失敗次數(shù)對(duì)借款成功率有負(fù)的影響,而借款金額、借款人歷史成功次數(shù)、信用積分、審核項(xiàng)目數(shù)對(duì)借款結(jié)果有正的影響[1]。陳建中、寧欣以人人貸為例,對(duì)個(gè)人信息對(duì)借貸成功率的影響進(jìn)行實(shí)證分析[14]。Puro等通過實(shí)證分析驗(yàn)證了借款額度會(huì)對(duì)借款成功率和借款利率產(chǎn)生顯著影響,為了降低借款利率并提高借款成功率,借款人必須降低借款額度[15]。
第四,P2P網(wǎng)絡(luò)借貸平臺(tái)。錢金葉、楊飛研究我國(guó)P2P網(wǎng)貸的發(fā)展現(xiàn)狀及前景,揭示了我國(guó)P2P網(wǎng)貸的發(fā)展面臨著個(gè)人信用體系不健全、相關(guān)法律法規(guī)缺失和行業(yè)自律性較差等障礙[16]。徐文杰則基于雙邊市場(chǎng)的視角對(duì)P2P網(wǎng)貸平臺(tái)定價(jià)問題進(jìn)行研究[17]。萬?;鶎?duì)我國(guó)P2P網(wǎng)絡(luò)借貸平臺(tái)的成長(zhǎng)模型進(jìn)行研究[18]。
以上關(guān)于P2P網(wǎng)絡(luò)借貸平臺(tái)的研究方法中,大部分沒有考慮各個(gè)指標(biāo)之間信息疊加導(dǎo)致的誤判問題。因此,筆者將用主成分分析法對(duì)P2P網(wǎng)貸中影響借貸雙方選擇平臺(tái)的因素進(jìn)行信息提煉,把多個(gè)彼此相關(guān)聯(lián)的指標(biāo)變量通過線性組合轉(zhuǎn)化為彼此獨(dú)立新的樣本指標(biāo),更加有效地描述不同平臺(tái)的特征。然后,將結(jié)合Fisher判別分析法對(duì)處理過的樣本數(shù)據(jù)進(jìn)行判別,建立基于主成分分析的Fisher判別模型來判別P2P網(wǎng)絡(luò)借貸平臺(tái)。
(一)主成分分析
主成分分析(Principal Components Analysis, PCA)是數(shù)學(xué)上處理降維的一種方法,它的基本思想就是設(shè)法將原來眾多具有一定相關(guān)性的指標(biāo),重新組合成一組新的相互無關(guān)的綜合指標(biāo)來代替原來指標(biāo),同時(shí)根據(jù)需要從中選取幾個(gè)較少的綜合指標(biāo)盡可能多地反映原來指標(biāo)的信息[19]。本文通過對(duì)樣本相關(guān)矩陣的內(nèi)部結(jié)構(gòu)關(guān)系的研究,找出影響投資者選擇平臺(tái)幾個(gè)綜合指標(biāo),使綜合指標(biāo)為原來變量的線性組合。綜合指標(biāo)不僅保留了原始變量的主要信息,彼此之間又不相關(guān),又比原始變量具有某些更優(yōu)越的性質(zhì),使得我們?cè)谠u(píng)析平臺(tái)等級(jí)時(shí)容易抓住主要矛盾[20-24]。其數(shù)學(xué)描述如下:
設(shè)有n個(gè)樣本,每個(gè)樣本觀測(cè)k項(xiàng)指標(biāo)(變量)x1,x2,…,xk,得到數(shù)據(jù)矩陣Xk*n:

用樣本表達(dá)其協(xié)方差矩陣COV(X)的元素Cij,則有:

式(2)中,E()表示求均值,i,j=1,2,…,k。用數(shù)據(jù)矩陣X的k個(gè)向量(即k個(gè)指標(biāo)向量)X1,X2,…,Xk,作線性組合為:

簡(jiǎn)記為:

式(4)中,Y的協(xié)方差矩陣COV(Y),為對(duì)角矩陣(即指標(biāo)Yi之間是不相關(guān)的)。Y的方差盡可能大(即對(duì)n個(gè)對(duì)象的分辨率盡可能強(qiáng),或者說信息損失盡可能小)。然后再?gòu)腨1,Y2,…,Yk中,選出對(duì)方差貢獻(xiàn)最大的部分指標(biāo),就達(dá)到了主成分分析的目的。
(二)Fisher判別法
Fisher判別分析方法的基本思想是投影[20],即將高維數(shù)據(jù)點(diǎn)投影到低維空間上,使數(shù)據(jù)點(diǎn)就變得比較密集。利用一元方差分析的思想建立線性判別函數(shù),確定了一組在類之間實(shí)現(xiàn)最大離散、在類內(nèi)部實(shí)現(xiàn)最小離散的投影向量,然后依據(jù)判別函數(shù)來預(yù)測(cè)待判樣本的分類。其數(shù)學(xué)描述如下[25-27]:
設(shè)有m個(gè)總體,G1,G2,…,Gm每個(gè)總體的特性指標(biāo)都是p個(gè),相應(yīng)的p維均值向量和p*p階協(xié)方差矩陣分別為u1,u2,…,um,v1,v2,…,vm。對(duì)任意新給的樣本x=(x1,x2,…,xp)T,考慮其線性函數(shù):

式(5)中,u為p維向量,而Y是一維的隨機(jī)變量),在x來自Gi的條件下,Y在各類中的均值和方差為:

令B0是Y在各類中的均值ei的離差平方和:

B0反映出均值ei之間的離散程度。離散程度越大就越有可能把G1,G2,…,Gm劃分開來。
令E0是Y在各類中的方差之和:

若B0/E0越大,則類別的可分性越大。Fisher典則判別方法的思想,就是選能夠使B0/E0最大的u,作為判別函數(shù)公式(5)中的系數(shù)向量。對(duì)于預(yù)測(cè)樣本,根據(jù)公式(5)計(jì)算數(shù)值,其值Y離哪個(gè)總體Gi的均值uTvi近,則樣本x就屬于哪個(gè)總體。
(一)影響指標(biāo)的選取
為了預(yù)測(cè)P2P網(wǎng)絡(luò)貸款平臺(tái)的信譽(yù)等級(jí),文中選取了與平臺(tái)相關(guān)的9個(gè)判別指標(biāo)為平臺(tái)等級(jí)預(yù)測(cè)指標(biāo),包括:成交積分(X1)、人氣積分(X2)、營(yíng)收積分(X3)、分散積分(X4)、杠桿積分(X5)、透明度(X6)、品牌(X7)、流動(dòng)性(X8)、收益積分(X9),網(wǎng)絡(luò)平臺(tái)信譽(yù)等級(jí)分為四級(jí),包括優(yōu)(G1)、良(G2)、中(G3)、差(G4)。
選取的9個(gè)影響指標(biāo)中,成交積分是根據(jù)當(dāng)月實(shí)際成交量和當(dāng)月時(shí)間加權(quán)成交量加權(quán)得出的,成交量積分越高,表明平臺(tái)成交量越高;人氣積分是根據(jù)投資人人數(shù)、借款人人數(shù)加權(quán)得出的,人氣積分越高,表明在平臺(tái)投資或者借款的人越多;營(yíng)收積分是根據(jù)時(shí)間加權(quán)成交量確定的;分散積分是根據(jù)單人借款金額、單人投資金額以及借款集中度加權(quán)得出,分散積分越高,表明平臺(tái)借款人越分散,平臺(tái)運(yùn)營(yíng)風(fēng)險(xiǎn)越低;杠桿積分是對(duì)于承諾本金保障的平臺(tái),目前簡(jiǎn)單的定義平臺(tái)的杠桿=平臺(tái)待收/(注冊(cè)資金×做實(shí)程度+風(fēng)險(xiǎn)準(zhǔn)備金+擔(dān)保公司注冊(cè)資金×0.5%×做實(shí)程度),對(duì)部分借款業(yè)務(wù)來源于無關(guān)聯(lián)的小貸公司或平臺(tái)自身為擔(dān)保公司的給予適當(dāng)調(diào)整,杠桿積分越高,表明平臺(tái)可能的資金杠桿越小,承受的運(yùn)營(yíng)風(fēng)險(xiǎn)越低;透明度是根據(jù)平臺(tái)是否公布公司證照、逾期數(shù)據(jù)、借款資料及抵押資料照片、運(yùn)營(yíng)數(shù)據(jù)、借款人基本信息及信用等級(jí)等信息給予相應(yīng)的評(píng)分,透明度積分越高,表明平臺(tái)的信息公開得越多、越透明;品牌是根據(jù)資金認(rèn)可度、上線時(shí)間、總部城市、Alexa排名、股東背景、團(tuán)隊(duì)背景、是否自主研發(fā)平臺(tái)、平臺(tái)墊付模式、事件影響等信息給予相應(yīng)評(píng)分,品牌積分越高,表明平臺(tái)知名度越高、越得到投資人的認(rèn)可;流動(dòng)性是主要參照平臺(tái)借款期限,是否可以凈值借款以及凈值借款的比例;收益積分是根據(jù)平臺(tái)綜合收益率得出。
(二)判別指標(biāo)的主成分分析
網(wǎng)絡(luò)貸款平臺(tái)信譽(yù)等級(jí)受眾多因素的影響,如何分析提取主要影響因素是預(yù)測(cè)網(wǎng)絡(luò)貸款平臺(tái)信譽(yù)等級(jí)的關(guān)鍵問題。文中確定9個(gè)影響網(wǎng)絡(luò)貸款平臺(tái)信譽(yù)等級(jí)的因素為分析指標(biāo),通過“網(wǎng)貸之家”網(wǎng)站收集了49條相關(guān)的等級(jí)評(píng)定樣本數(shù)據(jù),其中前37組數(shù)據(jù)為訓(xùn)練樣本,后12組數(shù)據(jù)為測(cè)試樣本,數(shù)據(jù)見表1所示(篇幅有限,僅為部分?jǐn)?shù)據(jù))。
為了減少冗余因素對(duì)模型預(yù)測(cè)準(zhǔn)確率的影響,對(duì)表1中數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,對(duì)標(biāo)準(zhǔn)化處理后的樣本數(shù)據(jù)進(jìn)行主成分分析,由各指標(biāo)之間的Spearman等級(jí)相關(guān)系數(shù)矩陣(表2)可知,這9個(gè)指標(biāo)之間存在顯著的相關(guān)性,如成交積分(X1)和人氣積分(X2)之間的Spearman相關(guān)系數(shù)為0.801,成交積分(X1)和營(yíng)收積分(X3)之間的Spearman相關(guān)系數(shù)為0.909,樣本指標(biāo)之間存在信息重疊,隱藏著冗余因素。如果直接使用這9個(gè)指標(biāo)數(shù)據(jù)對(duì)P2P網(wǎng)絡(luò)貸款平臺(tái)等級(jí)進(jìn)行評(píng)定,必定會(huì)對(duì)預(yù)測(cè)模型的預(yù)測(cè)精度造成影響,可能發(fā)生等級(jí)誤判,誤導(dǎo)借貸人對(duì)平臺(tái)的選擇。因此,文中利用主成分分析法具有對(duì)屬性進(jìn)行約簡(jiǎn),消除冗余因素的作用,對(duì)樣本數(shù)據(jù)進(jìn)行主成分的提取,減少冗余信息對(duì)預(yù)測(cè)模型的干擾。

表1 樣本數(shù)據(jù)

表2 各指標(biāo)的Spearman等級(jí)相關(guān)系數(shù)矩陣
經(jīng)過主成分分析處理后,得到碎石圖見圖1,由碎石圖可看出前三個(gè)主成分因子特征值的變化比較明顯,但從第3個(gè)主成分因子之后的特征值變化就比較平緩。根據(jù)碎石圖準(zhǔn)則,提取前3個(gè)主成分Y1、Y2和Y3,這三個(gè)主成分?jǐn)?shù)據(jù)包含了原始數(shù)據(jù)中95.337%的信息,能夠有效解釋原始樣本信息。三個(gè)主成分對(duì)應(yīng)的特征根分別為3.880、1.401、1.053,由旋轉(zhuǎn)前的因子負(fù)載矩陣和特征根對(duì)應(yīng)求得相應(yīng)的特征向量矩陣,見表3所示。

圖1 碎石圖

表3 特征向量矩陣
由表3中,a1、a2、a3對(duì)應(yīng)的列為旋轉(zhuǎn)前主成分因子負(fù)載,t1、t2、t3對(duì)應(yīng)的列為主成分Y1、Y2和Y3的特征向量,根據(jù)特征向量矩陣,提取出來的主成分因子Y1、Y2和Y3與原始變量之間的關(guān)系表達(dá)式為:

根據(jù)以上3個(gè)公式可求得3個(gè)主成分對(duì)應(yīng)的值。
(三)信譽(yù)等級(jí)Fisher判別模型
利用表1中前37組樣本數(shù)據(jù)進(jìn)行訓(xùn)練,以G1、G2、G3、G44個(gè)平臺(tái)等級(jí)為4個(gè)不同總體,通過主成分分析得到的3個(gè)主成分Y1、Y2和Y3,作為Fisher判別分析模型的3個(gè)判別指標(biāo)。通過樣本數(shù)據(jù)的訓(xùn)練得到的Fisher判別函數(shù)如下:
第一判別函數(shù):
Z1=1.029Y1+0.094Y2+0.243Y3
第二判別函數(shù):
Z2=0.003Y1+0.729Y2+0.865Y3
第三判別函數(shù):
Z3=0.001Y1+0.722Y2-0.551Y3
表4所示為第1、第2和第3判別函數(shù)在各分類中的中心值。以訓(xùn)練得到的第1個(gè)判別式為例,在G1類等級(jí)中的中心值為4.030,在G2類等級(jí)中的中心值為1.439,在G3類等級(jí)中的中心值為-0.784,在G4類等級(jí)中的中心值為-2.113。通過Fisher判別函數(shù)對(duì)待測(cè)樣本計(jì)算函數(shù)值,并與表4中4類等級(jí)的中心值的距離比較來判斷待識(shí)別樣本的組別。
表5所示為3個(gè)判別函數(shù)對(duì)應(yīng)的特征根,由表5可知,通過對(duì)Fisher判別函數(shù)的求解,得到三個(gè)判別函數(shù)對(duì)應(yīng)的三個(gè)特征根,分別是λ1=3.281,λ2= 0.087,λ3=0.0。表5中對(duì)應(yīng)的第一個(gè)判別函數(shù)的判別能力:

因此選用第一判別函數(shù)作為Fisher判別函數(shù)對(duì)新樣本進(jìn)行判別,不影響判別效果。同時(shí),Wilks’Lambda統(tǒng)計(jì)量Sig。檢驗(yàn)值為0.0,小于0.01的顯著水平,認(rèn)為該Fisher判別函數(shù)具有顯著分類效果。將表1中37組訓(xùn)練樣本數(shù)據(jù)回代到Fisher判別模型中,有3個(gè)樣本誤判,將2號(hào)樣本、18號(hào)樣本和27號(hào)樣本錯(cuò)誤分類,回判準(zhǔn)確率為91.89%。

表4 關(guān)聯(lián)系數(shù)判別函數(shù)在各分類的中心值

表5 特征根
通過37組訓(xùn)練樣本數(shù)據(jù)建立Fisher判別分類模型,回代驗(yàn)證中有3個(gè)樣本誤判,其誤判率為8.1%,具有較好的分類能力。用該方法建立的Fisher判別模型對(duì)表1中最后12組測(cè)試樣本進(jìn)行分類驗(yàn)證,同時(shí)對(duì)比了SVM預(yù)測(cè)模型和BP神經(jīng)網(wǎng)絡(luò)(BPNN)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,其中建立3-15-4結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)為3,代表3個(gè)主成分因子,網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)為15,網(wǎng)絡(luò)輸出層節(jié)點(diǎn)數(shù)為4([1 0 0 0]代表G1,[0 1 0 0]代表G2,[0 0 1 0]代表G3,[0 0 0 1]代表G4),以同樣的樣本數(shù)據(jù)進(jìn)行訓(xùn)練預(yù)測(cè)。對(duì)比結(jié)果見表6。圖2是SVM和BPNN模型預(yù)測(cè)結(jié)果(1表示G1,2表示G2,3表示G3,4表示G4),由圖2可知SVM和BPNN模型對(duì)P2P網(wǎng)絡(luò)貸款平臺(tái)的信譽(yù)等級(jí)均存在錯(cuò)誤識(shí)別。同時(shí),由表6對(duì)比結(jié)果得到,SVM預(yù)測(cè)模型將2號(hào)樣本、4號(hào)樣本和9號(hào)樣本誤判,誤判率為1/4;BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型將1號(hào)樣本、3號(hào)樣本、6號(hào)樣本和8號(hào)樣本誤判,誤判率為1/3;而本文中的Fisher判別分析方法根據(jù)距離類的最小距離值進(jìn)行分類,其預(yù)測(cè)結(jié)果與真實(shí)值之間也存在錯(cuò)誤判別,將8號(hào)樣本誤判,但誤判率為1/12,低于其他對(duì)比模型。由此,本文基于主成分分析建立的Fisher網(wǎng)貸平臺(tái)信譽(yù)等級(jí)預(yù)測(cè)模型具有較高的準(zhǔn)確率。

表6 對(duì)比結(jié)果

圖2 預(yù)測(cè)結(jié)果
(1)本文在借鑒國(guó)內(nèi)外文獻(xiàn)理論基礎(chǔ)上,運(yùn)用主成分分析法,對(duì)影響P2P網(wǎng)絡(luò)貸款平臺(tái)信譽(yù)等級(jí)預(yù)測(cè)的9個(gè)因素,進(jìn)行了主成分提取,提取出3個(gè)主成分因子,對(duì)屬性進(jìn)行約簡(jiǎn),消除冗余信息對(duì)預(yù)測(cè)模型的影響,提高模型預(yù)測(cè)精度。
(2)文中建立了Fisher判別模型,通過主成分分析提取得到的3個(gè)主成分因子作為預(yù)測(cè)模型輸入變量,對(duì)網(wǎng)絡(luò)貸款平臺(tái)信譽(yù)等級(jí)進(jìn)行預(yù)測(cè)。同時(shí)對(duì)比了其他預(yù)測(cè)模型,對(duì)比的結(jié)果表明了基于主成分分析建立的Fisher判別模型具有較高的預(yù)測(cè)精度。
(3)文中初步嘗試建立基于主成分分析Fisher判別模型,對(duì)P2P網(wǎng)絡(luò)貸款平臺(tái)信譽(yù)等級(jí)進(jìn)行預(yù)測(cè)研究,但該預(yù)測(cè)模型仍有不足之處,存在誤判情況。在后續(xù)的研究工作中,對(duì)影響網(wǎng)絡(luò)貸款平臺(tái)等級(jí)的因素進(jìn)行充分考慮,收集更豐富的影響因素,對(duì)影響因素進(jìn)行更加充分的分析提取。同時(shí),尋找更好的預(yù)測(cè)模型,提高預(yù)測(cè)模型的判別能力,消除誤判。
[1]溫小霓,武小娟.P2P網(wǎng)絡(luò)借貸成功率影響因素分析——以拍拍貸為例[J].金融論壇,2014,219(3):3-8.
[2]吳小英,鞠穎.基于最小二乘法的網(wǎng)絡(luò)借貸模型[J].廈門大學(xué)學(xué)報(bào),2012,51(6):980-984.
[3]溫小霓,蔡瑞媛.基于用戶行為的P2P網(wǎng)絡(luò)借貸信用體系構(gòu)建[J].西部金融,2014,(2):73-77.
[4]錢金葉,楊飛.中國(guó)P2P網(wǎng)絡(luò)借貸的發(fā)展現(xiàn)狀及前景[J].金融論壇,2013,192(1):46-51.
[5]Slavin,B.Peer-to-Peer Lending-An Industry Insight[EB/OL].http://www.bradslavin.com/wp-content/uploads/2007/06/peer-to-peerlending,2007.
[6]陳霄,丁曉裕,王貝芬.民間借貸逾期行為研究——基于P2P網(wǎng)絡(luò)借貸的實(shí)證分析[J].金融論壇,2013,215(11):65-72.
[7]繆蓮英,陳金龍.P2P網(wǎng)絡(luò)借貸中社會(huì)資本對(duì)借款者違約風(fēng)險(xiǎn)的影響——以Prosper為例[J].金融論壇,2014,(3):9-15.
[8]李廣明,諸唯君,周歡.P2P網(wǎng)絡(luò)融資中貸款者欠款特征提取實(shí)證研究[J].商業(yè)時(shí)代,2011,(1):41-43.
[9]Lin,Mingfeng,Prabhala,N,and Viswanathan, R S.Judging Borrowers by the Company They Keep: Friendship Networks and Information Asymmetry in Online Peer-to-Peer Lending[J].ManagementScience,(1):17-35,2013.
[10]陳冬宇,李偉軍,丁婕.網(wǎng)絡(luò)借貸借款人決策輔助模型[J].吉林大學(xué)學(xué)報(bào),2012,30(6):591-597.
[11]陳冬宇,朱浩,鄭海超.風(fēng)險(xiǎn)、信任和出借意愿——基于拍拍貸注冊(cè)用戶的實(shí)證研究[J].管理評(píng)論,2014,26(1):150-158.
[12]Mingfeng Lin.Peer-to-peer Lending:An EmpiricalStudy[R].AMCIS 2009DoctoralConsortium.
[13]Mingfeng Lin NRPrabhalaand Siva Viswanathan.Judging Borrowers By The Company They Keep: Social Networks and Adverse Selection in Online Peerto-Peer Lending[J].2009.
[14]陳建中,寧欣.P2P網(wǎng)絡(luò)借貸中個(gè)人信息對(duì)借貸成功率影響的實(shí)證研究——以人人貸為例[J].財(cái)務(wù)與金融,2013,146(6):13-17.
[15]Puro L,and Teich J E.Wallenius Hannele, Wallenius Jyrki.Borrower Decision Aid for People-topeople Lending[J].Decision Support Systems,(4):52-60,2010.
[16]錢金葉,楊飛.中國(guó)P2P網(wǎng)絡(luò)借貸的發(fā)展現(xiàn)狀及前景[J].金融論壇,2012,193(1):46-51.
[17]徐文杰.P2P網(wǎng)絡(luò)借貸平臺(tái)定價(jià)問題研究——基于雙邊市場(chǎng)的視角[D].大連:東北財(cái)經(jīng)大學(xué),2013.
[18]萬?;?網(wǎng)絡(luò)借貸(P2P)平臺(tái)的成長(zhǎng)模型研究[D].大連:大連理工大學(xué),2013.
[19]林海明,張文霖.主成分分析與因子分析的異同和SPSS軟件——兼與劉玉玫、盧紋岱等同志商榷[J].統(tǒng)計(jì)研究,2005,(3):65-68.
[20]江冬明.主成分分析在證券市場(chǎng)個(gè)股評(píng)析中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,2001,20(3):28-32.
[21]馬慶國(guó).管理統(tǒng)計(jì)[M].北京:科學(xué)出版社,2008:308-335.
[22]仇冬芳,柯飛帆,李寶寶,等.基于主成分分析的江蘇省高技術(shù)服務(wù)業(yè)發(fā)展評(píng)價(jià)研究[J].科技與經(jīng)濟(jì),2011,24(6):47-51.
[23]裴玲玲,陳萬明,王正新.江蘇科技與經(jīng)濟(jì)發(fā)展的協(xié)調(diào)性分析[J].科技與經(jīng)濟(jì),2010,23(1):13-15.
[24]Richard A,Johnson DW W.Applied multivariate statisticalanalysis[M].Prentice Hall,2002.
[25]郝先虎.基于Fisher判別分析法的礦柱穩(wěn)定性研究[J].煤炭技術(shù),2014,33(3):11-14.
[26]周健,史秀志.沖擊地壓危險(xiǎn)性等級(jí)預(yù)測(cè)的Fisher判別分析方法[J].煤炭學(xué)報(bào),2010,35(s):22-27.
[27]董隴軍,李夕兵,白云飛.急傾斜煤層頂煤可放性分類預(yù)測(cè)的Fisher判別分析模型及應(yīng)用[J].煤炭學(xué)報(bào),2009,34(1):58-63.
(責(zé)任編輯:王淑云)
P2P lending is a kind ofemerging Internet finance,the reliability of the platform is themain factor affecting the investors chooses the platform.This article selects volume integral,sentiment,revenue integral,scattered integral,integral liquidity,transparency,brand,leverage,earnings integral nine discriminant platform level forecast factors as evaluation index,evaluation indexes of the nine family component analysis,to extract the threemain ingredients,trained prediction with the Fisher discriminantmethod,based on principal componentanalysis of the Fisher discriminantmodelofnetwork platform for lending credit rating.Released bymeans of"net house"of the 37 group platform data as the training sample data setsmodelof training,12 groupsofdata as testdata,the predictionmodel for prediction ofnetwork platform for lending credit rating by comparison with other predictionmodel to predict the resultat the same time,fisher discriminantmethod is verified in the network platform for lending credit rating predictionwith lowmisjudgment rate,themiscarriage rate isonly 1/12.
P2P Lending;platform credibility;principal component analysis;Fisher discriminant method
1003-4625(2014)11-0051-06
F832
A
2014-08-19
馮旭日(1966-),男,副教授,碩士研究生導(dǎo)師,研究方向:企業(yè)管理;張晶晶(1988-),女,遼寧營(yíng)口人,碩士研究生,研究方向:投資決策與風(fēng)險(xiǎn)研究。