電商賣家信用評分的多因素校正模型及有效性檢驗

2017-03-25 02:07:37許啟發王陶蔣翠俠

軟科學 2017年1期

許啟發+王陶+蔣翠俠

摘要：針對電子商務環境中賣家信用得分計算方式的不足，提出了相應的改進策略：引入主營業務占比、開店時長和賣家的買家身份信用三個因素，建立賣家信用評分的多因素校正模型。更進一步，提出店鋪的消費累積損失這一概念，并使用神經網絡分位數回歸模型和相應的評價指標，來驗證改進賣家信用得分在解釋店鋪消費累積損失中的有效性。最后，對淘寶網信用評分實踐進行研究，實證結果表明：賣家信用評分的多因素校正模型，不僅能夠成功地解釋店鋪消費累積損失，而且能夠更好地預測其未來取值變動規律，具有有效性。

關鍵詞：C2C；賣家信用得分；多因素校正模型；神經網絡分位數回歸；有效性檢驗

DOI：10.13956/j.ss.1001-8409.2017.01.23

中圖分類號：F7246；F224文獻標識碼：A 文章編號：1001-8409（2017）01-0105-04

Abstract： To overcome the deficiency of sellers credit scoring method in ecommerce， this paper sets up the corresponding improving strategy. And then， it introduces three factors including main business proportion， opening time of shop and sellers buyer credit to establish a sellers credit scoring multifactorial correction model. Further， it presents the concept of the cumulative consuming loss and use quantile regression neural networks （QRNN） model and corresponding evaluating index to verify the validity of the proposed sellers credit scoring method in explaining the cumulative consuming loss of shop. Finally， it conducts empirical study of sellers credit scoring on Taobao. Empirical results show that the sellers credit scoring multifactorial correction model is valid in practice since it can both successfully explain and accurately predict the cumulative loss of consumers.

Key words：C2C； sellers credit scoring； multifactorial correction model； quantile regression neural networks； validity test

引言

21世紀以來，中國電子商務發展迅猛。根據《第36次中國互聯網絡發展狀況統計報告》，截至2015年6月，中國網民規模達668億，互聯網普及率達488%。隨著中國網民規模的不斷擴大，網絡市場也隨之得到更大的發展，而C2C電子商務中賣家信用評價所存在的弊病也成為了亟待解決的問題。

Zhang等[1]在研究中系統分析了C2C中賣家信用欺詐的現象，并闡述了中國C2C市場中信用欺詐的發展歷史和信用欺詐的方式，總結了中國電商市場信用欺詐的特點及產生原因，同時也闡述了目前賣家信用計算方式的簡單累積效應，并以交易額權重、時間衰減系數、三個信用因子得到了新的動態信用計算模型。彭惠等[2]也指出了目前的累積信用評分的信用機制所存在的弊病，包括賣家信用分數主要基于累積效應、只增不減、買家評價積極性不高等問題，現行的信用評價體系已不能客觀反映賣家誠信，并且這種累積評分機制具有鼓勵賣家進行信用炒作的性質。

由于目前的信用模型計算方式所存在的弊端，許多研究都致力于提出新的信用機制或者計算模型用以改善。Zhang等[3]提出了一個基于用戶評論的信用評價模型，通過挖掘C2C用戶評論內容的信息，結合自然語言處理技術、觀點挖掘技術和主題模型技術進行信用打分，越高的分數對應越高的信用度。國內文獻中對于新的信用評價模型的研究也有很多，這些研究都對現行的評分機制進行了相應的改進，并獲得了相應的效果。于兆吉等[4]使用拉開檔次機制的模糊綜合評價法，放大了各個被評價主體間信用級別的差異；陳傳紅等[5]針對目前實踐中使用的信譽值計算模型的弊端，提出了相應改進策略；李旭芳[6]、甘早斌等[7]分別提出了新的信用評價模型，并得到了新的功能與發現。

綜上，可以看出已有研究工作主要存在以下不足：第一，多數研究主張摒棄目前網上店鋪的信用評分機制，鮮有文獻提及如何改進已有信用評分方法；第二，多數研究提出信用評分模型或算法，并沒有獲得有效性檢驗。為此，本文以淘寶網為研究對象，主要開展了以下三個方面新的研究工作：第一，通過對已有賣家信用評分機制缺陷進行分析，在信用評分方法中引入了三個因素（主營業務占比、開店時長、賣家的買家身份信用），建立賣家信用評分的多因素校正模型，用以改進信用評分方法；第二，提出衡量店鋪給消費者帶來損失的指標——店鋪消費累積損失，通過神經網絡分位數回歸（QRNN）模型，來驗證改進賣家信用得分在解釋店鋪消費累積損失中的有效性；第三，以淘寶網為例，將改進信用評分方法與原有信用評分機制進行比較，結果表明改進賣家信用得分不僅能夠有效地解釋店鋪消費者累積損失，而且能夠更好地預測其未來取值變動規律。

1信用評分理論基礎

信用評價是兩個主體相互信任的基礎，主要通過建立科學、合理的指標體系，運用恰當的綜合評價方法，對可信任程度進行量化評分。根據信用評價對象不同，可將其大體劃分為：個人信用評價和企業信用評價。

在個人信用評價方面，常見于金融研究領域，大多通過個人信息作為信用評價的基礎完成個人信用評定，如：易傳和等[8]以個人基本情況（包括年齡等）、個人工作情況、個人經濟情況、與金融機構關系、歷史信用記錄等指標作為信用評價基礎。

在企業信用評價方面，又可以細分為實體企業、B2C電商企業和C2C電商賣家的信用評價。實體企業的信用評價主要依靠企業的財務報表數據來評估企業履行約定的能力和意愿，其指標體系包括定性指標和定量指標，如：譚中明[9]在中小企業的信用評價中，使用基礎素質這個定性指標與財務狀況等定量指標作為信用評價的基礎。B2C企業的信用評價考慮了電子商務背景，如：王俊峰等[10]在對B2C企業進行信用評價時使用運營、償債、發展和網絡運營能力等指標。然而，C2C電商賣家的信用評價與上面討論的幾種信用評價有很大區別：第一，C2C電商賣家個人信息的不透明性；第二，C2C電商賣家財務信息的不充分性。因此，C2C電商賣家的信用評價既不能像個人信用評價時使用個人信息作為評價基準，也不能像實體企業或B2C電商企業一樣通過大量的財務數據進行信用評分。

綜上，C2C電商賣家的信用評價過程與其他對象存在很大差異，可以考慮通過其網上交易信息進行信用評價。

2電商賣家信用評分缺陷與改進

21目前信用評分機制的缺陷

淘寶網目前使用的信用評分機制具有代表性，主要采用信用分數累積方法，具體評分方式為：店鋪完成一筆交易之后，獲買家好評加1分、差評扣1分、中評不計分。

這種簡單的信用分數累加方法有以下幾個缺點：（1）開店時間早的賣家一般會比開店晚的賣家擁有更高的信用得分，但是并不能說明前者的信用水平就一定高于后者；（2）信用分數累加方法的無限增長性使得店鋪信用得分的比較失去了意義；（3）Zhang等[1]指出，這種信用評分的累積效應，使得后期進入的店鋪難以與早期店鋪競爭，促使一些急于求成的店鋪為了競爭而做出信用欺詐行為。

雖然這種信用分數累加方法存在弊病，但是越高的信用得分常常對應著更高的交易頻次，這樣的店鋪一般會對消費者有更大的保障。因此，信用分數累加方法也能在一定程度上體現賣家的信用狀況，可以對其中的不足進行改進，得到新的信用評分方法。

22對原始信用得分機制的改進

針對信用分數累加方法的缺點，考慮在其中加入以下因素：

（1）主營業務占比

主營業務占比是指淘寶店鋪中主要經營的產品交易量占總交易量的比重，能體現一個店鋪的主要經營方向。

在信用分數累加方法背景下，店鋪可以通過出售一些與主營業務不相關的物美價廉的產品，這類產品價格低、交易量大，且容易取得好評，從而使得店鋪快速獲得信用分數。但是賣家通過這種方式增加信用得分，會使得主營業務占比變低，所以通過加入主營業務占比因素，可以有效阻止賣家通過此方式進行信用分數的非常規獲取，使得信用分數更加真實地反映店鋪信用水平。

（2）店鋪開店時長

店鋪開店時長是指店鋪從開始營業至今的總時長。一般地，店鋪開店時長越長，往往在行業中占據更多的市場和利潤，并且在經營管理、客戶服務等方面擁有更多的經驗。

信用分數累加方法對于那些進入行業較晚的店鋪十分不利，制約了其獲得信用分數。網絡消費的從眾性使得那些早期進入且擁有更高賣家信用得分的店鋪獲得更多關注，自然使其擁有更多的交易機會，獲得更高的信用得分。這一因果鏈條，使得店鋪開店時長成為影響賣家信用得分的重要因素。為此，本文引入店鋪開店時長因素（以月為單位作為開店時長的周期）來部分抵扣信用得分隨開店時長增加而過分增長這一現象，改進信用分數累加方法的不足。

（3）賣家的買家身份信用

賣家的買家身份信用是指電商賣家在C2C平臺上作為買家進行交易后得到的信用累積。為了防止在購物過程中產生對自己店鋪不利的事件，電商賣家一般不會使用店鋪的賬戶進行網上消費，這使得正常電商賣家的買家身份信用分數保持在很低的水平。

現實中，存在賣家通過溝通達成協議進而互相購買彼此店鋪商品，但不發生實際交易的無金額虛假交易，實現賣家的買家身份信用分數的增長。所以，一個店鋪的買家身份信用得分可以從側面反映一個店鋪信用分數的虛假程度。為此，考慮在原始信用分數計算中加入賣家的買家身份信用因素，用以校正賣家信用分數中的虛假泡沫成分。

3模型與方法

針對已有賣家信用評分的不足，這里給出改進賣家信用評分方法，并建立其有效性檢驗方案。

31電商賣家信用評分多因素校正模型

32店鋪消費累積損失

為了檢驗改進信用評分方法的有效性，可以考慮信用評分與店鋪消費者效用之間的關系，若存在強的關聯關系，則表明建立的信用評分方法有效。然而，消費者效用難以直接度量，從正向去定義會忽視某些店鋪刻意刷好評現象。為此，本文從消費的不良結果方向提出店鋪消費累積損失這一概念，即店鋪消費的所有消費者在交易中所產生的損失累積和。

消費者在淘寶網進行消費的結果包括：第一，消費者對商品滿意并給出好評；第二，消費者對商品不滿意但仍接受了商品，給出中評或差評；第三，消費者對商品不滿意，不接受商品，選擇退貨且賣家同意退貨；第四，消費者對商品不滿意選擇退貨，但賣家不同意退貨從而產生糾紛。從這四種結果來看，只有第一種結果沒有對消費者造成損失，而后三種都或多或少地對消費者造成損失。

進一步，由于非好評率、退貨率及糾紛率都是以總交易筆數作為基數計算所得，而由于虛假交易與職業好評師的存在，使得非好評率、退貨率及糾紛率并不真實。因此，本文選擇非好評次數、退貨次數、糾紛次數作為定義店鋪的消費累計損失的指標，避免信用欺詐所導致的噪聲。定義店鋪消費累計損失R為：

R=a×A+b×B+c×C（7）

式（7）中，A、B、C分別為非好評次數、退貨次數、糾紛次數；a、b、c分別為其權重。根據實際經驗，給出差評、選擇退貨、產生糾紛對消費者造成影響的程度是逐漸遞增的，權重滿足：a

33有效性檢驗模型與指標

4實證研究

41數據與描述

根據中國互聯網信息中心2015年6月發布的《2014年中國網絡購物市場研究報告》，銷量排名前三的產品品類為：服裝鞋帽；電腦、通訊數碼產品及配件；日用百貨。為使研究更具有代表性，本文選取淘寶網主營業務為這三類產品的店鋪作為研究對象。本文使用八爪魚數據采集器直接從淘寶網抓取2015年10月29日共2671個店鋪的交易信息，使用淘寶網評定的賣家的買家身份信用等級數據代表賣家的買家身份信用水平。

表1報告了各變量的描述統計結果，可以看出：第一，主營業務占比、開店時長、買家身份信用等級的極差與標準差都較大，說明店鋪在這幾個因素方面的差異很大，這三個因素可能對賣家信用評分產生較大影響。第二，改進后所得賣家信用得分更為集中，其極差與標準差遠低于改進前的賣家信用得分，表現更加穩健。此外，改進前賣家信用得分累積水平很高，最高分為20270397，與之相比，多因素校正模型明顯降低了信用得分水平，最大值僅為194911。

42建模與分析

按照4∶1的比例，將整個樣本劃分為兩個部分：樣本內（樣本量為2137），樣本內數據用于模型擬合；樣本外（樣本量為534），樣本外數據用于模型預測。在使用神經網絡分位數回歸（QRNN）模型時，將懲罰參數固定為800，再根據BIC準則選出其隱含層節點數如表3所示。

型相比，QRNN模型在樣本內表現與樣本外表現兩個方面都優于前者，表現為R1（τ）的均值更大、QAAE（τ）的均值更小，意味著QRNN模型更適用于檢驗信用評分方法的有效性。第二，就QRNN模型的結果而言，改進后信用評分方法所得的R1（τ）均值都大于改進前方法，而前者的QAAE（τ）均值都小于后者，意味著改進信用評分方法是有效的，能夠更好地解釋和預測店鋪消費累積損失的變化。此外，改進后方法所得R1（τ）指標的標準差都要明顯小于改進前方法，而兩者的QAAE（τ）標準差則幾乎相當，這一結果表明：改進信用評分方法不僅有效，而且表現更加穩健。

5結論與啟示

針對目前賣家信用評分存在的弊端，本文提出了多因素校正模型，并對所提模型的有效性進行了檢驗。一方面，引入了三個影響因素：主營業務占比、開店時長、賣家的買家身份信用水平，對已有的信用評分方法進行改進，建立賣家信用評分的多因素校正模型；另一方面，通過定義店鋪消費累積損失、建立QRNN模型、選取評價指標等，提出了改進信用評分方法的有效性檢驗方案。

以淘寶網信用評分實踐為研究對象，通過實證研究得到：第一，加入了三個改進因素之后的賣家信用分數更符合其本身所代表的含義——反映店鋪給消費者帶來的損失。第二，多因素校正模型計算所得信用分數可以為其他信用模型提供一個基數，而不用完全摒棄原有的信用機制，這種方法更具有實際價值，為淘寶網為首的電商網站提供了信用機制改進的思路。第三，本文提出的方法同樣適用于其他信用機制或信用分數計算算法改進的檢驗。

參考文獻：

[1]Zhang Y， Bian J， Zhu W. Trust Fraud： A Crucial Challenge for Chinas E-commerce Market[J]. Electronic Commerce Research & Applications， 2013， 12（5）： 299-308.

[2]彭惠，王永瑞. C2C電子商務市場整體賣家信用分布研究[J]. 情報雜志， 2012， 31（5）： 122-127.

[3]Zhang X， Cui L， Wang Y. CommTrust： Computing Multi-dimensional Trust by Mining E-commerce Feedback Comments[J]. Knowledge & Data Engineering IEEE Transactions on， 2014， 26（7）： 1631-1643.

[4]于兆吉，胡祥培，毛強. 電子商務環境下信用評級的一種新方法[J]. 控制與決策， 2009， 24（11）： 1668-1672.

[5]陳傳紅，趙學鋒，張金隆. 在線信譽系統的應用現狀及問題應對[J]. 情報雜志， 2012， 31（8）： 171-176.

[6]李旭芳. 基于AHP的電商多維信譽的模型設計[J]. 統計與決策， 2014（11）： 179-182.

[7]甘早斌，曾燦，馬堯，等. 基于信任網絡的C2C電子商務信任算法[J]. 軟件學報， 2015（8）： 1946-1959.

[8]易傳和，彭江. 基于FAHP的個人信用評分模型[J]. 統計與決策， 2009 （15）： 67-70.

[9]譚中明. 中小企業信用評價體系研究[J]. 學術論壇， 2009， 32（5）： 123-127.

[10]王俊峰，吳海洋. 基于改進的TOPSIS法的B2C企業信用評價[J]. 軟科學， 2014， 28（6）： 21-24.

[11]Taylor J W. A Quantile Regression Neural Network Approach to Estimating the Conditional Density of Multiperiod Returns[J]. Journal of Forecasting， 2000， 19（4）： 299-311.

[12]何耀耀，許啟發，楊善林，等. 基于RBF神經網絡分位數回歸的電力負荷概率密度預測方法[J]. 中國電機工程學報， 2013， 33（1）： 93-98.

[13]許啟發，張金秀，蔣翠俠. 基于非線性分位數回歸模型的多期VaR風險測度[J]. 中國管理科學， 2015， 23（3）： 56-65.

[14]Koenker R. Goodness of Fit and Related Inference Processes for Quantile Regression[J]. Journal of the American Statistical Association， 1999， 94（448）： 1296-1309.

[15]Xu Q， Niu X， Jiang C， et al. The Phillips Curve in the US： A Nonlinear Quantile Regression Approach[J]. Economic Modelling， 2015， 49： 186-197.

（責任編輯：秦穎）

軟科學2017年1期

軟科學的其它文章: 沉淀成本、國有股最優比例與產能過剩分析; “絲綢之路經濟帶”交通設施投資對經濟增長效應分析; 社會地位、政府角色認知與公共服務滿意度; 大數據環境下商業銀行審計非結構化數據研究; PPP項目再談判過程的影響因素內在邏輯研究; PPP項目中公共代理機構對私人部門控制的構念與結構維度