999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于馬爾科夫鏈的電子商務(wù)信用風險預(yù)警模型構(gòu)建

2016-10-11 01:23:25王興芬教授北京信息科技大學(xué)計算機學(xué)院北京信息科技大學(xué)信息管理學(xué)院北京000
商業(yè)經(jīng)濟研究 2016年17期
關(guān)鍵詞:模型

■ 胡 斌 王興芬 教授(、北京信息科技大學(xué)計算機學(xué)院、北京信息科技大學(xué)信息管理學(xué)院 北京 000)

基于馬爾科夫鏈的電子商務(wù)信用風險預(yù)警模型構(gòu)建

■ 胡斌1王興芬2教授(1、北京信息科技大學(xué)計算機學(xué)院2、北京信息科技大學(xué)信息管理學(xué)院北京100101)

為解決電子商務(wù)交易過程中信用風險的問題,本文針對賣家信用構(gòu)建了一套預(yù)警模型。通過對賣家數(shù)據(jù)收集、清洗、構(gòu)建風險預(yù)警指標體系并建立基于馬爾科夫鏈的預(yù)警模型,進而利用相關(guān)樣本進行實驗分析,結(jié)果顯示其預(yù)警效果良好,具有一定的實際應(yīng)用價值。

電子商務(wù)信用風險指標體系預(yù)警馬爾科夫鏈

引言

電子商務(wù)信用問題已經(jīng)成為電子商務(wù)的瓶頸,如何對賣家進行信用評估和風險預(yù)警是電子商務(wù)亟待解決的問題。徐峰(2003)、薛有志(2012)、Xiao B(2011)以及Wang HC等(2010)從店鋪相關(guān)、商品相關(guān)、交易過程相關(guān)、服務(wù)相關(guān)和評價人相關(guān)五個方面出發(fā)構(gòu)建C2C電子商務(wù)商家信用指標。但是他們都沒有考慮到評價真實度和促銷活動等因素。張韻君等(2011)通過分析網(wǎng)絡(luò)交易特點和消費者對商品的感知,從消費者感知角度將商家的信用指標分信息、態(tài)度、配送、承諾、價格、質(zhì)量、數(shù)量等。趙妍(2010)通過調(diào)查問卷的形式從商家和消費者兩方面建立信用度指標。信用評價模型的構(gòu)建方法,國內(nèi)研究者也提出了很多方法如模糊理論(周華玲,2010)、時間衰減(張宇等,2011)、靜態(tài)(羅玲,2013)和動態(tài)(曾令強等,2012)信用構(gòu)造等方法。但是這些研究選取的因素過于寬泛,根據(jù)自己特定研究而選取,不具有普遍性,而且物流等第三方不確定因素納入信用指標使得商家處于一定劣勢。

在預(yù)警方法方面,目前主要的研究思路是采用專家打分方法確定風險因變量,然后構(gòu)造一些靜態(tài)指標,如好評率、與實際預(yù)期相符程度等構(gòu)造指標體系(李迎林,2013、汪鑫,2011),進而將樣本分為訓(xùn)練集和測試集構(gòu)造預(yù)警模型并加以驗證(余樂安,2012)。支慧(2015)通過選取 40 家同類型企業(yè)利用其數(shù)據(jù),采用因子分析法和 Z-Score 預(yù)警模型來構(gòu)造電子商務(wù)信用風險預(yù)警模型。在Web應(yīng)用方面,有的學(xué)者利用馬爾科夫?qū)τ脩舻纳暇W(wǎng)行為進行預(yù)測以及預(yù)測用戶的瀏覽模式(班志杰等,2009)。馬爾科夫鏈模型有成熟的數(shù)學(xué)基礎(chǔ),在股票預(yù)測、環(huán)境質(zhì)量預(yù)測、市場經(jīng)濟預(yù)測中都有廣泛的應(yīng)用。

電子商務(wù)預(yù)警模型構(gòu)建

(一)電子商務(wù)預(yù)警模型整體流程圖

本文將馬爾科夫鏈模型應(yīng)用在現(xiàn)代電子商務(wù)領(lǐng)域中實現(xiàn)對賣家的信用風險預(yù)警功能,給消費者更加安心的消費環(huán)境。本文所構(gòu)建的電子商務(wù)風險預(yù)警模型的具體建立流程如圖1所示。

(二)數(shù)據(jù)采集及預(yù)處理

1.數(shù)據(jù)采集及數(shù)據(jù)表的建立。現(xiàn)代電子商務(wù)數(shù)據(jù)量已經(jīng)達到TB級別甚至PB級別,所以要分析網(wǎng)絡(luò)零售商的大量數(shù)據(jù)就需要采用分布式大數(shù)據(jù)處理技術(shù)。本文中采用Hadoop集群對在線零售商的銷售數(shù)據(jù)進行提取,采用httpclient、jsoup等技術(shù)對網(wǎng)頁的HTML中相關(guān)數(shù)據(jù)進行提取。本文中提取的數(shù)據(jù)分為五類,分別為:賣家信息、賣家店鋪動態(tài)評分、賣家服務(wù)情況、賣家信用評分、賣家評論。其中賣家信息中又包括二級子類:賣家所在區(qū)域、銷售商品類別、商品單價、賣家注冊時間、賣家?guī)齑鏀?shù)量。賣家店鋪動態(tài)評分中包括商品與描述相符度、賣家服務(wù)態(tài)度、賣家發(fā)貨速度。店鋪服務(wù)情況分為:本月評價退款速度、退款率、糾紛率、處罰數(shù)。賣家信用評價分為:好評數(shù)、中評數(shù)和差評數(shù)。然后將這些HTML數(shù)據(jù)信息存入數(shù)據(jù)庫中,根據(jù)提取數(shù)據(jù)以及相關(guān)文獻調(diào)研,本文建立可能影響賣家信用的數(shù)據(jù)如表1所示。

2.評論真實度語義分析。為了更加準確地對店家信用風險進行評估,本文將對店家評論數(shù)據(jù)進行語義分析,即判斷出消費者給出的評論是否和給出的評分一致。從而判斷出消費者是否對本次購物真正的滿意。本文將數(shù)據(jù)庫的評論數(shù)據(jù)提取關(guān)鍵詞和語氣詞,并且將這些關(guān)鍵詞以及語氣詞與詞庫中的關(guān)鍵詞和語氣詞進行對比。判斷評論和實際給出的評分的差距,并且給定從1到5,五個不同的度量值,1表示評論和評分不一致,5表示評論和評分一致。處理過程如下:取數(shù)據(jù)庫中一條評論數(shù)據(jù)如圖2所示,情感詞庫如圖3所示,最后經(jīng)過處理得到分詞結(jié)果和真實度得分如圖4所示。將本月所有評論的得分取平均值作為該月商品評論真實度的值。

圖1 預(yù)警模型流程圖

圖2 數(shù)據(jù)庫中評論

圖3 情感詞庫

圖4 處理結(jié)果

圖5 權(quán)重訓(xùn)練結(jié)果

3.關(guān)鍵因素選取。根據(jù)提取出來的數(shù)據(jù)進行分析可以看出,賣家店鋪的動態(tài)評分幾乎相似,各個店家的商品相似度、服務(wù)態(tài)度以及發(fā)貨速度評分都分布在4.6-4.9之間,很難區(qū)分出好壞,因此本文將其不列入評分體系內(nèi)。根據(jù)相關(guān)文獻及數(shù)據(jù)分析,最終選取關(guān)鍵因素為:賣家月銷售數(shù)量、本月平均退款速度、本月退款次數(shù)、本月糾紛次數(shù)、本月處罰次數(shù)、好評數(shù)、中評數(shù)、差評數(shù)、評論真實度量值、當月是否有促銷活動。

4.關(guān)鍵因素權(quán)值計算。銷售數(shù)量、退款速度、退款次數(shù)、糾紛次數(shù)、處罰次數(shù)、評論真實度,需要計算各個指標權(quán)重。本文采用神經(jīng)網(wǎng)絡(luò)對權(quán)重進行訓(xùn)練,開始手工設(shè)置數(shù)據(jù)項的權(quán)值,然后采用單層神經(jīng)網(wǎng)絡(luò)對權(quán)值進行訓(xùn)練,算法如下:

初始化權(quán)重wi和閾值θ。

激活。通過輸入x1(p),x2(p),…,xn(p)以及期望輸出yd(p)來激活感知器。在迭代p=1上計算激活函數(shù)的輸出:

這里迭代p表示提供給感知器的第p個訓(xùn)練實例,n為感知器輸入的數(shù)量,公式(2)為階躍激活函數(shù)。

權(quán)重訓(xùn)練。修改感知器權(quán)重:wi(p+1)=wi(p)+|wi(p),其中Δwi(p)為迭代p上的權(quán)重校正。通過delta感知器學(xué)習(xí)規(guī)則計算權(quán)重校正,如公式(3)和(4)所示:

e(p)是誤差,當其為正時,就需要增加感知器輸出y(p);當其為負時,就要減少感知器輸出y(p)。每個感知器對總的輸入X(p)的貢獻為xi(p)+ wi(p),由此可知,增加或減少權(quán)重wi(p)可以增加或減少輸出y(p)的值。α是學(xué)習(xí)速度,是一個小于1的常數(shù)。yd(p)表示在迭代p中的期望輸出,y(p)為在迭代p中的實際輸出。

迭代。迭代p加1,回到步驟2,重復(fù)以上過程直到收斂。

圖5為權(quán)重訓(xùn)練結(jié)果,由此可見銷售數(shù)量、處罰次數(shù)和評論真實度的權(quán)值較大,這些都是消費者比較重視的,符合實際情況。

5.特殊情況處理。現(xiàn)代電子商務(wù)發(fā)展迅速,網(wǎng)絡(luò)零售商的銷售策略變得更多,在網(wǎng)上進行促銷活動如“雙十一”、“雙十二”等各大電商的促銷活動以及一些平時非平臺性質(zhì)的促銷活動。這些促銷活動都會使得店家的銷售數(shù)據(jù)變得很高,有的店家在這些活動中就會以次充好,用低價換取高銷售量和高好評數(shù)。這些活動大多是帶有風險的,因為這些數(shù)據(jù)會對消費者以后購買產(chǎn)生一些誤導(dǎo)。所以本文將考慮這些促銷活動的特殊情況,使得本文給出的信用指標更加符合現(xiàn)代電子商務(wù)的發(fā)展。

6.信用值計算。其中,好評、中評、差評的積分策略可以依然采用淘寶網(wǎng)的策略。記為公式(1):S1=0.1*好評數(shù)+0*中評數(shù)+(-1)*差評數(shù)。根據(jù)權(quán)重值,記公式(2):S2=0.11*銷售數(shù)量-0.03*退款速度-0.06*退款次數(shù)-0.08*糾紛次數(shù)-0.17*處罰次數(shù)+0.55*評論真實度。特殊情況記為公式(3):S3=(-0.1)*(銷售數(shù)量-好評數(shù))*是否有促銷活動。公式(3)適當為有促銷的月份進行浮動調(diào)節(jié)。最后店家的總信用評分記為S=S1+S2+S3。

(三)基于馬爾科夫鏈的預(yù)警模型

1.數(shù)據(jù)指標的處理。本文統(tǒng)計了10家3C數(shù)碼賣店共118條數(shù)據(jù),根據(jù)計算得知所有賣家的信用值多分布在[10,400]區(qū)間內(nèi),只有頂級賣家的信用值在400以上。對比賣家的當月的信用度和經(jīng)過計算的得分最后給出風險等級的劃分如表2所示。

本文選取北京某3C數(shù)碼店家4月份的交易數(shù)據(jù)為例進行計算:銷售量為2222次,糾紛退款4次,糾紛率為0.18%,退款次數(shù)389,退款率為17.52%,處罰次數(shù)0次,平均退款速度是2.98天。好評數(shù)1021個,中評數(shù)2個,差評數(shù)2個,該月是否有促銷活動為否,評論真實度為5。根據(jù)上述數(shù)據(jù)即可以求出4月份店家的信用指數(shù)為182。根據(jù)分類該賣家在2014年1-10月的信息進行統(tǒng)計分類得到分類情況,如表3所示。

2.馬爾科夫鏈模型的建立。馬爾科夫過程是一種常見的隨機過程,如果一個系統(tǒng)包含有限個狀態(tài),則下一個狀態(tài)只與它當前狀態(tài)有關(guān)而與前一個狀態(tài)無關(guān),也被稱為馬爾科夫鏈的無后效性。馬爾科夫過程根據(jù)狀態(tài)的連續(xù)與否分為狀態(tài)連續(xù)的馬爾科夫過程和狀態(tài)不連續(xù)的馬爾科夫過程即離散馬爾科夫過程。時間離散同時狀態(tài)也離散的馬爾科夫過程稱為馬爾科夫鏈。馬爾科夫鏈可以反映風險狀態(tài)的轉(zhuǎn)移概率Pij。Pij表示從風險等級i轉(zhuǎn)移到風險等級j的概率。

表1 可能影響賣家信用的因素

表2 風險等級的劃分

表3 月份的風險等級分類

表4 店家10個月的數(shù)據(jù)

表5 第11個月的風險等級預(yù)測

表6 預(yù)測數(shù)據(jù)與真實數(shù)據(jù)對比

其中pn1+pn2+…+pnk=1?;跔顟B(tài)轉(zhuǎn)移矩陣,可以得到每個狀態(tài)轉(zhuǎn)移概率的最大結(jié)果,從而利用其進行預(yù)測。每個風險等級狀態(tài)都呈現(xiàn)有限和可數(shù)的狀態(tài)x1,x2…,xt,而且每一個月的風險等級從xik到xjk+1的概率轉(zhuǎn)換只取決于當前月份跨度k。在本文中風險等級分為五級即五個狀態(tài),每個月的風險根據(jù)其值分別分布在五個狀態(tài)中。

其中Pij(m)表示的是風險等級集合xi中月份經(jīng)過m個月的跨度轉(zhuǎn)化到風險等級xj中的月份的概率。ni表示風險等級i狀態(tài)中包含月份的個數(shù)。Nij(m)表示風險等級i中月份經(jīng)過m個月的跨度變化最終轉(zhuǎn)換到風險等級j中月份的次數(shù)。

實證研究

(一)預(yù)警模型初始化

利用表3中的分類數(shù)據(jù),對店家前10個月的數(shù)據(jù)進行建模,并對模型進行測試。選取的店家數(shù)據(jù)如表4所示。

其中等級1的月份為1、2、4;等級2的月份為3;等級3的月份為5、7;等級4的月份為6;等級5的月份為8、9、 10。根據(jù)公式(5)和公式(6),建立五個狀態(tài)轉(zhuǎn)移的概率矩陣。由于實驗數(shù)據(jù)具有一定局限性,所以計算時應(yīng)遵循如下規(guī)則:一是如果狀態(tài)集合中元素為0,則將集合元素最多的狀態(tài)賦值為1,如果多個集合元素相同則賦均值;二是如果狀態(tài)集合中的月份加上轉(zhuǎn)移跨度超過集合中月份上限則將該行最后一列賦值為:,其中p為矩陣中當前行相應(yīng)列的概率值。此規(guī)則不會影響到數(shù)據(jù)原有的統(tǒng)計特性,所以對結(jié)果不會產(chǎn)生很大影響。以下為計算得出的轉(zhuǎn)移矩陣:

(二)風險等級預(yù)測

本文利用第6-10個月的數(shù)據(jù)去估算第11個月的風險等級。需要知道前5個月的初始狀態(tài)和第11個月的跨度,如表5所示。

最后第11個月的狀態(tài)中狀態(tài)5的值是最高的,所以將11月的風險等級劃分到第五級中。

(三)回歸測試

為了證明模型的準確性,利用已知的數(shù)據(jù)進行測試。用1-5月的數(shù)據(jù)去預(yù)測第6個月的風險等級,依次類推,測試6-10月的風險等級。具體情況如表6所示。

本文測試了幾十家店家,根據(jù)實驗測試表明,改進后的馬爾科夫鏈模型的預(yù)測準確率很高,其中出現(xiàn)2種情況會導(dǎo)致預(yù)測結(jié)果偏差:第一個是店鋪得分過于接近兩個等級的臨界點,可能是因為等級劃分較粗糙導(dǎo)致;第二個為店家數(shù)據(jù)波動較大,因為馬爾科夫鏈模型特性導(dǎo)致了錯誤發(fā)生。模型雖然有一定的誤差,但是整體的精準度很高,具有一定的實際應(yīng)用價值。

結(jié)論

本文針對電子商務(wù)網(wǎng)站中賣家的信用構(gòu)造了一套符合當代電子商務(wù)發(fā)展趨勢的信用評判指標,在指標中加入了評語相符度和是否有促銷活動等以往研究沒有考慮但是對信用影響很大的指標。并且將馬爾科夫鏈模型引入到電子商務(wù)領(lǐng)域中,構(gòu)造了一個具有預(yù)警功能的模型。實驗證明,利用本模型可以很好地對店家的信用風險進行預(yù)警,可以在消費之前將風險降到最低,具有一定的實際應(yīng)用價值。

1.徐峰.基于顧客集合的C2C電子商務(wù)商家信用模型研究[J].紹興文理學(xué)院學(xué)報,2013,33(9)

2.薛有志,郭勇峰.C2C電子商務(wù)賣家的競爭戰(zhàn)略研究:基于淘寶網(wǎng)的分析[J].南開管理評論,2012(5)

3.Xiao B,Benbasat I.Product-related deception in E-commerce:a theoretical perspective[J].MIS Quarterly,2011(11)

4.Wang H C,Doong H S,F(xiàn)oxall G R.Consumers’intentions to remain loyal to online reputation systems[J].Psychology & Marketing,2010(9)

5.張韻君,陳偉.基于消費者感知的C2C電子商務(wù)信用評價模型研究[J].商業(yè)時代,2011(11)

6.趙妍.C-C 電子商務(wù)中的信用風險和信用評級方法研究[D].北京郵電大學(xué)碩士論文,2010

7.周華玲.基于模糊理論和時間幀的C2C動態(tài)信用評估模型[D].山東理工大學(xué),2010

8.張宇,朱衛(wèi)祥.基于時間衰減和交易信息加權(quán)的動態(tài)電子商務(wù)信任模型[D].浙江理工大學(xué), 2011

9.羅玲.基于模糊綜合評價法的C2C電子商務(wù)二階段信用評價模型[J].現(xiàn)代商業(yè),2013(28)

10.曾令強,肖萍.電子交易平臺多元綜合信用評價的研究與實現(xiàn)[J].廣東石油化工學(xué)院學(xué)報,2012(22)

11.李迎林.C2C電子商務(wù)動態(tài)信用評價模型[D].首都經(jīng)濟貿(mào)易大學(xué)碩士論文,2013

12.汪鑫.基于退貨評價的C2C電子商務(wù)信用評價模型改進研究[D].江蘇科技大學(xué),2011

13.余樂安.基于最小二乘近似支持向量回歸模型的電子商務(wù)信用風險預(yù)警[J].系統(tǒng)工程理論與實踐,2012(3)

14.支慧.電子商務(wù)信用風險的預(yù)警指標體系構(gòu)建[J].科技展望,2015(1)

15.班志杰,古志民,金瑜.Web預(yù)取技術(shù)綜述[J].計算機研究與發(fā)展,2009,46(2)

北京市教委科技重點項目“電子商務(wù)平臺交易糾紛規(guī)避的若干支撐技術(shù)研究”(KZ201411232036);國家自然科學(xué)基金項目“網(wǎng)絡(luò)零售交易風險動態(tài)評估及預(yù)警研究”(71571021)

TP302.2

A

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲综合香蕉| 天天干天天色综合网| 午夜少妇精品视频小电影| 天天综合天天综合| 无码精品国产VA在线观看DVD| 国产女人在线| 尤物精品视频一区二区三区| 免费毛片a| 国产精品自在拍首页视频8| 一级毛片在线播放| 欧美yw精品日本国产精品| 国产欧美精品午夜在线播放| 国产精品亚欧美一区二区| 一级毛片在线播放免费观看| 日本国产精品一区久久久| 久久这里只有精品8| 国产精品亚洲一区二区三区z | 香蕉精品在线| 呦系列视频一区二区三区| 四虎国产成人免费观看| 亚洲第一综合天堂另类专| 精品在线免费播放| 香蕉伊思人视频| 亚洲中文在线看视频一区| 免费在线a视频| 亚洲人成影院在线观看| 老色鬼欧美精品| 九色在线视频导航91| 伊人AV天堂| 福利姬国产精品一区在线| 日本免费一区视频| 少妇高潮惨叫久久久久久| 老司机精品一区在线视频| 亚洲水蜜桃久久综合网站| 亚洲第七页| 女人18毛片久久| 高清不卡毛片| 日韩a级片视频| 国产成人精品三级| 国产成人av一区二区三区| 亚洲精品久综合蜜| 欧美精品v日韩精品v国产精品| 波多野结衣中文字幕一区二区| 九九九精品成人免费视频7| 1769国产精品视频免费观看| 日本少妇又色又爽又高潮| 色婷婷综合在线| 精品无码国产一区二区三区AV| 国产不卡一级毛片视频| 国产高颜值露脸在线观看| 亚洲精品无码高潮喷水A| 男女精品视频| 国产中文一区二区苍井空| 国内黄色精品| 黄色网页在线播放| 国产理论一区| 91原创视频在线| 91成人在线观看| 国产性猛交XXXX免费看| 国产精品性| 中国一级特黄视频| 国产在线日本| 成人福利免费在线观看| 澳门av无码| 欧美日韩一区二区三区在线视频| 成人免费一级片| 麻豆国产在线观看一区二区| 97在线免费| 亚洲精品在线91| 99热在线只有精品| 中国国产A一级毛片| 欧美日韩国产精品综合| 欧美成人免费午夜全| 国产精品无码一区二区桃花视频| 在线色国产| 亚洲va精品中文字幕| 中文毛片无遮挡播放免费| 毛片视频网址| 四虎精品免费久久| 99re经典视频在线| 国产综合日韩另类一区二区| 精品欧美日韩国产日漫一区不卡|