999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘在零售電商交易風險預測中的應用

2019-03-07 05:22:18常春燕劉廣成
電腦知識與技術 2019年35期
關鍵詞:風險預測數據挖掘

常春燕 劉廣成

摘要:現在的電子商務交易中,網絡漏洞層出不窮,導致電子商務交易風險加大。為了提高網絡交易的安全,推動電子商務的健康發展,對數據挖掘在零售電商交易風險預測中的應用進行研究。公開選取數據集,在此基礎上對數據進行預處理,完成面向大數據的交易進行中風險值計算。提出方法進行了分類因子的判別,克服了傳統方法的弊端,在運算時間、預測結果精度均有較好的優勢,最終結果優于傳統方法,有效避免了傳統方法收斂速度較慢的缺點。

關鍵詞:數據挖掘;零售電商;電商交易;風險預測

中圖分類號:F272.1 文獻標識碼:A

文章編號:1009-3044(2019)35-0001-02

隨著互聯網技術的快速發展以及社會智能化水平的提高,傳統的商業貿易正在經歷一次重大改革,電子商務顯示出巨大的市場價值與潛力[1]。電子商務作為商業領域的一種新興貿易方式,它主要是以計算機網絡為應用平臺、現代信息技術為媒介、經濟利潤為核心的現代化商業運營模式,最終目的是為了實現商業活動的低成本、高效率和便捷化。

數據庫技術的迅猛發展以及數據庫管理系統的廣泛推廣和使用,使得數據積累得越來越多。爆炸式增長的數據背后隱藏著眾多關鍵數據,為了更好地利用這些數據,就必須對其進行合理科學的分析[2]。數據庫系統雖然能夠實現數據的組織、存儲、管理、維護等功能,但卻挖掘不了數據中隱藏的規律,也就無法根據現有的數據對市場的運行規律和未來發展趨勢進行合理預測。數據庫系統對挖掘數據背后隱藏的信息無能為力,最終造成現在“數據爆炸但有效信息匱乏”的狀況,因此需要我們對現行的零售電商交易風險預測進行合理創新、優化。

1 數據挖掘在零售電商交易中的風險預測

1.1公開數據集選取

有關交易數據的選擇,我們主要采取公開的不平衡數據集即可,使用Data Hackathon 5.X AV上保存的數據檢驗改進的xg-boost算法的性能[3]。一般狀況下,在不平衡數據集內,樣本數相對較多的被稱之為正樣本,而樣本數相對較少的稱之為負樣本。數據集規模統一規定為19335*35。其中,正負樣本數量之間的比例大致是60:1,因而正負樣本比例嚴重失衡。如果應用的數據挖掘改進的SMOTE上采樣算法可以在這個不平衡樣本集上發揮很好的分類效果,那么就表明SMOTE上采樣算法適合用于不平衡數據集的分類問題。所以,這個數據集就比較符合平衡數據的相關要求。

1.2數據預處理

有關對零售電商交易數據的預處理環節一共包括缺失值處理、特征One-hot編碼、數據過采樣三部分。

缺失值處理部分,輸入數據比如客戶歷史購買信息、退款信息等一般都會出現遺漏或缺失的狀況,如將這些記錄直接放入回收站,將會在一定程度上影響交易風險預測的最終結果,造成結果精度誤差較大,為了實現更好的預測效果,需要對缺失值進行預先處理。而有關訓練集數據缺失狀況詳情見下表所示:

對于表1中所列的類別型字段,比方說區域分類、費控標志等字段均采取默認值-1進行補充;對于大量缺失的字段,比方說負荷特性、市場化屬性、退款消費分類,就需要直接刪除該特征,以免耗費過多時間成本;重要性等級字段雖然缺失較大,可考慮到其特征的重要性,需要單獨保留該特征,采用-1補充;對于異常值極少的(<0.01%)字段數,直接刪除即可;至于有些毫無關聯(基本為0)的信息,直接刪除即可[4]。

特征One-hot編碼部分,特征字段主要是以One-hot分散編碼,One-hot編碼,也可稱之為獨屬編碼。其手段是利用N位狀態寄存器去對N個數據狀態進行單獨編碼,每一個數據狀態均有其獨立的寄存器位,且在任意段位,只存在一位有效。假如我們有四個樣本(行),每一個樣本包含著三個具體特征(列),如表2所示,借助one-hot編碼能夠獲得具體的數據特征。而特征分散編碼,一方面處理了以往分類器解決不好離散數據的問題,另一方面在一定意義上對填充特征也有積極的作用。

數據過采樣部分,當正樣本所占總體樣本比重較低時,數據分類算法就會呈現出極為不穩定,其對交易風險的預測精度也會隨之降低。從原理上來講,預測的精準程度在很大程度上取決于正負樣本能否可以利用某項程序規則進行完全區分[5]。當訓練數據集的正負樣本容量明顯較多且所占比例相差不大時,獲得這種程序的規則就有其普適性,預測的結果相對而言也會較為樂觀。然而,如果數據集的正樣本數量和負樣本數量之間相差懸殊,同時雙方樣本數量都較少時,計算機對這種規則的總結就會缺乏一定的普適性,如過度考慮樣本數量較少的一方,造成模預測失真。考慮到本方法中正樣本(危險用戶)占比較少,所以就需要通過上采樣處理辦法,來調改正負樣本的數量,提高交易風險預測的效果。數據挖掘的SMOTE上采樣算法具體描述:首先對正樣本采用無放回式抽樣,增加實際購買行為的樣本數量,直到正負樣本數量基本保持一致,為了不損壞數據原有的分布狀況,對特征加以隨機干擾;其次對于負樣本保持不變;最后合并正負樣本數據集,整合成預測所用的整體數據集。正是因為Web數據量較為龐大,界面復雜,結構缺乏統一標準。利用數據預處理那個最大限度地確保數據的精確性,能夠正確的反映出客戶的購買意圖,更好的支持零售電商的銷售決策。

1.3面向大數據的交易進行中風險值計算

在數據挖掘的基礎上,對電商交易進行中風險預測過程中的資產、威脅性以及脆弱性三個基本因素進行精準識別和賦值;分別通過網絡脆弱性的難易程度來評安全事件發生的基本概率以及交易風險威脅造成的損失分別進行計算,獲得風險值[6]。假定T代表面向大數據的交易進行中隱性風險出現的基本概率(即可信度);A代表面向大數據的交易進行中隱性風險資產的基本識別;V代表面向大數據的交易進行中的不穩定性以及不穩定性的嚴重程度。根據面向大數據的交易進行中風險以及隱性風險出現概率,利用網絡脆弱性的難易程度預測安全事件發生的基本概率,其計算公式如下:

式中,L表示面向大數據的交易進行過程中安全事件產生概率的計算函數。按照面向大數據的交易進行中不穩定性程度以及隱性風險威脅事件所產生的資產價值來計算隱性風險威脅造成的經濟損失,詳細計算公式如下:

式中,F表示面向大數據的交易進行中隱性風險威脅發生后導致的經濟損失計算函數;La表示面向大數據的交易進行中隱性風險威脅所產生的資產價值;Va表示面向大數據的交易進行中計算機網絡的脆弱性嚴重程度;按照以上分析,計算面向大數據的交易進行中隱性風險威脅事件的發生概率以及對交易和電商所產生的影響,即面向大數據的交易進行中的隱性風險值,具體計算公式如下:

式中,R表示面向大數據的交易進行中的隱性風險計算函數。同時在本文設計的零售電商交易風險預測中用二十分鐘這個闕值作為時間窗口劃分的默認值[7]。一旦在電商頁面中客戶的請求時間超過了這個闕值,就會被認為此會話結束。而在緩存頁面中客戶訪問的頁面存在兩種情況。第一種是顧客點擊“BACK”按鈕,調取緩存中所在的瀏覽器頁面;第二種是顧客多次訪問該頁面,這些頁面均列為相同會話中。通過這兩種情況,電商能夠迅速判斷出此客戶的潛在價值,降低交易過程中的風險度。

2 實驗與效果分析

為了更加清晰的確定本文提出的基于數據挖掘的零售電商交易風險預測的實際應用效果,特與傳統的零售電商交易風險預測進行對比,對其預測率的大小進行比較。

2.1實驗準備

為保證實驗的準確性,選擇100個零售電商交易樣本,在保證其他條件不變的情況下,將兩種零售電商交易風險預測方法置于相同的實驗環境之中,進行風險預測能力的實驗。

2.2實驗結果分析

實驗過程中,通過兩種不同的零售電商交易風險預測設計同時在相同環境中進行工作,分析其預測率能力的變化。實驗效果對比圖如下所示。

通過對實驗結果的對比能夠得出結論:本文提出的方法不管是在運算時間上,還是在預測的結果精度上均有著較好的優勢,最終的結果也優于傳統方法,這主要是由于本文方法進行了分類因子的判別,克服了傳統方法的弊端,有效避免了以往算法收斂速度較慢的缺點。實驗表明本文方法是一種預測快速、預測精度高、結果可信的預測方法。

3 結束語

本文對數據挖掘在零售電商交易風險預測中的應用進行分析,依托數據挖掘技術,根據零售電商交易過程中的技術難題,對交易風險預測方法進行優化,實現本文設計。實驗論證表明,本文設計的方法具備極高的有效性。希望本文的研究能夠為數據挖掘在零售電商交易風險預測中的應用方法提供理論依據。

參考文獻:

[1]劉冠男,張亮,馬寶軍.基于隨機游走的電子商務退貨風險預測研究[J].管理科學,2018,23(1):3-14.

[2]王穎,阮夢黎.基于大數據的電商異常交易風險評估仿真[J].計算機仿真,2018,11(3):369-372.

[3]陳梅森,劉文彬,王良緣,等.掛牌交易模式下考慮合約和日前收益的風電商靈活合約制定策略[J].現代電力,2019,19(1):1-7.

[4]賴俊明.電子商務平臺售假現象及打假策略[J].企業經濟,2018,16(5):101-108.

[5]彭曉咖,周發明.農村電商經營效率研究一基于消費品下行的模型分析[J].農業技術經濟,2018,12(12):111-118.

[6]李澤凡.電商經濟發展中存在的法律問題及對策——以北京出臺雙11規定為例[J].成功營銷,2018,12(12):93-94.

[7]易紹華.跨境電商企業”走出去”面臨的挑戰與建議——以阿里巴巴進入澳洲市場為例[J].中國發展觀察,2019,29(8):61-62.

【通聯編輯:張薇】

收稿日期:2019-09-05

作者簡介:常春燕(1985-),女,河南泌陽人,碩士研究生,講師,研究方向為電子商務。

猜你喜歡
風險預測數據挖掘
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電費回收風險預測及規避策略
數據挖掘技術在中醫診療數據分析中的應用
新舊高校會計制度比較實施建議
統計學在證券投資中的應用研究
商(2016年6期)2016-04-20 17:54:08
一種基于Hadoop的大數據挖掘云服務及應用
我國企業資金管理存在的問題及對策分析
科技與創新(2015年8期)2015-05-06 23:08:15
大學生電子商務創業策略研究
商場現代化(2015年7期)2015-04-20 13:52:09
探究建筑房地產開發經營過程中的風險管理思路構建
主站蜘蛛池模板: 狠狠ⅴ日韩v欧美v天堂| 日本午夜三级| 毛片手机在线看| 无码日韩视频| 青草视频网站在线观看| 亚洲精品无码AV电影在线播放| 麻豆精品在线| 久久激情影院| 91国内在线视频| 国产区在线观看视频| 玖玖精品视频在线观看| 国产美女在线观看| 国产成人喷潮在线观看| 亚洲精品视频免费观看| 动漫精品啪啪一区二区三区| 又粗又硬又大又爽免费视频播放| 久久人妻xunleige无码| аⅴ资源中文在线天堂| 久久这里只有精品66| 黄色国产在线| 日本久久免费| 无码精品国产VA在线观看DVD| 日韩毛片免费| 亚洲91精品视频| 9啪在线视频| 国产成人精品一区二区三在线观看| 国产成人欧美| 亚洲精品无码久久久久苍井空| 婷婷亚洲视频| 国内精品九九久久久精品| 欧美精品影院| 亚洲第一在线播放| 国产成年女人特黄特色毛片免 | 久久久久亚洲AV成人人电影软件| 又爽又大又黄a级毛片在线视频| 波多野结衣无码视频在线观看| 亚洲高清无在码在线无弹窗| 国产真实乱了在线播放| 丰满少妇αⅴ无码区| 97se亚洲综合| 亚洲色图欧美一区| 欧美日韩亚洲综合在线观看 | 亚洲av无码人妻| 精品国产免费观看一区| 亚洲第一视频网站| 大香网伊人久久综合网2020| 18黑白丝水手服自慰喷水网站| 国产又色又刺激高潮免费看| 亚欧美国产综合| 国产96在线 | 手机在线国产精品| 婷婷久久综合九色综合88| 制服丝袜 91视频| 久久91精品牛牛| 欧美一区二区三区香蕉视 | 欧美成在线视频| 亚洲国产成熟视频在线多多| 国产精品分类视频分类一区| 精品国产中文一级毛片在线看| 国产成人精品一区二区三在线观看| 97久久超碰极品视觉盛宴| 九九九国产| 精品视频福利| 国产成人综合亚洲欧美在| AV不卡无码免费一区二区三区| 欧美精品一二三区| 精品自窥自偷在线看| 欧美激情视频二区| 色综合狠狠操| 一本大道香蕉高清久久| 久久99精品久久久久久不卡| 在线无码九区| 91视频99| 亚洲aⅴ天堂| 一级片免费网站| 在线观看网站国产| 欧美中日韩在线| 亚洲精品在线观看91| 香蕉精品在线| 在线观看无码a∨| 国产精品美人久久久久久AV| 国产91在线|日本|