陳曉燕+唐年慶
摘 要: 針對傳統(tǒng)大數(shù)據(jù)評估過程中的Web網(wǎng)絡(luò)風險評估結(jié)果不精準并且速度較慢的問題,提出一種大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計方法。采用特定的風險評估因子進行有效的評估,避免了傳統(tǒng)方法中評定項目繁雜、計算量大等因素造成的評估不準的問題。評估過程中使用了特定的評估模型,把傳統(tǒng)的加權(quán)平均的風險估計方法轉(zhuǎn)變成為非線性映射評估方法,這樣能夠更加準確的進行風險評估。為了驗證設(shè)計的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計的有效性,設(shè)計了對比仿真實驗。實驗結(jié)果表明,設(shè)計的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計方法能夠有效地解決風險評估過程中的評估結(jié)果不準確問題。
關(guān)鍵詞: Web網(wǎng)絡(luò)風險估計; 大數(shù)據(jù)環(huán)境; 風險評估因子; 評估模型
中圖分類號: TN711?34; TP469 文獻標識碼: A 文章編號: 1004?373X(2017)24?0056?03
Abstract: In view of the inaccurate results and slow rate of Web network risk estimation in the traditional big data estimation process, a method of Web network risk estimation in the big data environment is proposed. The specific risk estimation factors are utilized to perform effective estimation, which avoids inaccurate estimation caused by the complexity of the estimation item and big amount of computation in the traditional method. In the evaluation process, the specific estimation model is used to transform the traditional weighted average risk estimation method into the nonlinear mapping estimation method so that the risk estimation can be more accurate. In order to verify the validation of the designed Web network risk estimation in big data environment, the contrast simulation experiment was designed. The experimental results show that the designed Web network risk estimation in big data environment can effectively resolve the problem of inaccurate estimation results in the risk estimation process.
Keywords: Web network risk estimation; big data environment; risk estimation factor; estimation model
伴隨著現(xiàn)代科技的不斷推進革新,現(xiàn)代科技的項目也越來越多,能夠涵蓋的領(lǐng)域也越來越廣泛[1]。在進行科技領(lǐng)域的研發(fā)過程中,會使用許多沒有經(jīng)過完善體系認證的現(xiàn)代技術(shù)以及新興技術(shù),在使用過程中會存在許多未知的可能性,這些可能性會造成一定的系統(tǒng)失誤以及系統(tǒng)偏離,或者是達不到預想的使用效果。有時候會造成工期延誤,或者是資金的浪費,這些情況給研制過程帶來了極大的不便[2?3]。
采用傳統(tǒng)的評估方法進行Web網(wǎng)絡(luò)風險估計過程中,使用數(shù)據(jù)模型綜合判斷法和引入特征因子參數(shù)法進行大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險評估是最簡單、直接、有效的方法[4]。數(shù)據(jù)模型綜合判斷法需要進行一定的數(shù)據(jù)測量,在測量過程中數(shù)據(jù)量極其龐大,并且調(diào)查時間較長,還受到一定的條件限制,但是數(shù)據(jù)模型綜合判斷法的數(shù)據(jù)處理能力很強[5?6]。引入的特征因子參數(shù)法是方便進行數(shù)據(jù)測量的方法,這種方法的數(shù)據(jù)測量采集的準確度高,但是計算能力較弱,并且不能進行自我檢驗[7]。本文設(shè)計的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計方法,把上述的兩種方法有機的進行融合,這樣既能夠進行快速的數(shù)據(jù)分析又能夠進行準確的數(shù)據(jù)采集,降低了影響評估風險的因素,提高了在大數(shù)據(jù)下的Web網(wǎng)絡(luò)風險估計準確度[8]。
1 Web網(wǎng)絡(luò)風險估計模型設(shè)計
1.1 數(shù)據(jù)快速采集
Web網(wǎng)絡(luò)是一種雙線記錄的網(wǎng)絡(luò),Web網(wǎng)絡(luò)是通過反饋以及應答法方式對數(shù)據(jù)進行記錄的。所以在大型數(shù)據(jù)下的網(wǎng)絡(luò)風險評估是必須通過特定因子進行數(shù)據(jù)的采集,否則很難在網(wǎng)絡(luò)的一端進行全數(shù)據(jù)的采集。特定風險特征因子法使用流程如圖1所示。
進行數(shù)據(jù)采集前需要進行屬性的定量分析,對大量數(shù)據(jù)的屬性認定能夠更加適合Web網(wǎng)絡(luò)的結(jié)構(gòu)模型如下:
式中:x,y分別為數(shù)據(jù)的集中屬性以及數(shù)據(jù)的次屬性;j,k分別表示W(wǎng)eb網(wǎng)絡(luò)模型和屬性節(jié)點;w和Q是對應的關(guān)系,分別是數(shù)據(jù)的輸入以及輸出非線性傳輸函數(shù)。通過式(1)便可以對數(shù)據(jù)進行屬性的衡量。針對大量的數(shù)據(jù)還需要進行一定的數(shù)據(jù)標記,這樣才能更加快速地進行數(shù)據(jù)采集,標記過程為:
Web網(wǎng)絡(luò)通過命令篩選進行標記,P為標記過程值,當屬性滿足一定條件時,進行標記。通過標記后的數(shù)據(jù)為示意串符號字符,需要轉(zhuǎn)化為能被識別的十六進制代碼,公式為:endprint
式中:T表示統(tǒng)計序列的編號數(shù);η表示限定的條件;r是序列值。為了能夠進行快速的風險評估,還需要進行最大連接授權(quán)與最小連接授權(quán)的計算,計算公式為:
式中:d表示授權(quán)能力;H表示數(shù)據(jù)的屬性指標,這樣便于進行識別,保證風險評估過程的準確性;是最大的授權(quán)值,最小授權(quán)值為1。
通過鑒定屬性的H平均識別率進行屬性的大量采集,平均識別過程為:
式中:pej為Web網(wǎng)絡(luò)的第j個模板屬性中第k標記元素;u是一個限制的值域方便數(shù)據(jù)的采集;k只能進行1和2的取值,當k為2時,風險評估的數(shù)據(jù)是0,當k為1時,對應的屬性提取值為:
Web網(wǎng)絡(luò)進行風險評估是需要進行數(shù)據(jù)的特征提取,本文使用的是特定因子數(shù)據(jù)采集方法,通過上述標記過后便可進行快速的提取,如下:
Web網(wǎng)絡(luò)主要的作用是進行數(shù)據(jù)聯(lián)想寄存,相當于服務器中的一個運存模塊,想要對其進行系統(tǒng)的風險評估,需要對采集的數(shù)據(jù)進行評估運算。本文通過對Web網(wǎng)絡(luò)進行特征因子的采集,能夠輔助之后的風險評估模型的運算,為風險評估模型提供充足的理論數(shù)據(jù)。
1.2 使用風險估計模型進行風險評估
在使用風險評估模型之前需要進行供應數(shù)據(jù)的選擇,選定的供應鏈方便進行屬性匹配和估值,其計算公式為:
式中:表示風險影響因子數(shù);E表示理想因子數(shù);A表示數(shù)據(jù)的充分性因子數(shù)。在大數(shù)據(jù)的情況下,進行風險評估還要考慮到進度風險影響因子,因為數(shù)據(jù)本身不是沒有變化的。進度風險影響因子數(shù):
式中:e為進度風險影響因子參數(shù);b為數(shù)據(jù)使用進度;a表示本質(zhì)系數(shù)。通過式(8)可反映出數(shù)據(jù)的流動程度,方便進行數(shù)據(jù)風險評估。
影響風險評估結(jié)果的還有準確性因子數(shù),準確性因子數(shù)計算式為:
式中:λ=5.86是一個常值;Q和M分別代表數(shù)據(jù)的基本屬性和非基本屬性;e為進度風險因子參數(shù);P為影響風向因子數(shù)。通過函轉(zhuǎn)變系數(shù)可以得到:
式中:L為風險評估精準系數(shù);D為不確定因子。其是對風險評估的結(jié)果進行檢驗,在確定上述能夠影響風險結(jié)果的因素時,還存在一些不確定因素,通過式子可以進行不確定因數(shù)的評估,使結(jié)果更加的精準。通過上述計算完成整體的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計。
2 試驗驗證
2.1 參數(shù)的設(shè)定
為了方便進行大數(shù)據(jù)環(huán)境下Web網(wǎng)絡(luò)的風險評估,需要對參數(shù)進行一定的設(shè)置。設(shè)置屬性指標H值為6;標記坐標系數(shù)x,y分別取100,150;平均識別率的k值選擇1。為了使計算結(jié)果更佳準確,k值參數(shù)如下,選擇不同系數(shù)對應不同關(guān)聯(lián)數(shù):
2.2 風險評估過程
本文使用的是用特定風險特征因子法進行數(shù)據(jù)的采集,由于設(shè)置的標記參數(shù)為100,150,因此使用公式進行標記的過程會非常迅速。試驗時間對比見圖2。
本文使用的特定風險特征因子法進行數(shù)據(jù)的標記,這樣的標記方式可以使用式(6)進行實際計算。其中i≠j∈{0,1,2,…,9}, 由于Web網(wǎng)絡(luò)采用編碼算子進行網(wǎng)絡(luò)運行,結(jié)合本文設(shè)計其錯誤率減小、識別能力得到了很大提升。
為了驗證試驗的有效性,選定三種方案同時進行試驗:第一種方案使用傳統(tǒng)方法的專家評估方法;第二種方法采用統(tǒng)計的方法進行風險評估;第三種使用本文設(shè)計的方法進行風險評估。表1為三種風險評估結(jié)果。
2.3 試驗結(jié)果分析
通過圖2可以看出本文設(shè)計的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計方法能夠在大數(shù)據(jù)下使用較少的時間進行數(shù)據(jù)的采集。通過表1結(jié)果可以看出,本文對Web網(wǎng)絡(luò)平均風險評估的準確度更好,同時不需要修正。綜上所述,本文設(shè)計的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計方法能夠解決傳統(tǒng)方法中評估結(jié)果不精確以及速度慢的問題。
3 結(jié) 語
本文設(shè)計的大數(shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計方法能夠有效地解決傳統(tǒng)方法中評估精準度不足以及速度慢的問題。通過本文的設(shè)計,希望能夠?qū)Υ髷?shù)據(jù)環(huán)境下的Web網(wǎng)絡(luò)風險估計領(lǐng)域提供更好的評估方法。
參考文獻
[1] 趙星,李石君,余偉,等.大數(shù)據(jù)環(huán)境下Web數(shù)據(jù)源質(zhì)量評估方法研究[J].計算機工程,2017(2):48?56.
[2] 鄭宏,蔡宇翔.大數(shù)據(jù)環(huán)境下入侵風險評估優(yōu)化模型仿真分析[J].計算機仿真,2016,33(9):292?295.
[3] 杜永紅,石買紅,史慧敏.大數(shù)據(jù)環(huán)境下P2P網(wǎng)貸平臺的風險評估與防范[J].會計之友,2016(22):90?92.
[4] 王閃,譚良.Web大數(shù)據(jù)環(huán)境下的相似重復數(shù)據(jù)清理[J].計算機工程與設(shè)計,2017,38(3):646?651.
[5] 林漢川,張萬軍,楊柳.基于大數(shù)據(jù)的個人信用風險評估關(guān)鍵技術(shù)研究[J].管理現(xiàn)代化,2016,36(2):95?97.
[6] 李勇,孟小峰,劉繼,等.基于小數(shù)據(jù)的在線用戶興趣長程演化研究[J].計算機研究與發(fā)展,2015,52(4):779?788.
[7] 胡亞慧,李石君,余偉,等.大數(shù)據(jù)環(huán)境下的電子商務商品實體同一性識別[J].計算機研究與發(fā)展,2015,52(8):1794?1805.
[8] 林海倫,楊曉剛,熊錦華,等.Deep Web數(shù)據(jù)采集查詢構(gòu)造方法研究[J].計算機科學與探索,2015,9(9):1025?1033.
[9] 李廣水,鄭滔,宋丁全.面向服務數(shù)據(jù)挖掘的關(guān)鍵技術(shù)在.NET下的實現(xiàn)研究[J].計算機工程與設(shè)計,2009,30(20):4654?4657.endprint