999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于規(guī)則過濾的樸素貝葉斯模型流程實(shí)例日志分析

2021-07-02 01:56:58陳浩韓萌萌
現(xiàn)代計(jì)算機(jī) 2021年13期
關(guān)鍵詞:分析模型

陳浩,韓萌萌

(武漢船用電力推進(jìn)裝置研究所,武漢430000)

0 引言

在傳統(tǒng)的應(yīng)用中,通常是由專家基于流程執(zhí)行過程中的日志信息來識別系統(tǒng)漏洞[1]。事實(shí)證明,收集流程執(zhí)行過程中的日志數(shù)據(jù)并加以分析對于系統(tǒng)問題的診斷和異常檢測非常有效。在這種情況下,我們關(guān)注由業(yè)務(wù)流程執(zhí)行產(chǎn)生的日志數(shù)據(jù)[2],通過分析這些日志數(shù)據(jù)來檢測“不安全”流程實(shí)例導(dǎo)致的安全漏洞(例如攻擊、欺詐等)。我們提出使用關(guān)聯(lián)規(guī)則和樸素貝葉斯方法進(jìn)行流程日志分析的框架,利用“低級”事件而不是“高級”事件完成和流程活動完全無關(guān)的面向安全的分類[3-4]。這種混合框架可用作決定過程跟蹤的“安全性”的替代方法,可以充當(dāng)一種“超級專家”的分類工具,其準(zhǔn)確性和效率使其稱為實(shí)施面向安全性流程分析的有效工具。

1 介紹

根據(jù)系統(tǒng)的行為日志解釋、預(yù)測、修復(fù)和監(jiān)控系統(tǒng)的運(yùn)行是當(dāng)前大多數(shù)系統(tǒng)的重要舉措之一[5]。在這一方面對于流程引擎(BPM)的業(yè)務(wù)日志分析研究是業(yè)界非常關(guān)注的解決方案,這些解決方案可以幫助或者代替人類專家對業(yè)務(wù)流程日志進(jìn)行安全性分析。通過監(jiān)控業(yè)務(wù)流程實(shí)例的日志,分析不同類型的安全漏洞,例如欺詐、攻擊、濫用等問題。事實(shí)上,不安全的流程實(shí)例可能會對組織或者企業(yè)造成嚴(yán)重?fù)p害,從而可能導(dǎo)致企業(yè)的形象和聲譽(yù)受到嚴(yán)重?fù)p失。這是最近采用數(shù)據(jù)挖掘技術(shù)對業(yè)務(wù)過程日志進(jìn)行安全性分析的主要原因(Accorsi&Stocker,2012;Accorsi,Stocker,&Muller,2013),尤其是作為審核應(yīng)用程序是否存在風(fēng)險(xiǎn)的核心。

文獻(xiàn)中關(guān)于分類的方法,根據(jù)相應(yīng)日志跟蹤中的內(nèi)容,將流程實(shí)例識別為“安全”或“不安全”的問題,可以分為以下兩種模型類別:第一種為示例驅(qū)動方法(Bose&van der Aalst,2013;Cuzzocrea,Folino,Guaras?cio,&Pontieri,2016b;Leontjeva,Conforti,Di Francesco?marino,Dumas,&Maggi,2015;Nguyen,Dumas,Rosa,Maggi,&Suriadi,2014):這些方法模型需要一組帶注釋的流程蹤跡樣例ΔAET,注解說明了是否發(fā)生已知的某些安全漏洞,然后利用帶注釋的流程示例構(gòu)建分類模型用于新的流程蹤跡日志分析,可以確定相應(yīng)的流程示例是否存在安全漏洞風(fēng)險(xiǎn)。第二種為模型驅(qū)動的方法(Fazzinga,Flesca,Furfaro,&Pontieri,2018a):這些方法模型是基于安全漏洞模型,即對已知的行為描述信息進(jìn)行分析判斷安全風(fēng)險(xiǎn)(或者根據(jù)由Accorsi&Stocker,2012;中提出的模型),將流程實(shí)例分類為“安全”或“不安全”。

與以上介紹的方法不同,我們的方法首先是對流程日志數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析過濾,將處理之后的數(shù)據(jù)作為樸素貝葉斯模型[6-7]的輸入,計(jì)算該流程執(zhí)行過程中存在的安全風(fēng)險(xiǎn)的概率。

2 流程日志模型分析

2.1 規(guī)則過濾

在系統(tǒng)使用過程中,流程的執(zhí)行可以獲得基礎(chǔ)的流程日志數(shù)據(jù)、軌跡、流程信息、活動以及事件信息等內(nèi)容,會產(chǎn)生大量的日志數(shù)據(jù),其中有很多與安全配置無關(guān)的噪音數(shù)據(jù)產(chǎn)生,這些數(shù)據(jù)不包含任何信息。噪音的存在會極大程度降低模型分析的準(zhǔn)確率。由于日志數(shù)據(jù)量巨大,我們通過滑動時(shí)間窗口的方式獲取部分日志數(shù)據(jù)用于模型實(shí)驗(yàn)。這里我們假設(shè)流程實(shí)例w由一系列高級事件組成a11…an。相應(yīng)的每個(gè)活動實(shí)例ai生成一個(gè)低級事件ei。我們假設(shè)存在一個(gè)跟蹤系統(tǒng)記錄每個(gè)事件的執(zhí)行情況,將按照順序記錄實(shí)例w的執(zhí)行情況,記為φ=e1…en,φ為軌跡信息,流程軌跡追蹤系統(tǒng)中所有的軌跡集合L稱之為日志。

第一步我們在給定的數(shù)據(jù)集中創(chuàng)建事件類型的概率分布(FD)[8]。FD的大小等于唯一事件類型的大小,其中每個(gè)元素對應(yīng)于特定事件類型的總條目數(shù)。下面顯示實(shí)時(shí)系統(tǒng)中的FD示例:

在此我們作出一個(gè)假設(shè):比其他事件發(fā)生更多次數(shù)的事件是例行事件。該假設(shè)是基于常用幾個(gè)事件日志數(shù)據(jù)集的經(jīng)驗(yàn)觀察得到的。因此,通過此假設(shè)可以輕松得到事件類型,例如FD的第三(345)和第五(323)是常規(guī)事件。它們發(fā)生的概率比其他事件更高。我們使用一個(gè)標(biāo)準(zhǔn)偏差用于確定一組元素與平均值的偏差[9-10]。低s表示元素更接近均值(μ),而較高的s值表明元素分散,更具有價(jià)值。計(jì)算公式如下:

其中N表示元素的個(gè)數(shù),xi表示第i個(gè)元素,xˉ是FD的平均值。由于處理之后的數(shù)據(jù)集是連續(xù)事件流的一部分,因此建議的解決方案是使用樣本標(biāo)準(zhǔn)差來形成較大的總體估計(jì)并輸出廣義的結(jié)果。

2.2 樸素貝葉斯算法

樸素貝葉斯法是基于貝葉斯定理與特征條件獨(dú)立假設(shè)的分類方法[11]。設(shè)輸入空間X?Rn為n維向量的集合,輸出空間為類標(biāo)記集合y={c1,c2,…,ck},輸入為特征向量x∈X,輸出為類標(biāo)記y∈Y。X是定義在輸入空間X上的隨機(jī)向量。數(shù)據(jù)集為:

3 仿真測試與分析

由于現(xiàn)有的日志類型眾多,本文主要以某生產(chǎn)企業(yè)的辦公流程日志數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),仿真環(huán)境為:編輯器PyCharm,Python版本為Python 2.7,計(jì)算機(jī)配置為64位Windows 10系統(tǒng),四核2.67GHz、運(yùn)行內(nèi)存16G。我們選擇4種不同業(yè)務(wù)流程的日志數(shù)據(jù),包括:財(cái)務(wù)報(bào)銷業(yè)務(wù)流程、公文審批業(yè)務(wù)流程、人員信息變更業(yè)務(wù)流程,每組使用40個(gè)流程日志數(shù)據(jù)作為實(shí)驗(yàn)的基礎(chǔ)數(shù)據(jù)。我們首先使用規(guī)則過濾的方法處理日志數(shù)據(jù),過濾噪音。數(shù)據(jù)處理的流程為:日志數(shù)據(jù)收集[14]、數(shù)據(jù)特征提取、規(guī)則過濾、模型預(yù)測分析[15]。數(shù)據(jù)維度對數(shù)據(jù)預(yù)測的準(zhǔn)確度的影響對例如圖1。

圖1

從實(shí)驗(yàn)圖表中可以看出,隨著樣本維度的增加,模型的分辨率隨之提高,通過數(shù)據(jù)預(yù)處理過濾部分噪音數(shù)據(jù)模型的正確率得到明顯提升,充分說明了樸素貝葉斯算法在流程日志分析方面有良好的效果。

4 結(jié)語

本文提出使用樸素貝葉斯算法模型在無需任何人工干預(yù)的情況下對流程日志數(shù)據(jù)進(jìn)行分析。該解決方案的主要目的是使用非專家的方式對可能的風(fēng)險(xiǎn)進(jìn)行專家分析,而無需花費(fèi)大量的時(shí)間和經(jīng)歷來獲取安全知識。這種方式完全采取自動化的方式識別,可有效提高風(fēng)險(xiǎn)分析的效率,保證系統(tǒng)運(yùn)行的安全性。

猜你喜歡
分析模型
一半模型
隱蔽失效適航要求符合性驗(yàn)證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統(tǒng)及其自動化發(fā)展趨勢分析
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
中西醫(yī)結(jié)合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 91原创视频在线| 久久美女精品国产精品亚洲| 精品三级网站| 国产99视频精品免费视频7| 欧美特黄一免在线观看| 亚洲综合第一页| 热这里只有精品国产热门精品| 国产视频欧美| 波多野结衣一级毛片| 亚洲成人在线免费观看| 久久99国产综合精品1| 国产精品自拍合集| 国产一区二区网站| 国产成人一区二区| 91蝌蚪视频在线观看| 久久这里只有精品2| 亚洲专区一区二区在线观看| 久久精品66| 欧美国产成人在线| 亚洲国产成人在线| 国产亚洲精品无码专| 熟妇丰满人妻| AV在线麻免费观看网站| 国产成人精品无码一区二| 国模私拍一区二区三区| 夜夜拍夜夜爽| 久久男人资源站| 亚洲成网站| 强乱中文字幕在线播放不卡| 国产菊爆视频在线观看| 在线观看国产精品一区| 丁香婷婷激情综合激情| 全部无卡免费的毛片在线看| 丁香婷婷激情综合激情| 国产不卡国语在线| 亚洲第一成人在线| 美女一级毛片无遮挡内谢| 国产精品自拍合集| jizz亚洲高清在线观看| 日韩免费毛片| 99久久精品无码专区免费| 黄色污网站在线观看| 国产一区二区三区在线精品专区| 国产精品中文免费福利| 亚洲自拍另类| 国产亚洲高清视频| 欧美一级在线播放| 国产乱视频网站| 欧美性精品不卡在线观看| 成人日韩精品| 青青草原国产精品啪啪视频| 青青草国产免费国产| 亚洲天堂视频在线播放| 老熟妇喷水一区二区三区| 亚洲中文无码av永久伊人| 综合亚洲网| 国产精品9| 国产微拍一区二区三区四区| 中文字幕有乳无码| 99在线视频网站| 亚洲无码视频一区二区三区| 亚洲精品国产日韩无码AV永久免费网 | 欧美激情综合一区二区| 免费人成网站在线高清| 国产精品偷伦视频免费观看国产| 亚洲色图欧美| 青青久久91| 亚洲天天更新| 高清无码手机在线观看| 日本高清在线看免费观看| 欧美中文字幕一区| 少妇被粗大的猛烈进出免费视频| 亚洲日产2021三区在线| 国产又爽又黄无遮挡免费观看| 婷婷开心中文字幕| 亚洲美女久久| 亚洲国产成人在线| 激情视频综合网| 麻豆AV网站免费进入| 国产成人无码久久久久毛片| 国产香蕉在线| 国产成人亚洲精品无码电影|