999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹的惡意應(yīng)用軟件檢測方法

2021-05-24 09:55:32龔華堂
電腦知識與技術(shù) 2021年12期

龔華堂

摘要: 為了能夠更精準(zhǔn)檢測惡意應(yīng)用軟件,保證計(jì)算機(jī)或個人移動中終端的數(shù)據(jù)安全以及個人財(cái)產(chǎn)安全,需要對傳統(tǒng)的惡意應(yīng)用軟件檢測方法進(jìn)行改良,因此基于決策樹對惡意應(yīng)用軟件檢測方法進(jìn)行研究。研究基本的決策樹算法,分析得到?jīng)Q策樹算法在惡意應(yīng)用軟件檢測過程中的兩種應(yīng)用方式,并分別闡述CART決策樹生成算法與CART決策樹剪枝算法的應(yīng)用原理。提取數(shù)據(jù)集中的樣本特征、構(gòu)建相應(yīng)的樣本特征數(shù)據(jù)集,基于決策樹進(jìn)行相應(yīng)的樣本特征篩選,并研究該算法的訓(xùn)練方法。最后設(shè)計(jì)實(shí)驗(yàn),驗(yàn)證基于決策樹的惡意應(yīng)用軟件檢測方法達(dá)成了研究目的,具備算法的優(yōu)越性和實(shí)用性。

關(guān)鍵詞:決策樹;惡意應(yīng)用軟件;Android系統(tǒng)

中圖分類號:TP311? ? ? 文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2021)12-0049-02

人們在使用手機(jī)和電腦時,必然離不開對應(yīng)用軟件的操作,因此由應(yīng)用軟件衍生而來的惡意軟件就成了當(dāng)前互聯(lián)網(wǎng)和計(jì)算機(jī)最重要的威脅。如果放任惡意軟件在計(jì)算機(jī)中運(yùn)行,很有可能對計(jì)算機(jī)系統(tǒng)本身造成威脅[1]。因此想要保證互聯(lián)網(wǎng)環(huán)境的安全性,就需要首先確保個人設(shè)備中不會混入惡意應(yīng)用程序,這就需要相關(guān)研發(fā)人員對于能夠檢測惡意應(yīng)用軟件的系統(tǒng)進(jìn)行研究。因此本文使用決策樹對惡意應(yīng)用軟件檢測方法進(jìn)行研究。

1 決策樹算法研究

本文的決策樹主要用于檢測惡意應(yīng)用軟件,因此使用CART決策樹作為本文的算法。CART決策樹是一個樹狀的結(jié)構(gòu),通過基尼指數(shù)的檢驗(yàn),測試特征的不同,通過根節(jié)點(diǎn)逐一分裂,如此在分裂的過程中收集性狀特征,逐漸達(dá)到子節(jié)點(diǎn)[2]。

在檢測惡意應(yīng)用軟件時,需要兩種對于CART決策樹的應(yīng)用方式,其一便是在遍歷惡意軟件時的CART決策樹生成算法,CART決策樹生成算法是CART回歸樹中最簡單的特征劃分算法,使用了最小平方化的原則,以完成二叉樹的構(gòu)建[3]。首先輸入訓(xùn)練集,終止所有已知條件,輸出CART決策回歸樹[f(x)],此時應(yīng)通過以下公式選擇最優(yōu)切分變量:

其中[j]表示所求的最優(yōu)切分變量;[s]表示待切分點(diǎn);通過將所有最優(yōu)切分變量遍歷,得到所有能夠切分點(diǎn)子樹樹枝,并得到公式(1)中數(shù)值最小的切分插入點(diǎn)[(j,s)]。

需要將已經(jīng)選定的[(j,s)]點(diǎn)劃分出相應(yīng)的區(qū)域,并輸出切分點(diǎn)的最優(yōu)變量值,此時得到的只是區(qū)域最優(yōu)變量,若想要計(jì)算出全局最優(yōu)解,還需要不斷重復(fù)以上兩個步驟的遞歸程序,直至滿足性狀特征條件。設(shè)定每一個性狀特征都是一個子樹樹葉,就能夠得到如下所示的決策樹生成表達(dá)式:

式中,[M]表示輸入空間的總個數(shù),即該決策樹將空間劃分為[M]個不相交的區(qū)域[R1,R2,R3,…,RM];[m]則表示每個區(qū)域的一個子樹葉片,且滿足[x∈Rm]。

CART決策樹的應(yīng)用方式是在檢測到惡意應(yīng)用軟件刪除以上過程中生成數(shù)據(jù)時所需要的CART決策樹剪枝算法,剪枝的過程實(shí)際上就是一個將算法簡化的過程,檢測惡意應(yīng)用軟件的目的達(dá)成以后,就需要刪除一些已經(jīng)不需要的底端子樹,因此需要在CART決策應(yīng)用樹中先后進(jìn)行兩步操作[4]。決策樹的剪枝操作需要從底端開始,逐步操作至根節(jié)點(diǎn),就能夠獲得經(jīng)過修剪的決策樹[{T0,T1,T2,…,Tn}]。可以通過驗(yàn)證法,交叉驗(yàn)證獨(dú)立集合中的決策樹,對其進(jìn)行測試,選擇一條最優(yōu)的子樹[5]。

2 惡意應(yīng)用軟件檢測方法研究

2.1 特征向量的提取和構(gòu)建

在研究檢測方法時,為了方便設(shè)計(jì)算法以及驗(yàn)證算法的準(zhǔn)確性,均需要首先構(gòu)建數(shù)據(jù)集,在本文中,構(gòu)建數(shù)據(jù)集時需要大量的良性應(yīng)用軟件和惡意應(yīng)用軟件,使良性應(yīng)用軟件和惡意應(yīng)用軟件達(dá)到1:1的比例。在數(shù)據(jù)集中提取特征向量并構(gòu)建基于決策樹的類別特征。

在得到了.txt的數(shù)據(jù)集集合后,就能夠?qū)υ摂?shù)據(jù)集中的所有文件名稱進(jìn)行操作,通過讀取和去重,能夠獲得數(shù)據(jù)及樣本的特征向量,并與數(shù)據(jù)集中的每一個樣本比對。若存在與之相仿的文件則標(biāo)注為1,若不存在與之相對應(yīng)的文件則標(biāo)注為0,以1和0作為樣本特征的標(biāo)簽,并以此構(gòu)建樣本的特征向量集合。獲得標(biāo)簽后,還需要再次處理已經(jīng)集結(jié)為集合的特征文件,以便之后的樣本訓(xùn)練。假設(shè)特征數(shù)據(jù)集中共有N個樣本,可以設(shè)計(jì)樣本總體特征與樣本單體特征的對比函數(shù)關(guān)系式,獲取了特征向量的維度分析結(jié)果之后,需要首先對該特征向量維度進(jìn)行壓縮操作,之后再進(jìn)行特征的判別。

2.2 基于決策樹的特征篩選

在上文計(jì)算得到特征向量之后,還需要基于決策樹對這些向量進(jìn)行特征的篩選,以尋找到混雜在良性應(yīng)用軟件之中的惡意應(yīng)用軟件,本文使用特征重要度的度量進(jìn)行特征篩選。對于上文中構(gòu)建的數(shù)據(jù)集,假設(shè)其中共有y個樣本,其中惡意應(yīng)用軟件在樣本集中的比例為[p2],則此時可以使用基尼指數(shù)進(jìn)行樣本集中CART決策樹的生成操作。由此,對樣本特征數(shù)據(jù)集所得到相應(yīng)的特征進(jìn)行評分,以評分進(jìn)行篩選,其篩選過程如下所示:

其中,[F1,F(xiàn)2,…,F(xiàn)N]表示數(shù)據(jù)特征集合;[FS1,F(xiàn)S2,…,F(xiàn)Sk]表示這些數(shù)據(jù)集合中各項(xiàng)數(shù)據(jù)所對應(yīng)的評分。此時應(yīng)設(shè)置一個特征閾值,若超過閾值,則可以將其篩選出來。其中[FSk]就表示第k個被篩選出來的特征。

2.3 算法訓(xùn)練集成方法研究

將以上特征的提取與篩選進(jìn)行整合之后,就可以設(shè)計(jì)該惡意應(yīng)用軟件的檢測方法如圖1所示。

如上圖所示,將上文中的樣本特征集合分別進(jìn)行訓(xùn)練并將其分類,通過對樣本的劃分,可以得到整個算法的訓(xùn)練集,將這些訓(xùn)練集統(tǒng)一測試,得到Roting的結(jié)果,經(jīng)過投票處理之后,對各個子結(jié)果統(tǒng)一合并,才能得到最終的結(jié)果。將最終的結(jié)果輸出,就可以將此作為一個數(shù)據(jù)集中惡意應(yīng)用軟件和良性應(yīng)用軟件的評判結(jié)果。

3 實(shí)驗(yàn)設(shè)計(jì)

為了確定本文研究的基于決策樹的惡意應(yīng)用軟件檢測方法是否能夠達(dá)成研究目的,在檢測精度、檢測過后的算法冗余度、檢測效率等方面的綜合成績優(yōu)于傳統(tǒng)的幾種算法,設(shè)計(jì)對比實(shí)驗(yàn)進(jìn)行驗(yàn)證。

3.1 實(shí)驗(yàn)環(huán)境設(shè)置

本實(shí)驗(yàn)在設(shè)置實(shí)驗(yàn)環(huán)境時應(yīng)分為計(jì)算機(jī)的測試環(huán)境與移動通信設(shè)備的測試環(huán)境,基本的環(huán)境參數(shù)如下所示:計(jì)算機(jī)設(shè)備包括Intel Core -2440(八核)i7-4230 5.1GHz 的CPU、8GB運(yùn)行內(nèi)存、MS SQL Server 2012惡意軟件樣本數(shù)據(jù)庫;個人移動端包括Core i7-2550 CPU(八核)4.20 GHz處理器、8GB運(yùn)行內(nèi)存、Weka3.8軟件環(huán)境。使用Python軟件將上文中研究的檢測方法編寫出來,裝載于計(jì)算機(jī)設(shè)備中,再利用Weka軟件將以上程序?qū)雮€人移動終端中,作為實(shí)驗(yàn)中的惡意應(yīng)用軟件檢測程序。設(shè)置惡意應(yīng)用軟件樣本數(shù)據(jù)集,收集2000個軟件樣本作為樣本數(shù)據(jù),其中200個為惡意應(yīng)用軟件。將這500個軟件樣本分為數(shù)量不一的10組,每組的良性應(yīng)用軟件和惡意應(yīng)用軟件數(shù)量不一,分組將這些應(yīng)用軟件裝載進(jìn)計(jì)算機(jī)設(shè)備和個人移動終端中。分別使用本文研究的基于決策樹的惡意應(yīng)用軟件檢測方法、傳統(tǒng)的基于隨機(jī)森林算法的惡意應(yīng)用軟件方法、基于機(jī)器學(xué)習(xí)的惡意應(yīng)用軟件方法這三種方法對以上的惡意應(yīng)用軟件進(jìn)行檢測。通過對檢測精度以及檢測過后的算法冗余度進(jìn)行檢測,判斷其算法的實(shí)用性及優(yōu)越性。

3.2 實(shí)驗(yàn)結(jié)果分析

通過以上四個公式的計(jì)算,可以得到四組對于惡意應(yīng)用軟件檢測算法實(shí)用性的衡量數(shù)據(jù),使用Matlab軟件對其進(jìn)行分析整理。

通過統(tǒng)計(jì)能夠得到如表1所示的實(shí)驗(yàn)結(jié)果。

通過表1可以得知,在以上10次測試的精度檢測中,基于決策樹的惡意應(yīng)用軟件檢測方法高于基于隨機(jī)森林算法的惡意應(yīng)用軟件檢測方法,卻與基于機(jī)器學(xué)習(xí)的惡意應(yīng)用軟件檢測方法精度相仿;在算法冗余度的測試中,本文研究的算法與基于隨機(jī)森林算法的惡意應(yīng)用軟件檢測方法相差不大,卻遠(yuǎn)高于基于機(jī)器學(xué)習(xí)的惡意應(yīng)用軟件檢測方法。基于綜合考慮,本文研究的算法擁有較高的檢測精度,在檢測過后算法冗余度的計(jì)算中也冗余量較少,因此相較于其他兩種算法具備更好的實(shí)用性和優(yōu)越性。

4 結(jié)束語

本文為了解決原始的惡意應(yīng)用軟件檢測方法應(yīng)用效果不理想的問題,提出了一種基于決策樹的惡意應(yīng)用軟件檢測方法,對決策樹算法進(jìn)行了簡要的分析,并將這種算法帶入到了惡意應(yīng)用軟件檢測方法中。對比實(shí)驗(yàn)中通過對樣本數(shù)據(jù)的檢測對比分析,驗(yàn)證了該種惡意應(yīng)用軟件檢測方法的實(shí)用性和優(yōu)越性。

參考文獻(xiàn):

[1] 馮垚,王金雙,張雪濤.基于特征生成方法的Android惡意軟件檢測方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(11):8-13.

[2] 管峻,劉慧英,毛保磊,等.基于API配對的Android惡意應(yīng)用檢測[J].西北工業(yè)大學(xué)學(xué)報(bào),2020,38(5):965-970.

[3] 超凡,楊智,杜學(xué)繪,等.基于深度神經(jīng)網(wǎng)絡(luò)的Android惡意軟件檢測方法[J].網(wǎng)絡(luò)與信息安全學(xué)報(bào),2020,6(5):67-79.

[4] 陳怡,唐迪,鄒維.基于深度學(xué)習(xí)的Android惡意軟件檢測:成果與挑戰(zhàn)[J].電子與信息學(xué)報(bào),2020,42(9):2082-2094.

[5] 龐夢洋,索中英,鄭萬澤,等.基于RS-CART決策樹的航空發(fā)動機(jī)小樣本故障診斷[J].航空動力學(xué)報(bào),2020,35(7):1559-1568.

【通聯(lián)編輯:張薇】

主站蜘蛛池模板: 欧美激情综合一区二区| 欧美亚洲香蕉| v天堂中文在线| 国产制服丝袜91在线| 亚洲无码91视频| 久久久91人妻无码精品蜜桃HD| 国产在线小视频| 免费A级毛片无码免费视频| 色视频国产| 国产综合精品日本亚洲777| 久久精品aⅴ无码中文字幕| 天堂成人av| 99久久免费精品特色大片| 久操中文在线| 国内精品自在自线视频香蕉| 欧美成人手机在线观看网址| 三区在线视频| 精品人妻一区无码视频| 成人字幕网视频在线观看| 日韩天堂在线观看| 国产无遮挡裸体免费视频| 日韩天堂在线观看| 人禽伦免费交视频网页播放| 国内精品伊人久久久久7777人| 欧美日韩国产一级| 国产丰满大乳无码免费播放| 欧美日韩一区二区三区在线视频| 亚洲精品无码在线播放网站| 欧美综合区自拍亚洲综合绿色| 国产人成午夜免费看| 内射人妻无码色AV天堂| 久久毛片网| 91久久夜色精品国产网站| 成人伊人色一区二区三区| 日本三级欧美三级| 又黄又湿又爽的视频| 日本伊人色综合网| 亚洲av无码成人专区| 人妻精品久久无码区| 久久亚洲精少妇毛片午夜无码 | 91视频区| 久久久久人妻精品一区三寸蜜桃| 亚洲日韩欧美在线观看| 毛片免费观看视频| 69av免费视频| 在线播放真实国产乱子伦| 精品久久久久久久久久久| 亚洲视频免| 亚洲中文制服丝袜欧美精品| 欧美区一区二区三| 国产资源免费观看| 波多野结衣视频网站| 精品视频在线观看你懂的一区 | 毛片手机在线看| 人妻夜夜爽天天爽| 无码国产伊人| 国产美女免费| 在线a视频免费观看| 四虎在线高清无码| 久久人人97超碰人人澡爱香蕉| 亚洲免费福利视频| 中文字幕在线免费看| 丝袜久久剧情精品国产| 91精品专区国产盗摄| 国产情精品嫩草影院88av| 玖玖免费视频在线观看| 久久综合久久鬼| 久久亚洲黄色视频| 亚洲国产精品VA在线看黑人| 一本久道热中字伊人| 无码AV动漫| 狠狠干综合| 国产成人综合亚洲欧洲色就色| 午夜无码一区二区三区| 精品一区二区三区自慰喷水| 午夜限制老子影院888| 久久亚洲美女精品国产精品| 视频二区欧美| 尤物国产在线| 老色鬼欧美精品| 二级特黄绝大片免费视频大片 | 午夜精品影院|