999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

惡意移動(dòng)應(yīng)用檢測(cè)方法

2015-12-26 01:19:08江蘇省通信服務(wù)有限公司無錫網(wǎng)盈分公司楊樹春
江蘇通信 2015年6期
關(guān)鍵詞:分類特征檢測(cè)

江蘇省通信服務(wù)有限公司 無錫網(wǎng)盈分公司 楊樹春

惡意移動(dòng)應(yīng)用檢測(cè)方法

江蘇省通信服務(wù)有限公司 無錫網(wǎng)盈分公司 楊樹春

提出了一種惡意移動(dòng)應(yīng)用檢測(cè)方法,該方法以Android移動(dòng)應(yīng)用為研究對(duì)象,從APK(Android安裝包)文件中靜態(tài)提取出權(quán)限、組件行為和函數(shù)調(diào)用等特征,進(jìn)而采用支持向量機(jī)分類方法,建立分類模型用于識(shí)別惡意應(yīng)用。實(shí)驗(yàn)結(jié)果表明該方法能獲得較好的檢測(cè)精度。

聚類分析; 集成聚類; 惡意應(yīng)用檢測(cè)

移動(dòng)互聯(lián)網(wǎng)移動(dòng)終端的廣泛應(yīng)用,使得移動(dòng)終端上的惡意軟件成為重要的危險(xiǎn)源。這些惡意軟件通常會(huì)通過植入惡意代碼篡改和采集用戶信息、竊取賬號(hào)、構(gòu)建僵尸網(wǎng)絡(luò)和獲取root權(quán)限等操作,進(jìn)而對(duì)終端使用者和服務(wù)提供者的數(shù)據(jù)資產(chǎn)安全造成了極大危害。此外,Android平臺(tái)由于其開放性、優(yōu)秀的性能和易操作性等特點(diǎn),在智能移動(dòng)終端市場(chǎng)具有較高的占有率,但也正由于其開放性,易于被惡客篡改和利用,所以出現(xiàn)了數(shù)量巨大、變種較多的惡意Android應(yīng)用。因此,惡意應(yīng)用檢測(cè)成為近年來移動(dòng)終端安全防護(hù)技術(shù)研究的熱點(diǎn)問題之一。為了進(jìn)行惡意應(yīng)用檢測(cè),提高檢測(cè)精度,本文的工作首先通過靜態(tài)分析方法提取三類應(yīng)用特征,包括權(quán)限特征、組件特征和函數(shù)調(diào)用特征,而后數(shù)據(jù)挖掘方法中支持向量機(jī)(SVM)模型對(duì)給定的樣本建立分類模型,最后將采集自第三方應(yīng)用市場(chǎng)的500款A(yù)ndroid應(yīng)用作為樣本(其中有147款惡意應(yīng)用和353款正常應(yīng)用)進(jìn)行了實(shí)驗(yàn),獲得了較好的檢測(cè)精度。

1 惡意應(yīng)用檢測(cè)方法

1.1 檢測(cè)框架

圖1為基于數(shù)據(jù)挖掘的惡意應(yīng)用檢測(cè)框架。給定收集的正常應(yīng)用樣本庫和惡意應(yīng)用樣本庫,首先通過靜態(tài)分析方法,對(duì)于Android應(yīng)用的APK(Android安裝包)文件進(jìn)行處理,提取多種類型的特征,包括權(quán)限特征、組件使用特征和函數(shù)調(diào)用特征,建立多類型特征集;其次,采用主成分分析(PCA)方法進(jìn)行特征選取;接著,采用SVM分類方法建立惡意應(yīng)用分類器;最后,對(duì)應(yīng)用分類器測(cè)試樣本進(jìn)行分類,給出樣本的分類結(jié)果。

1.2 特征提取

Xij表示第i個(gè)樣本應(yīng)用的第j個(gè)特征值。

采用靜態(tài)分析方法提取二進(jìn)制程序樣本的特征,本文提取的樣本特征包括組件使用特征、權(quán)限特征、函數(shù)調(diào)用特征等。

假設(shè)Android應(yīng)用可指定的權(quán)限有n個(gè),權(quán)限集為

其中pi為第i個(gè)權(quán)限,n為權(quán)限總數(shù),1≤i≤n,則權(quán)限特征為

若有

假設(shè)Android應(yīng)用包含p個(gè)組件,記為C1,…,C2,…,Cp,則組件使用特征為

則方程組左邊的綜合指標(biāo)Z1,Z2,…,Zm是樣本原先的p個(gè)特征X1, X2,…, Xp對(duì)應(yīng)的m個(gè)主成分,bij是系數(shù)。其中,Zi與Zj(i≠j;i, j=1,2,…, m)相互無關(guān);Z1是X1, X2,…, Xp的所有線性組合中方差最大的;Z2是與Z1不相關(guān)的X1, X2, …, Xp的所有線性組合中方差最大的;Zm是與Z1, Z2,…,Zm-1都不相關(guān)的X1, X2, …, Xp的所有線性組合中方差最大的。

其中count(Ci)表示組件使用次數(shù),1≤i≤p。

其中βi(0≤i≤m)是線性回歸中變量Zi對(duì)應(yīng)的系數(shù),Y是線性擬合后的值。

其中函數(shù)調(diào)用是應(yīng)用程序與底層系統(tǒng)交互的紐帶,函數(shù)調(diào)用可以獲取用戶的subscriber ID、phone ID、其他類似個(gè)人隱秘信息和下載其他應(yīng)用程序等。

可以采用靜態(tài)分析的方式進(jìn)行特征提取,其步驟如下:

1) 將APK文件解壓縮后獲取其中的lib/*.so文件以及Androidmanifest.xml文件;

2) 從Androidmanifest.xml文件中提取權(quán)限特征和組件使用特征;

3) 將所有的lib/*.so文件進(jìn)行合并產(chǎn)生對(duì)應(yīng)的*.elf文件;

4) 從*.elf文件中得到類別為“func”(*.elf文件中包含的類別)的所有應(yīng)用程序編程接口。

經(jīng)過主成分分析完成特征選擇后,從樣本庫中選取部分訓(xùn)練樣本以訓(xùn)練SVM分類器,同時(shí)選取部分測(cè)試樣本作為測(cè)試集以進(jìn)行分類結(jié)果的精度評(píng)估。選取樣本的原則為充分考慮正常應(yīng)用和惡意應(yīng)用的比例,從而使選擇的樣本具有代表性。本文所選取的訓(xùn)練樣本數(shù)據(jù)占總樣本的80%,測(cè)試樣本數(shù)據(jù)占20%。

其中x是空間中某個(gè)點(diǎn),y是中心點(diǎn), ||x -y||2表示x2與中心點(diǎn)y之間的距離平方和,核參數(shù)σ=0.5;錯(cuò)分懲罰因子C=50,采用開源的軟件包Libsvm[1]實(shí)現(xiàn)。

1.3 特征選擇

為了從組件使用特征、權(quán)限特征、函數(shù)調(diào)用特征等眾多的特征中確定哪些特征對(duì)于分類有重大影響,采用了基于主成分分析方法進(jìn)行特征選擇。

設(shè)有個(gè)n×p 階的數(shù)據(jù)矩陣是由n 個(gè)樣本組成,其中每條樣本都具有p個(gè)特征,構(gòu)成如下的數(shù)據(jù)矩陣

2 實(shí)驗(yàn)驗(yàn)證

2.1 實(shí)驗(yàn)設(shè)置

本實(shí)驗(yàn)采集自第三方應(yīng)用市場(chǎng)的500款A(yù)ndroid應(yīng)用進(jìn)行了病毒、蠕蟲、木馬等多種分析,經(jīng)過整理將147款惡意應(yīng)用和353款正常應(yīng)用作為最終的樣本集,樣本集中的這些應(yīng)用覆蓋了娛樂、教育、體育、衛(wèi)生、新聞、財(cái)經(jīng)等多種類型,具有代表性。所有實(shí)驗(yàn)在內(nèi)存為8 GB RAM,處理器為 Intel(R) core i5 CPU 3.5 GHz的機(jī)器上完成,采用了Java語言實(shí)現(xiàn)了本文提出的基于靜態(tài)分析的特征提取算法完成上述APK樣本的特征提取。為了驗(yàn)證算法有效性,與其他分類算法如后向傳播神經(jīng)網(wǎng)絡(luò)、決策樹算法C4.5等進(jìn)行比較。

實(shí)驗(yàn)中采用的評(píng)價(jià)標(biāo)準(zhǔn)采用精度precision、召回率recall和平衡F分?jǐn)?shù)F1 score,其中精度計(jì)算方法為正確識(shí)別的異常應(yīng)用個(gè)數(shù)與真實(shí)異常應(yīng)用個(gè)數(shù)的比值;召回率計(jì)算方法為正確識(shí)別的異常應(yīng)用個(gè)數(shù)與識(shí)別到的所有異常個(gè)數(shù)的比值;F1 score計(jì)算方法為精度與召回率乘積的2倍除以精度與召回率之和。

2.2 結(jié)果分析

為了驗(yàn)證本文提出的算法的有效性,將SVM算法與人工神經(jīng)網(wǎng)絡(luò)(ANN)和C4.5的檢測(cè)方法進(jìn)行了比較分析,并且考慮了采用不同特征組合表示應(yīng)用樣本的情況,實(shí)驗(yàn)結(jié)果如表1所示。其中表格中每個(gè)單元格的第一行描述了算法獲得的F1 score,而第二行則是算法的precision和recall值,粗體字表示每一個(gè)特征集刻畫的樣本取得最佳F1 score值的那個(gè)算法。

表1 不同算法在不同特征集表示樣本中的結(jié)果

從表1中可以看出:

1) SVM分類器幾乎在所有的特征集上的F1 score都優(yōu)于其他兩種分類器;

2) 在考慮用單一特征刻畫的應(yīng)用樣本情形下,可以發(fā)現(xiàn)采用函數(shù)調(diào)用的方式刻畫的樣本集上取得的F1 score值最高,優(yōu)于其他兩種特征集下的值,其中基于組件特征的檢測(cè)精度最低,基于權(quán)限特征的惡意應(yīng)用檢測(cè)的精度較高;

3) 從特征組合角度來說,基于多個(gè)特征刻畫的樣本集上取得的F1 score值均高于采用單一特征刻畫的樣本集取得的值,且對(duì)于組件特征的改善更為明顯。

3 總結(jié)

本文的方法以Android移動(dòng)應(yīng)用為研究對(duì)象,從APK文件中靜態(tài)提取出權(quán)限、組件行為和函數(shù)調(diào)用等特征,進(jìn)而采用支持向量機(jī)分類方法建立分類模型用于識(shí)別惡意應(yīng)用。實(shí)驗(yàn)結(jié)果表明該方法能獲得較好的檢測(cè)精度。不過,目前本文的工作中考慮的特征均為通過靜態(tài)分析方法獲得的特征,在未來的工作中可以考慮通過動(dòng)態(tài)分析的方法獲取一些系統(tǒng)運(yùn)行時(shí)的行為特征,如系統(tǒng)調(diào)用特征、控制流特征等,將對(duì)于進(jìn)一步提高檢測(cè)精度有更多貢獻(xiàn)。

[1]CHANG Chih-chung, LIN Chih-jen. Libsvm-a library for support vector machines[EB/OL].[2015-10-08]. http://www.csie.ntu.edu.tw/~cjlin/libsvm.

猜你喜歡
分類特征檢測(cè)
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
分類算一算
如何表達(dá)“特征”
不忠誠的四個(gè)特征
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
抓住特征巧觀察
主站蜘蛛池模板: 国产美女人喷水在线观看| 日本午夜精品一本在线观看| 97精品国产高清久久久久蜜芽| 无码人妻热线精品视频| 黄片一区二区三区| 91无码国产视频| 亚洲区欧美区| 午夜视频www| 国产成a人片在线播放| 免费观看国产小粉嫩喷水| 亚洲乱伦视频| 在线免费观看a视频| 五月六月伊人狠狠丁香网| 亚洲自拍另类| 二级特黄绝大片免费视频大片| www.亚洲天堂| 国产精品美女网站| 国产最新无码专区在线| 国产一区二区福利| 真人免费一级毛片一区二区| 国产成人无码久久久久毛片| 久久亚洲高清国产| 免费看黄片一区二区三区| 小蝌蚪亚洲精品国产| 亚洲欧美成aⅴ人在线观看 | 麻豆精品在线视频| 青青青伊人色综合久久| 精品成人免费自拍视频| 久久精品人人做人人爽| a毛片在线| 欧美成人二区| 在线观看无码a∨| 国产精品浪潮Av| 91国内在线视频| 欧美成人精品在线| 人人妻人人澡人人爽欧美一区| 99爱视频精品免视看| 日韩福利在线视频| 日韩视频免费| 亚洲一区毛片| 四虎AV麻豆| 欧美精品成人一区二区在线观看| 亚洲精品天堂自在久久77| 高清亚洲欧美在线看| 美女视频黄频a免费高清不卡| 国产欧美日韩在线在线不卡视频| 亚洲无码高清免费视频亚洲| 午夜毛片免费看| 欧美黄色网站在线看| 国产精品成人一区二区不卡| 欧美无专区| 午夜综合网| 高h视频在线| 免费xxxxx在线观看网站| 直接黄91麻豆网站| 成人在线亚洲| 澳门av无码| 亚洲福利一区二区三区| 日韩视频精品在线| 欧美激情第一区| 久久中文字幕2021精品| 四虎国产在线观看| 精品视频一区二区观看| 亚洲综合色区在线播放2019| аv天堂最新中文在线| 成人福利在线视频| 国产69精品久久久久妇女| 久久免费观看视频| 国产成人精品视频一区二区电影| 欧美日韩国产综合视频在线观看| 欧美午夜理伦三级在线观看| 国产亚洲欧美日韩在线一区二区三区| 狠狠亚洲婷婷综合色香| 国产成人精品男人的天堂下载| 日本精品αv中文字幕| 欧美精品高清| 精品一區二區久久久久久久網站| 国内精品久久久久久久久久影视 | 99视频免费观看| 国产一级精品毛片基地| 欧美日韩91| 亚洲一区第一页|