999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于融合感知哈希算法的代碼特征分類研究

2021-07-19 02:31:40張士董李明東盧彪
錦繡·下旬刊 2021年8期
關鍵詞:機器學習

張士董 李明東 盧彪

摘要:基于卷積神經網絡CNN的惡意代碼檢測技術。利用Cuckoo沙箱系統來模擬運行環境并提取分析報告;首先,通過感知哈希算法對惡意代碼灰度圖樣本進行檢測,快速劃分出具體惡意代碼家族和不確定家族的樣本,實驗測試得約有67%的惡意代碼能夠通過感知哈希算法檢測出來。然后,對于不確定家族樣本再進一步提取局部特征局部二值模式(LBP)與全局特征Gist,并利用二者融合后的特征通過機器學習算法對惡意代碼樣本進行分類檢測。最后,對25類惡意代碼家族檢測,實驗結果表明,相較于僅用單一特征,在LBP與Gist的融合特征下,檢測準確率更高,并且所提方法與僅采用機器學習的檢測算相比,分類檢測效率更快,檢測速度提高93.5%。

關鍵詞:感知哈希;惡意代碼可視化;機器學習

隨著網上支付和網上銀行的全面普及,計算機已經成為人們日常生活的重要部分;同時,由于普遍缺乏有效的安全屏障,物聯網設備也成為網絡攻擊者覬覦的目標。在特征提取階段,提取的特征主要有靜態特征和動態特征,相應的提取手段分別為靜態特征提取技術和動態特征提取技術。

1.輸入層詞向量生成

在生成詞向量的過程中,本實驗選擇兩種模型進行比較,一種是Word2vec中的Skip-gram模型,一種是One-Hot編碼。

(1)Skip-gram模型本實驗選用了基于Word2vec提供的Skip-gram語言模型來建模,將文本的各特征之間的聯系以詞向量形式展現。在實驗中,我們輸入預處理過程中提取出的API序列,通過Skip-gram將其數值向量化。Skip-gram模型是一種無監督訓練算法,用來實現詞向量的分布特征表示,通過映射關系實現詞與詞之間的位置關系來反映他們在語義層面的聯系。

(2)One-Hot編碼One-Hot編碼使用N位狀態寄存器來對N個狀態進行編碼,并且只有一位有效。使用One-Hot編碼,可以將離散特征的取值擴展到了歐式空間,在分類過程中,特征之間距離的計算或相似度的計算通常都是在歐式空間進行。

2.感知哈希算法和特征融合的惡意代碼分類算法。

特征信息庫建立模塊中,將數據集中全部惡意代碼灰度圖樣本通過感知哈希算法,計算DHash并存入DHash庫;此外提取惡意代碼樣本的Gist特征與LBP特征,并分別存入Gist庫與LBP庫。樣本信息提取模塊過程中,提取待分類檢測的樣本的DHash、Gist特征和LBP特征。提取樣本的Gist特征與LBP特征,并進行融合通過隨機森林(RandomForest,RF)算法進行檢測分類。

基于感知哈希與特征融合的惡意代碼分類算法步驟如下:

Step1通過感知哈希算法計算待分類惡意代碼灰度圖的DHash;

Step2通過相似性判斷公式篩選與檢測樣本相似的惡意代碼圖像;

Step3若能通過閾值判斷出檢測樣本的家族類別則結束,否則繼續Step4;

Step4提取惡意代碼圖像Gist特征;

3.感知哈希檢測模塊

通過感知哈希算法將灰度圖轉化成哈希序列,通過將惡意代碼待分類樣本與DHash庫中的25類家族樣本進行圖像的哈希序列對比,并通過設置閾值對待分類樣本進行判斷。感知哈希算法的步驟如下:

Step1縮小圖片。將圖片縮小為9*8的像素。

Step2計算相鄰像素間的差異值。

Step3比較差異值。若前一個像素的顏色強度大于第

二個像素,那么差異值就設置為“True”,即1;如果不大

于第二個像素,就設置“False”,即0。

Step4:構造hash值。生成16位DHash值。

4.特征的提取與處理

在惡意代碼檢測中,樣本的特征提取和處理是后續建模檢測的關鍵,本文主要將樣本的API調用函數作為特征提取的對象。API函數是惡意代碼實現其惡意行為并與系統交互所必須的函數,雖然API本身是沒有惡意性的,但是惡意代碼通過某些API函數的組合,可使其所表示的行為構成惡意性,而這些行為在正常文件中是不常見的,如進程的注入操作、關鍵系統文件的更改和刪除等。

5.結語:

為解決傳統惡意代碼灰度圖特征的局限性并為進一步提高檢測效率,本文提出了基于感知哈希算法和特征融合計算機應用7的惡意代碼檢測方法。首先,通過感知哈希檢測模塊判斷惡意代碼樣本的所屬家族,對于無法通過感知哈希模塊判斷的樣本再進一步提取全局特征Gist與局部特征LBP,根據Gist與不同比例的LBP融合后的特征進行測試,準確率可達98.2%,此外本文提出的方法相較于機器學習檢測,檢測速度提高了93.5%。將本文實驗結果也與其他采用單一特征的文獻進行了對比,實驗結果表明本文所采用的融合特征的準確率更高。在下一步的工作中,將繼續研究惡意代碼的方法與特征,進一步提高惡意代碼的分類準確率。

參考文獻

[1]張景蓮,彭艷兵.基于特征融合的惡意代碼分類研究[J].計算機工程,2019,45(08):281-286,295.)

[2]李翼宏,劉方正,杜鎮宇.一種改進主動學習的惡意代碼檢測算法[J].計算機科學,2019,46(05):92-99.

[3] 傅依嫻,蘆天亮,馬澤良.基于 One-Hot 的 CNN 惡意代碼檢測技術[J].計算機應用與軟件,2020,37(1):304-308,333.

基金項目:2020年安徽省教育廳關高等學校省級質量工程項目,課程思政項目(編號:2020szsfkc1004);

2020年校級質量工程線下課程(編號:szxy2020xxkc07);2020年宿州學院專創融合重點課程建設項目(編號:szxy2020zckc22).

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 國產尤物AV尤物在線觀看| swag国产精品| 久久久噜噜噜| 国产欧美精品一区aⅴ影院| 亚洲区视频在线观看| 欧美一区中文字幕| 四虎影视库国产精品一区| 欧美日韩v| 日韩国产 在线| 最新亚洲人成网站在线观看| 国产在线观看一区精品| 中国一级特黄视频| 乱色熟女综合一区二区| 亚洲综合狠狠| 在线免费a视频| 国产一区二区丝袜高跟鞋| 一区二区午夜| 欧美日韩在线国产| 女人爽到高潮免费视频大全| 伊人国产无码高清视频| AV在线天堂进入| 免费精品一区二区h| 国产内射在线观看| www欧美在线观看| 欧美人人干| 亚洲欧美日韩成人在线| 污网站免费在线观看| 香蕉精品在线| 最新国产精品第1页| 亚洲va视频| 91久久国产综合精品女同我| 玖玖免费视频在线观看| 亚洲人成网站日本片| 婷婷色在线视频| 大乳丰满人妻中文字幕日本| 国产精品午夜福利麻豆| 丰满人妻中出白浆| 亚洲综合香蕉| 思思热精品在线8| 免费高清毛片| 欧美国产综合色视频| 色综合久久综合网| 激情综合婷婷丁香五月尤物| 欧美福利在线| 欧美成人一级| 国产精品亚洲专区一区| 99视频在线免费看| 亚洲精品成人7777在线观看| 欧美一级专区免费大片| 久久超级碰| 色窝窝免费一区二区三区 | 好吊色国产欧美日韩免费观看| 熟妇无码人妻| 五月婷婷综合在线视频| 成人亚洲视频| 欧美在线国产| 国产成人永久免费视频| 国产91导航| 91久久偷偷做嫩草影院电| 免费无码网站| 美女免费黄网站| 精品欧美一区二区三区久久久| 2020极品精品国产| 1769国产精品视频免费观看| 18黑白丝水手服自慰喷水网站| 亚洲精品高清视频| 亚洲小视频网站| 国产在线高清一级毛片| 亚洲熟女中文字幕男人总站| 午夜视频www| 666精品国产精品亚洲| 亚洲a级毛片| 国产高清在线丝袜精品一区| 国产性爱网站| 亚洲欧美综合精品久久成人网| 男女性色大片免费网站| 国产成人一级| 青草娱乐极品免费视频| 亚洲综合第一区| 亚洲午夜片| 亚洲欧洲日韩综合| 婷婷中文在线|