999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于APK文件抓取系統的匹配模塊設計

2016-09-13 07:25:29高瑞華
電子設計工程 2016年3期
關鍵詞:數據庫檢測

高瑞華

(陜西省理工學校 陜西 西安 710054)

基于APK文件抓取系統的匹配模塊設計

高瑞華

(陜西省理工學校 陜西 西安710054)

文中提出了一個APK抓取系統的設計思路,首先設計了該系統的整體框架,使用Mysql5.5實現系統的數據庫,基于開源python網絡爬蟲框架Scrapy,結合應用市場及APK的特性,聯合使用VirusTotal和特征匹配檢測的方法,重點設計了該APK文件抓取系統下基于模糊哈希算法的指紋匹配模塊。為降低APK的惡意性,詳細論述了匹配模塊的功能、匹配算法、主要解決了“如何快速有效的檢測惡意軟件”的等問題,達到了設計要求。為后續研究提供了有力支撐。

APK抓取;特征匹配;匹配度;模糊哈希算法

當前安卓應用市場魚龍混雜,各個應用市場中存在較大比例的惡意應用程序,其原因是各個應用市場對發布的APK的檢測方法存在差異和缺陷,因此面對眾多應用市場,如何給用戶提供更安全可靠的APK,減小用戶下載惡意APK的可能性,具有很高的研究和市場應用價值。

1 APK文件抓取系統總體框架設計

無線通信技術、3G及4G網絡的發展深刻的改變著所有人的生活,搭載移動操作系統的智能手機的用戶越來越多,其功能也日趨豐富和多元化。由于眾多的開發人員開發出大量的Android應用程序,給Android用戶帶了很大的便利,但是同時也給用戶帶來很多的安全隱患,其中惡意應用程序的泛濫等問題嚴重威脅著Android用戶的安全[1-2]。

針對目前市場惡意檢測方案的缺陷,必須設置可靠性更高的檢測模式,對應用市場中的應用程序進行抓取下載,進行惡意性分析后分別存儲,以便下載用戶的選擇。該設計方案中包括搜索模塊、跟蹤模塊、信息抓取模塊、APK下載模塊、APK解析模塊、APK特征信息提取模塊、特征匹配模塊、VirusTotal檢測模塊和數據庫存儲模塊,其中數據庫存儲模塊包括市場元數據庫、APK元數據庫、惡意APK庫和非惡意APK庫。

通過分析各個應用市場中惡意應用程序的安全現狀,針對目前市場惡意檢測方案的缺陷,設計方案如圖1所示。

圖1 系統總體框架圖Fig.1 The overall framework of the system

各個模塊的功能如下:

1)搜索模塊

該模塊的作用是搜索新的APK文件,搜索各個應用市場中的APK,并與已下載的APK對比,如果已經下載過,則不予處理,否則,交給后面的模塊處理。

2)跟蹤模塊

該模塊的作用是更新已下載的APK,將已下載過的APK與應用市場上的對應的APK對比,如果已更新,則交給后面模塊繼續處理,否則不予處理。

3)信息抓取模塊

該模塊的作用是抓取符合條件的APK相關信息,并交給后續模塊處理。

4)下載模塊

該模塊的作用是下載前面符合條件的APK,并提供給后續模塊分析處理。

5)VirusTotal檢測模塊

該模塊的作用是檢測下載的APK文件的惡意性。通過調用病毒檢測工具VirusTotal,對APK進行分類存儲。

6)APK解析模塊

該模塊的作用是解析下載的APK文件,模塊介紹了怎樣解壓縮應用程序安裝包APK,然后遍歷判斷文件的類型,對不同的文件采用不同的方式進行解析,最終得到配置文件、簽名文件及Java源代碼交給后面模塊。

7)特征提取模塊

該模塊的作用是從解析模塊解析的配置文件和簽名文件中提取APK文件的特征屬性,提供給后續模塊。

8)特征匹配模塊

文中探討的模塊,作用是對Java源代碼指令序列用模糊哈希算法,生成指紋,并與惡意代碼特征庫匹配,通過檢測應用程序的源代碼和惡意代碼的相似度,判定應用程序的惡意性。

9)數據庫存儲模塊

此框架設計了4個數據庫,分別為市場元數據庫、APK元數據庫、惡意APK庫和非惡意APK庫。分別存儲APK市場信息、APK文件信息、惡意APK文件和非惡意APK文件。

文中研究的對象是特征匹配模塊,下面具體闡述這一模塊的設計過程。

2 匹配模塊功能

匹配模塊對Java源代碼指令序列用模糊哈希算法,生成指紋,并與惡意代碼特征庫匹配,通過檢測應用程序的源代碼和惡意代碼的相似度,判定應用程序的惡意性。

初始時,AndRadar需要一系列已知的應用軟件樣本,這些樣本可以是惡意的軟件或者其他良性軟件,并把這些樣本軟件稱為種子。由于AndRadar的動態性,實時在線的特點,使得AndRadar相對于靜態分析有持續不斷的分析軟件的行為特點。軟件種子可以來自于最新的被標記為惡意軟件的軟件庫,可以是殺毒軟件掃描的惡意軟件,也可以是良性的軟件[3-4]。這些軟件樣本將被用來和應用市場上的軟件進行匹配,按匹配度進行相關處理。

3 APK文件的匹配算法

種子應用程序和應用市場中的APK進行匹配時,有4種方式對兩個軟件進行相關度匹配,4種不同的標識符分別為包名、指紋鑒別法、方法簽名和哈希值[5-6]。并根據匹配組合分為4個匹配等級,如表1所示。

表1 基于4種標識符的不同的匹配度Tab.1 The different matching degree based on four identifier

對應用市場而言,如官方市場 Google Play、Appchina、Anzhi、Wandoujia或者Coolapk,均使用包名作為市場內部的參考,在查詢時也是非常直觀的,這是因為包名會作為搜索該應用程序的一部分出現在應用程序的URL中。其他應用市場使用不同的內部識別標識符,而是使用更加細致的搜索程序,因此,在搜索頁面按分隔符分離出包名,丟棄常見的部分如“.com”。一旦包名出現在搜索頁面,一次搜索將被視為結束,否則會繼續搜索各個應用市場并返回搜索結果。

最終,根據軟件發布者的習慣,應用程序可能在被發布到其他檢測的應用市場之前就已經出現在種子中了,因此,搜索模塊將定期訪問所有的應用市場搜索目標應用程序,不管這些應用程序是否已經在種子樣本程序中。

4 基于模糊哈希算法的指紋匹配模塊

惡意Android應用程序檢測是本文的重要內容,如何快速有效的檢測惡意軟件是研究的重點。傳統的惡意檢測一般采用字符串逐個對比的匹配法[7],這種方法效率低下,文中擬將APK的classes.dex文件的源碼生成指紋,再將指紋和已知的惡意源碼指紋進行比對。指紋生成即數據壓縮,利用算法函數把大容量文件壓縮成一個字符串,計算字符串的相似性。當前,通常采用哈希算法生成指紋,但是哈希算法對輸入很敏感,一旦檢測對象的惡意代碼有微小的改動,哈希算法就失效了,另外惡意應用程序的源碼是不斷變化的,這時用傳統的哈希算法生成指紋檢測同樣失效。文中采用模糊哈希算法來解決這些問題。

分析 classes.dex文件后,文件包含可執行的字節碼Dalvik,將其反編譯后就得到java源碼,惡意應用程序會在源碼中添加相應的命令序列,匹配模塊將待檢測應用程序的文件classes.dex同惡意代碼特征庫進行對比,以判斷程序的安全性。本模塊采用模糊哈希算法(fuzzy hashing),將待檢測應用程序源碼同惡意源碼進行指紋匹配,利用相似度判斷應用程序的惡意性。模塊流程圖如圖2所示。

圖2 匹配模塊流程圖Fig.2 Matching module flow chart

在文中采用模糊哈希生成指紋的算法中,先將文件分成許多的小片段,分別對這些片段映射成哈希值,然后整合這些哈希值,最終生成指紋信息。首先選取合適的觸發值:

式中:S為哈希串最大的長度;n為文本長度;bmin為最小觸發值。

再校驗觸發條件:

式中:rolling_value——滾動哈希值;binit為觸發值。

將用Alder-32算法計算出的滾動哈希值rolling_value與前面計算出的觸發值binit比較,直到滿足上面等式。同理根據等式,計算出觸發值2binit,確定了觸發值后,通過FNV算法計算出哈希值。并取哈希值的6個低有效位的一個base64碼。最終得到指紋的兩部分:一部分是基于觸發值binit的base64碼,一部分是基于觸發值2binit的base64碼。

在得到指紋信息后,通過比較相似度的方法判斷兩個APK是否相似,文中采用加權編輯距離判斷相似性。有以下計算公式:

式中:S1為指紋1;S2為指紋2;ed(S1,S2)為S1與S2之間的編輯距離;i為插入操作的次數;d為刪除操作次數;c為替換的次數;w為交換的次數;min(l1,l2)為l1和l2的最小值;l1為指紋S1的長度;l2為指紋S2的長度;M為匹配指數。

先判斷S1到S2需要的最少次數,對不同操作給出一個權值,將結果相加,得到加權編輯距離。在算匹配指數時,將加權編輯距離除以S1、S2的長度和,再映射到0到100之間的一個整數值之間。其中,S是指紋最大長度默認值是64,M是匹配指數。如果M值越接近100,則兩個文本的相似度越高。

5 結束語

文中主要對APK文件抓取系統中匹配模塊進行了詳細的設計,首先給出了APK文件抓取系統總體框架,之后詳細描述了匹配模塊功能,APK匹配算法,并采用模糊哈希算法實現對匹配模塊的設計,極大的提高了APK抓取系統的可靠性。

[1]Racic R,Ma D,Chen H.Exploiting mms vulnerabilities to stealthily exhaust mobile phone's battery[C]//Securecomm and Workshops,2006:1-10.

[2]劉澤衡.基于Android智能手機的安全檢測系統的研究與實現[D].哈爾濱:哈爾濱工業大學,2011.

[3]Inoue D,Eto M,Yoshioka K,et al.nicter:An incident analysis system toward binding network monitoring with malware analysis[C]//Information Security Threats Data Collection and Sharing,2008.WISTDCS'08.WOMBAT Workshop on.IEEE,2008:58-66.

[4]Inoue D,Yoshioka K,Eto M,et al.Malware behavior analysis in isolated miniature network for revealing malware's network activity[C]//Communications,2008.ICC'08.IEEE International Conference on.IEEE,2008:1715-1721.

[5]Bayer U,Habibi I,Balzarotti D,et al.A view on current malware behaviors[C]//USENIX workshop on large-scale exploits and emergent threats(LEET).2009.

[6]Bayer U,Moser A,Kruegel C,et al.Dynamic analysis of malicious code[J].Journal in Computer Virology,2006,2(1):67-77.

[7]Van Randwyk J,Chiang K,Lloyd L,et al.Farm:An automated malware analysis environment[C]//Security Technology,2008.ICCST 2008.42nd Annual IEEE International Carnahan Conference on.IEEE,2008:321-325.

Design of matching model based on APK file grabbing system

GAO Rui-hua
(Shaanxi Technological School,Xi’an 710054,China)

This paper proposed a new design method for the APK capture system.The First designed the overall framework of the system using Mysql5.5 to setup the system's database.Based on open source Python web crawler framework Scrapy as well as the characteristics of the market and application of APK,It accomplished the design of fingerprint matching module using Fuzzy Hashing algorithm.uring the design process,VirusTotal and feature matching method were also combined.It discussed function of the matching module and matching algorithm in detail,greatly improved the efficiency of malicious software detection.The new method meet the design requirement and provide a strong support for the future research.

APK capture;feature matching;compatibility;fuzzy hash algorithm

TP393.01

A

1674-6236(2016)03-0047-03

2015-04-07稿件編號:201504057

高瑞華(1980—),女,陜西米脂人,碩士,講師。研究方向:網絡與安全、信息控制。

猜你喜歡
數據庫檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
小波變換在PCB缺陷檢測中的應用
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 欧美一级在线看| 国产高清免费午夜在线视频| 精品综合久久久久久97超人| 亚洲Va中文字幕久久一区 | 国产国模一区二区三区四区| 日韩不卡免费视频| 亚洲日韩精品欧美中文字幕| 国产精品免费福利久久播放| 99在线视频精品| 中文字幕66页| 五月婷婷导航| aaa国产一级毛片| 午夜激情福利视频| 免费毛片全部不收费的| 成年免费在线观看| 国产成人1024精品| 国产精品黄色片| 91成人免费观看在线观看| 老司机久久99久久精品播放| 久久福利网| 秘书高跟黑色丝袜国产91在线| 日韩中文精品亚洲第三区| 久久中文字幕不卡一二区| 国外欧美一区另类中文字幕| 国产一区二区色淫影院| 亚洲欧美日韩高清综合678| 青青草久久伊人| 人妻免费无码不卡视频| 超薄丝袜足j国产在线视频| 九九热视频在线免费观看| 全部免费毛片免费播放| 91蜜芽尤物福利在线观看| 国产在线观看一区精品| 亚洲激情区| 性色一区| 欧美人在线一区二区三区| 精品无码专区亚洲| 亚洲国产精品国自产拍A| 国产精品自在线天天看片| 日韩欧美国产综合| 中文字幕欧美日韩高清| 精品天海翼一区二区| 草逼视频国产| 人人看人人鲁狠狠高清| 国产爽歪歪免费视频在线观看| 国产簧片免费在线播放| 欧美国产综合视频| 欧美国产精品不卡在线观看| 青草国产在线视频| 久久久久亚洲精品成人网 | 国产精品露脸视频| 中文字幕一区二区视频| 亚洲天堂视频在线观看免费| 亚洲色图狠狠干| 久久黄色毛片| 十八禁美女裸体网站| 亚洲成人在线免费| 99一级毛片| 精品国产自| 国产丝袜丝视频在线观看| 亚洲视频在线网| yjizz视频最新网站在线| 国产精品免费久久久久影院无码| 青青青国产在线播放| 国产人成在线观看| 伊人久久大香线蕉影院| 国产人人射| 欧美三级自拍| 亚洲综合天堂网| 久久久久亚洲AV成人人电影软件| 欧美A级V片在线观看| 午夜电影在线观看国产1区| 久久不卡精品| 亚洲高清国产拍精品26u| 色精品视频| 国产永久在线视频| 国产黄色视频综合| 亚洲国产精品无码久久一线| 欧洲成人在线观看| 国产精品所毛片视频| 成人中文在线| 人妻一区二区三区无码精品一区|