999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Symbian OS手機的垃圾信息研究

2009-04-29 00:00:00余昕芳
電腦知識與技術 2009年24期

摘要:該文主要研究了基于Symbian智能手機操作平臺的垃圾短信的研究,在設計上提出特有的分層過濾方法,結合手機通信錄號碼簿,公共號碼名單里的電話號碼以及對短信內容進行相關關鍵字匹配的過濾這三個“關口”進行過濾,同時提出了一種短信過濾領域較新穎的BM過濾算法的研究。該方法對于短文本的過濾精確率較高,對于資源有限的手機操作平臺運行不受影響,從而增加了算法的可行性。

關鍵詞:Symbian;垃圾信息;BM算法

中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2009)24-7038-03

The Research of SMS Spam Based on the Symbian OS

YU Xin-fang

(School of Electronic and Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China)

Abstract: This paper focus on the study of the SMS spam filter, which is based on the Symbian OS, In the aspect SMS filter, a new approach which is called Hierarchical filtering in combination with the Business card book of mobile phone、the List of public phone numbers and according to the keyword of the SMS content to match for filter.At the same time,I made a novel algorithm (BM Algorithm) in a relatively new field of SMS filter . The method of filtering for short text of a higher accuracy rate, it will not affect the mobile phone platform which resources was limited to run, thus increasing the feasibility of the algorithm.

Key words: symbian; SMS spam;BM algorithm

垃圾短信,就是用戶沒有定制過的包含有欺騙、色情等內容的均為垃圾短信。依據《電信條例》劃定出9個垃圾短信的標準:① 反對憲法所確定的基本原則的;② 危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統一的;③ 損害國家榮譽和利益的;④ 煽動民族仇恨、民族歧視,破壞民族團結的;⑤ 破壞國家宗教政策,宣揚邪教和封建迷信的;⑥ 散布謠言,擾亂社會秩序,破壞社會穩定的;⑦ 散布淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪的;⑧ 侮辱或者誹謗他人,侵害他人合法權益的;⑨含有法律、行政法規禁止的其他內容的。凡是所群發的短信含有上述內容的及用戶認定它騷擾你了或有不良信息的就是垃圾短信。

國內手機垃圾短信大致分四大類:

第一類:是“騷擾型”,多為一些無聊的惡作劇;第二類:是“欺詐型”,此類短信多是想騙取用戶的錢財,如中獎信息;第三類:非法廣告短信,如出售黑車、麻醉槍之類;第四類:SP(短信業務提供商)違規群發,誤導用戶訂制短信業務,發送號碼多為SP接入代碼,一般為四位數字,發送號碼不分網內網外。

根據去年的一項統計,我國手機用戶平均每周收到8.29條垃圾信息,6.25%的用戶每周收到多達40條以上垃圾信息,2008年的CCTV“2008年3.15晚會”針對現代社會的數字化生活中存在的這個最引人關注的新問題進行了審視和思考。

1 研究垃圾短信過濾的現狀

短信服務SMS(Short Messaging Service),是現在普及率最高的一種短消息業務,通過移動終端實現發送和接收有限長度的以文本、數字或二進制非文本數據為主的功能。目前,這種短消息的長度被限定在140字節之內。

SMS的發送過程如圖1所示,短消息是從外部信息實體(ESME)提交到短消息服務中心(SMSC),完成內部處理后短消息服務中心詢問歸屬位置寄存器(HLR),并從移動用戶中得到相關的路由信息,接下來短消息服務中心將短信息發送給移動交換中心(MSC),并從訪問位置寄存器(VLR)中找回用戶的信息記錄。其中,訪問位置寄存器向移動用戶發送一個交互請求并返回操作的結果,最后移動交換中心將短信息發送給移動用戶(MS)并將操作結果返回到SMSC。

以上可以看出,垃圾短信的過濾可以在兩個環節進行,第一是在短消息服務中心SMSC接收到短信之后,發送短信之前的暫存的時期對該短信進行過濾。對短信中心的信息進行過濾的基礎是移動運營商在短信服務器端進行處理,在網關處攔截來自運營商及互聯網的垃圾短信,在服務器端進行過濾效果好,但同時成本高,會加重服務器的額外負擔。第二是在短信被接收方接收之后,由接收方手機進行過濾。基于客戶端的短信過濾可以大致分為三種:基于來電號碼的匹配過濾、基于關鍵詞的匹配過濾、基于短信內容的垃圾短信過濾。

2 基于分層過濾的垃圾短信過濾方法

垃圾短信過濾的實質屬于文本分類,由于單獨的對基于來電號碼、關鍵詞、短信內容的垃圾短信進行過濾,在處理上過于簡單,很大程度上會將許多正常的短信錯判成垃圾短信。本文結合了基于來電號碼的匹配過濾及基于關鍵詞的匹配過濾的優點,信息在被接收前除了要通過對手機通信錄號碼簿,公共號碼名單里的電話號碼這兩個“關口”進行過濾,還要對短信內容進行相關關鍵字匹配的過濾檢索,從而做到分層過濾,經過中國通信企業協會測試比較,這種技術漏報和誤報率最小。

本文用于開發測試的手機短信過濾系統是市場占有率達到70%的symbian智能手機操作系統,運用Nokia公司提供的S60_3rd Edition FP1 SDK包。由于手機的處理能力和各種資源有限,因此在架構設計上需要考慮諸如運行效率,可擴展性,穩定性等因素。垃圾短信過濾系統總體結構模型如圖2所示。

垃圾短信過濾系統由短信監控模塊、短信提取模塊、手機通訊錄檢索模塊、公共號碼名單檢索模塊以及內容分析模塊這五個模塊構成。

1) 短信監控模塊:該模塊負責對手機接收端口進行實時監控,對發送到接收方手機的短信進行實時捕獲,當短信接收端口收到短信時,將短信交給短信提取模塊。短信監控模塊監控的范圍包括移動網內及網間點對點的短信息、移動夢網SP短信、行業應用短信等。

2) 短信提取模塊:該模塊負責將短信解碼,從短信的消息中提取發送方的號碼和短信內容,并將其送給手機通訊錄模塊、公共號碼本模塊和內容分析模塊進行檢索。

SMS是由Etsi所制定的一個規范(GSM 03.40和 GSM 03.38),一共有Block Mode,Text Mode和PDU Mode三種方式來發送和接收SMS信息,其中PDU Mode被所有手機支持默認的編碼方式,可以使用任何字符集。PDU相當于一個數據包,數據和代碼都經過編碼所以無法直接讀懂;但PDU模式同時支持中英文兩種短信。PDU模式收發短信包括3種編碼:7位、8位和UCS2編碼。7位編碼用于發送普通的ASCII字符,8位編碼用于發送數據信息,UCS2編碼用于發送Unicode字符它由構成消息(SMS)的信息組成,每條消息可以發送140個字節。英文解碼就是將7位字符編碼轉換為8位字符編碼,中文解碼將代碼頁為CP936的Unicode編碼轉換為GB2312的中文編碼即可作為一種數據單元,它必須包含SMS服務中心號碼、目標號碼、回復號碼、服務時間、數據格式、協議類型和正文。以下是C++Builder的中文解碼的實現代碼:StringDecoedeChinse(String InputStr)

{

wchar_t Buf[300];

for(int i=0;i

{

Buf[i/4]=StrToInt(\"0x\"+InputStr.SubString(i+1,4));

}

Buf[InputStr.Length()/4]=0;

return WideCharToString(Buf);

}

3) 手機通訊錄檢索模塊:由于用戶收到的信息的號碼大部分來自于手機通訊錄中,所以先對手機通訊錄進行檢索。首先將手機通訊錄中所有號碼導入手機通訊錄檢索模塊,在短信提取短信號碼后將收到的信息號碼導入手機通訊錄檢索模塊,該模塊根據手機SIM卡的號碼和收到的短信號碼進行匹配,如果收到信息的的號碼存在于手機通訊錄中,則把信息放進短信收件箱;如果發現通訊錄中不存在該號碼,就送入公共號碼本檢索模塊。在優化處理手機號碼過濾方面,可以通過號碼段將手機通訊錄里的號碼分類,如中國大陸移動分為134,135,136,137,138,139,157,158,159號碼段、中國聯通的130,131,132,133,153,156號碼段和中國網通3G手機188,189號碼段等。

由于提前將手機通訊錄中的號碼按號碼段的不同分成不同的號碼類,可將需要過濾的號碼前三位數字同手機通訊錄中各個的號碼段的前三位數字進行比較,分兩種情況:

如果有待過濾的號碼不存在于各個號碼段之內,則此號碼可不用進行接下來的匹配直接送入下一步過濾。

如果有待過濾的號碼存在于各個號碼段之內,則從有待過濾號碼的第四位數字開始同所屬號碼段中的號碼第四位開始對應匹配是否正確,若正確,則繼續遞歸,否則將進入下一步過濾。

4) 公共服務號碼檢索模塊:公共服務號碼諸如通信機構服務電話號碼(比較常見的如移動客戶服務10086、移動彩鈴服務12530、聯通客戶服務10010等)、銀行客戶服務電話號碼(工商銀行95588、中國銀行95566、建設銀行95533、招商銀行95555、交通銀行95559等)、保險公司服務電話號碼(太平洋保險95500、中國人壽保險95519、中國平安保險95511等)等,該模塊根據預先設定好的號碼和短信號碼進行匹配來決定是否通過,過濾方法同手機通訊錄中的過濾方法基本一致,所不同的是公共號碼匹配從第一位數字開始比較,如果發現公共服務號碼名單中不存在此號碼,就將短信內容送入內容分析模塊。

5) 內容分析模塊:該模塊式整個系統的核心,用來對來自于未知號碼的短信進行文本檢測。根據手機用戶預先設定的關鍵字運用精確模式匹配算法BM對短信內容進行匹配。如果短信內容包含了關鍵字庫中的內容,則直接將接收到的信息轉移到垃圾箱中,否則允許通過。

3 內容分析模塊實現的關鍵技術

我們通過對短信文本的預處理,再結合運用BM算法的關鍵字匹配將模糊匹配轉換成精確匹配。

3.1 短信文本預處理

1) 通配符的處理:由于我們關心的是中文短信,所以當我們接收到一條短信的時候,可以對夾雜在短信中的一些諸如*、.、%、@、……等無意義的符號去掉。如“本公司可以長期辦@假證”,處理后變為“本公司可長期辦假證”。從而,將對關鍵字進行的匹配轉換為精確匹配。

2) 拆分字的處理 :通過一個拆分字字典將關鍵字擴充,并將擴充后的關鍵字也加入到關鍵字庫中。比如關鍵字庫為“法輪功 辦證 彈藥 走私 ”,經過這一步,得到的新的關鍵詞表為“法車侖工力 辦證 弓單藥 走私 ”,如果短信中出現“法輪功”,因為這個關鍵字已經出現在關鍵字庫中,所以可以進行精確匹配。

3) 組合關鍵字的處理:運用關鍵字進行匹配時,許多關鍵字之間是“與”的關系。很多時候在一個短信中往往需要結合幾個關鍵字才能判斷該短信是否有害,因此,在配置關鍵詞時,常常要將多個關鍵詞進行“與”操作。

4) 諧音字與拼音的處理

3.2 內容分析

目前經典的精確模式匹配算法有Aho-Corasick算法、BM算法、AC-BM算法和Wu-Mander算法等。BM算法是一種精確符串匹配算法,它采用從右向左比較的方法,若某趟比較不匹配時,BM算法就采用“壞字符規則”和“好后綴規則”兩種啟發式規則來計算字符串向右移動的距離,直至整個匹配過程的結束。

1) 壞字符規則(Bad Character):

設短信文本字符串為T,待匹配的字符串為P,在BM算法從右向左掃描的過程中,若發現T中某個字符x與P對應位置的字符不匹配,則按如下兩種情況討論:

如果字符x在P中沒有出現,那么從字符x開始的m個文本與P匹配失敗,直接跳出該區域。

如果字符x在P中出現,則以該字符進行對齊。

設skip(x)為P右移的距離,m為字符串P的長度,max(x)為字符x在P中的最右位置。

2) 好后綴規則(Good Suffix)

若發現某個字符不匹配的同時,已經有部分字符匹配成功,則按如下兩種情況討論:

①如果在P中位置t處已匹配部分P'在P中的某位置t'也出現,且位置t'的前一個字符與位置t的前一個字符不相同,則將P右移至t',對應t方才所在的位置。

②如果在P中任何位置已匹配部分P'都沒有再出現,則找到與P'的后綴P''相同的P的最長前綴x,向右移動P,使對應方才P''后綴所在的位置。

用數學公式表示,設Shift(j)為P右移的距離,m為模式串P的長度,j為當前所匹配的字符位置,s為t'與t的距離(以上情況①)或者x與P''的距離(以上情況②)

在BM算法匹配的過程中,取SKip(x)與Shift(j)中的較大者作為跳躍的距離。BM算法預處理時間復雜度為O(m+s),空間復雜度為O(s),s是與P,T相關的有限字符集長度,搜索階段時間復雜度為O(m·n)。最好情況下的時間復雜度為O(n/m),最壞情況下時間復雜度為O(m·n)。

4 結束語

本文介紹了基于Symbian操作平臺下智能手機的短信過濾系統的設計原理,并重點介紹了各模塊的操作原理及過濾算法的實現。論文所論述的短信過濾系統對于現代通信網絡的安全的研究具有重大的現實和實用意義。

參考文獻:

[1] 網秦公司.網秦手機殺毒系統技術白皮書[EB/OL].http://www.netqin.com/.

[2] 何偉,楊宗德,張兵.Symbian os 的手機開發與應用[M].北京:人民郵電出版社,2006.

[3] Jiang P.Symbain內存管理的22條軍規[J].Symbian中文技術周刊,2004.

[4] Stichbury J,Symbian OS C++高效編程[M].北京:人民郵電出版社,2006.

[5] 馬建.智能手機操作系統編程:Symbian及60系列[M].北京:科學出版社,2005.

[6] Morris B.The Symbian OS Architecture Sourcebook[M].Published by Symbian,2007.

[7] 哈里森.Symbian OS C++手機應用開發[M].周良忠,譯.北京:人民郵電出版社,2004.

[8] symbian developer Network[EB/OL].http://developer.symbian.com/main/index.jsp

[9] forum.nokia.com[EB/OL].http://www.forum.nokia.com/.

[10] 網秦手機安全專家[EB/OL].http://av.netqin.com/VirusList.jsp.

主站蜘蛛池模板: 毛片大全免费观看| 国产极品嫩模在线观看91| 一区二区自拍| 一本久道久久综合多人| 极品av一区二区| 久久中文字幕av不卡一区二区| 丝袜久久剧情精品国产| 午夜不卡视频| 美女一级毛片无遮挡内谢| 亚洲第一页在线观看| 免费全部高H视频无码无遮掩| 国产簧片免费在线播放| 亚洲狼网站狼狼鲁亚洲下载| 最新精品国偷自产在线| 亚洲欧美一级一级a| 国产精品hd在线播放| 亚洲色图综合在线| 国产成人啪视频一区二区三区| 亚洲av中文无码乱人伦在线r| 国产高清不卡视频| 日本在线视频免费| 欧美日本不卡| 欧美日韩福利| 在线观看免费人成视频色快速| 一本综合久久| 青青青视频免费一区二区| 欧美日韩一区二区在线播放| 色视频久久| AV不卡在线永久免费观看| 国产精品漂亮美女在线观看| 欧美啪啪一区| 免费jizz在线播放| 三上悠亚在线精品二区| 亚洲人成网站在线观看播放不卡| 91精品在线视频观看| a毛片免费看| 欧美综合区自拍亚洲综合绿色| 婷婷六月激情综合一区| 婷婷综合色| 精品国产免费第一区二区三区日韩 | 日韩中文精品亚洲第三区| 国内嫩模私拍精品视频| 亚洲 欧美 日韩综合一区| 国产无码网站在线观看| 在线免费看黄的网站| 欧美国产视频| 色综合久久综合网| 亚洲大尺码专区影院| 日韩高清在线观看不卡一区二区| 有专无码视频| 亚洲a级在线观看| 国产激情影院| 国产极品美女在线观看| 一区二区三区高清视频国产女人| 日本AⅤ精品一区二区三区日| 欧洲欧美人成免费全部视频| 一级一毛片a级毛片| 精品视频在线观看你懂的一区| 爱爱影院18禁免费| 国产午夜福利片在线观看| 精品自窥自偷在线看| 全部无卡免费的毛片在线看| 国产午夜无码专区喷水| 91日本在线观看亚洲精品| 国产精品美女免费视频大全| AV老司机AV天堂| 久久精品国产电影| 九九热精品视频在线| 亚洲天堂视频网站| 日韩毛片免费观看| 22sihu国产精品视频影视资讯| 免费视频在线2021入口| 青草精品视频| 国产污视频在线观看| 69精品在线观看| 欧美中文字幕一区| 国产黄在线免费观看| 中日无码在线观看| 在线精品欧美日韩| 亚洲国产中文在线二区三区免| 无遮挡国产高潮视频免费观看| 日本欧美午夜|