999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

貝葉斯算法在反垃圾郵件技術中的應用

2010-07-02 00:03:24盧海燕
電大理工 2010年2期

盧海燕

本溪廣播電視大學 ( 本溪 117000 )

0 引言

長期以來,人們不斷探索著垃圾郵件的解決之道,從早期的關鍵字匹配,到通過連接頻率來提高發送垃圾郵件的成本,再到設立專用服務器,提供RBL實時黑名單查詢,直到全世界范圍內關于垃圾郵件立法的呼吁。無論哪種方式方法,要想從根本上解除垃圾郵件的泛濫,還是需要一套能夠有效防范垃圾郵件的安全技術。

1 垃圾郵件無法避免的技術原因

當前郵件傳輸的主要協議是 SMTP協議,從設計之初,為了滿足簡單傳輸的需要,該協議沒有任何認證手段,因此缺省的 SMTP郵件服務器對于郵件的來源和目的地不做控制而是支持發送。

通常的郵件傳輸過程是郵件的發送者使用SMTP協議將郵件發送給SMTP服務器,由它根據郵件的目的地址,使用 SMTP協議將郵件發送至目標 SMTP服務器,該服務器受到郵件后放入接收人的郵箱,最后由郵件的接收者使用POP3或IMAP協議從郵箱服務器上接收自己的郵件。在郵件傳輸的過程中,發送者與發送服務器、發送服務器和接收服務器之間都未做認證,因此發送方可以使用互聯網上任意一臺 SMTP服務器來發送他的郵件,這就是所謂的 Open Relay。

隨著垃圾郵件的泛濫,大部分的郵件服務器都關閉了Open Relay,在發送放和發送服務器之間進行認證,從而保證只有合法用戶才能使用這臺服務器發送郵件,這就是增強的ESMTP協議。然而這個方法無法解決在發送服務器和接收服務器之間的合法認證,垃圾郵件仍然無法避免。

2 貝葉斯過濾技術介紹

2.1 貝葉斯公式

貝葉斯公式是英國數學家 T.貝葉斯在 200多年前提出的計算條件概率的公式,也稱逆概率公式。如果事件組 A1,A2,…Ak為一完備事件組,則對任一事件B(其P(B)≠0)有:

其中????=,2,1i

貝葉斯公式實際上是綜合利用先驗概率和樣本信息從而計算后驗概率的一種方法。

2.2 貝葉斯算法在反垃圾郵件技術中的應用

首先,我們可以將電子郵件分為正常郵件和垃圾郵件兩類,貝葉斯過濾器針對這兩類郵件進行自學習。分析每封電子郵件中的每一個單詞,確定正常郵件和垃圾郵件中詞匯發生頻率的差異。

貝葉斯算法分析郵件的工作過程如下:

(1)過濾器收集大量的垃圾郵件和正常郵件,建立垃圾郵件集和正常郵件集。

(2)過濾器提取郵件主題和郵件體中的獨立字串。

(3)每一個郵件集對應一個哈希表,hashtable_good對應正常郵件集而hashtable_bad對應垃圾郵件集。表中存儲TOKEN串到字頻的映射關系。

(4)計算每個哈希表中TOKEN串出現的概率P=(某TOKEN串的字頻)/(對應哈希表的長度)

(5)綜合考慮hashtable_good和hashtable_bad,推斷出當新來的郵件中出現某個 TOKEN串時,該新郵件為垃圾郵件的概率。數學表達式為:

A事件----郵件為垃圾郵件;

t1,t2 …….tn代表TOKEN串

則 P(A|ti)表示在郵件中出現 TOKEN串ti時,該郵件為垃圾郵件的概率。

P1(ti)=(ti在hashtable_good中的值)

P2(ti)=( ti在hashtable_ bad中的值)

則 P(A|ti)= P1(ti)/[(P1(ti)+ P2(ti)];

(6)建立新的哈希表 hashtable_probability存儲TOKEN串ti到P(A|ti)的映射

(7)至此,垃圾郵件集和正常郵件集的學習過程結束。根據建立的哈希表 hashtable_proba bility可以估計一封新到的郵件為垃圾郵件的可能性。

當新到一封郵件時,按照步驟(2)生成TOKEN串。查詢 hashtable_probability得到該TOKEN 串的鍵值。

假設由該郵件共得到 N個 TOKEN串,t1,t2….tn, hashtable_probability中對應的值為P1,P2,…PN, P(A|t1 ,t2, t3…tn)表示在郵件中同時出現多個TOKEN串t1,t2…….tn時,該郵件為垃圾郵件的概率。由復合概率公式可得:P(A|t1 ,t2, t3…tn)=(P1*P2*…PN)/[P1*P2*…PN+(1-P1)*(1-P2)*…(1-PN)]當 P(A|t1 ,t2, t3…tn)超過預定閾值時,就可以判斷郵件為垃圾郵件。

2.3 貝葉斯算法的優劣

因為貝葉斯算法是基于先驗概率和樣本信息來計算后驗概率的方法,所以其對于樣本積累的數量具有很大的依賴性,需要一個較長的過程,開始的時候,可能會發生很多的誤判和漏判現象,只有當積累的樣本數量足夠多,其檢測精度才能到達一定高度并為用戶所接受。

3 總結和展望

在反垃圾郵件技術中,貝葉斯過濾技術只是啟發式檢測流程中的一項技術,這種技術可以確定電子郵件的總體垃圾概率。目前,對于貝葉斯技術的應用正在成為反垃圾郵件領域的一個研究熱點,越來越多的專用反垃圾郵件產品正在嘗試使用貝葉斯過濾技術來提高其產品的檢測精度,降低管理成本。

[1]倪加勛,袁衛.應用統計學,北京:中國人民大學出版社,1993.

[2]郭泓.電子郵件過濾技術淺析.信息網絡安全.2002.

[3]王斌,潘文峰.基于內容的垃圾郵件過濾技術綜述.中國科學院計算技術研究所碩士畢業論文.2004.

主站蜘蛛池模板: 国产成人精品优优av| 91麻豆国产精品91久久久| 97狠狠操| 成年人视频一区二区| 国产精品亚洲五月天高清| 99久久精品免费看国产电影| 精品国产美女福到在线直播| 五月激激激综合网色播免费| 72种姿势欧美久久久大黄蕉| 欧美日韩国产在线人成app| 精品成人一区二区三区电影| 四虎永久在线视频| 国产精品自在拍首页视频8| 国产精品成人不卡在线观看| 国产成人精品午夜视频'| 无码精油按摩潮喷在线播放| 女人爽到高潮免费视频大全| 综合成人国产| 中文字幕欧美成人免费| 国产免费人成视频网| 亚洲丝袜中文字幕| 2021天堂在线亚洲精品专区| 免费人成网站在线高清| 日本道综合一本久久久88| 国产精品女主播| 国产97区一区二区三区无码| 精品综合久久久久久97| 色九九视频| 亚洲专区一区二区在线观看| 伊在人亞洲香蕉精品區| 91色爱欧美精品www| 久久网欧美| 欧美激情第一欧美在线| 亚洲a级毛片| 性视频久久| 毛片在线播放a| 一级毛片在线直接观看| 中文字幕av无码不卡免费| 亚洲成人精品| 国产日本欧美在线观看| 国产黄网永久免费| 亚洲天堂网站在线| 在线观看欧美精品二区| 国产福利小视频高清在线观看| 久久国产精品国产自线拍| 中文字幕1区2区| 伦伦影院精品一区| 免费一级无码在线网站| 激情亚洲天堂| 日韩国产黄色网站| 亚欧美国产综合| 国产成人综合久久精品下载| 国产精品久久久久鬼色| 日韩欧美中文字幕一本| 久久久久久午夜精品| 91福利在线观看视频| 亚洲大尺码专区影院| 国产精品福利在线观看无码卡| 色老二精品视频在线观看| 国产免费福利网站| 2021国产精品自产拍在线观看| 色香蕉影院| 任我操在线视频| 亚洲综合第一区| 乱色熟女综合一区二区| 亚洲福利一区二区三区| 亚洲嫩模喷白浆| 精品无码专区亚洲| 亚洲综合在线最大成人| 欧美日韩综合网| 亚洲成aⅴ人片在线影院八| 色哟哟精品无码网站在线播放视频| 亚洲欧洲日韩久久狠狠爱 | 色婷婷天天综合在线| 成人午夜免费观看| www.youjizz.com久久| 国产精品第页| 永久成人无码激情视频免费| 亚洲精品高清视频| jizz在线观看| 亚洲香蕉在线| 久久青青草原亚洲av无码|