999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

圖像型垃圾郵件過濾技術研究進展

2013-01-01 00:00:00李鵬崔剛
智能計算機與應用 2013年3期

摘 要: 近年來,圖像型垃圾郵件數量的迅速增長使得傳統垃圾郵件過濾系統面臨重大挑戰,并逐漸成為信息安全領域的研究熱點。為了能夠快速、有效地濾除圖像型垃圾郵件,學者們提出了大量的過濾檢測方法。首先簡要介紹了圖像型垃圾郵件給我國帶來的影響;然后結合垃圾郵件圖像的特征,對圖像型垃圾郵件過濾的主要技術:基于近似特征的過濾、基于圖像文本特征的過濾、基于圖像淺層特征的過濾等進行了分析;接下來對圖像型垃圾郵件數據獲取方法進行了介紹;最后對過濾技術的研究方向以及面臨的挑戰進行了討論和展望。

關鍵詞: 圖像型垃圾郵件; 垃圾郵件圖像; 特征抽取; 郵件過濾; 近似復制檢測

中圖分類號: TP3174 文獻標識碼: A 文章編號:2095-2163(2013)03-0028-06

A Survey on Key Technologies of Image Spam Filtering

LI Peng, CUI Gang

(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)

Abstract: Recently, the rapid growth of image spam makes traditional spam filters facing more and more challenges, and it also becomes a hot research field of information security. In order to be able to filter image spam effectively and efficiently, scholars have proposed a lot of detection methods. Firstly, this paper introduces the effect of image spam brought to our country. Then, according to the characteristics of spam images, the paper analyzes the main filtering techniques: filtering methods based on near-duplicate detection, filtering methods based on image text features, and filtering methods based on image low-level features, etc. Next, the method of image spam dataset acquisition is introduced. And finally, the research direction and challenges of filtering method are discussed.

Key words: Image Spam; Spam Image; Feature Extraction; Spam Filtering; Near Duplicate Detection

0 引 言

如今,人們的交流已經進入電子時代。電子郵件因為具有高效、方便、快捷、且成本低廉的特點,而成為現代社會中不可或缺的通信工具。但是,正因為電子郵件具有的上述優點,使其在方便人們通信的同時,也逐漸成為懷有一定目的的各色人等用作廣告發送、淫穢色情內容傳播、惡意詐騙、反動思想及言論宣傳的實施途徑。這些不請自來,強行進入用戶郵箱的郵件即稱為垃圾郵件。

早期的垃圾郵件大多為文本型垃圾郵件。對于文本型垃圾郵件的過濾問題,學術界已經提出了很多解決方案,比如發信人認證、黑白名單、行為分析、內容分析、關鍵字過濾等[1,2]。2006年后,為逃避垃圾郵件文本過濾器的檢測,垃圾郵件制造者開始大量地將原來以文本形式傳播的垃圾郵件內容嵌入到圖像中,并將這些圖像作為垃圾郵件附件進行傳播,使得傳統的垃圾郵件過濾方法不再有效[3]。據二六三公司提供的數據顯示,2006年圖像型垃圾郵件每天數量可達150多億封,占到垃圾郵件總量的25%~45%,2007年這一比例更高達52%[4]。賽門鐵克公司2009年發布的垃圾郵件報告顯示,全球垃圾郵件已占郵件總量的90%以上,其中圖像型垃圾郵件雖不像2007年時占整個垃圾郵件大半江山,但仍占據約20%的比例[5]。2009年,中國圖像型垃圾郵件已升至垃圾郵件總量的約50%[6],形式更加嚴重。

中國是垃圾郵件的受侵大國之一。為分析垃圾郵件特征,有效遏制垃圾郵件的濫發態勢,中國互聯網協會于2006年建設了反垃圾郵件綜合處理平臺,并依托國家計算機網絡應急技術處理協調中心及二六三網絡通信股份有限公司的技術力量聯合建設了垃圾郵件分析系統,作為支撐中國反垃圾郵件工作的技術平臺。這些系統的建設對有效控制中國垃圾郵件的發送總量起到了積極作用:2005年中國垃圾郵件發送總量占全球垃圾郵件發送總量的23.4%,居第2位;而2009年這一比例已降至4%,居第7位;2012年,進一步降至3.1%,位居第10位。然而,現有技術平臺對圖像型垃圾郵件的分析功能還十分欠缺。尤其值得關注的是,圖像型垃圾郵件近來被境外敵對分子和反動勢力大肆用于反動宣傳和滲透。2009年,在中國新疆自治區發生的7.5事件中,圖像型郵件、Web網頁和手機短信共同扮演了動亂勢力串聯的技術推手角色。可以想象,如果在過濾技術上不能跟進強而有力的技術手段,圖像型垃圾郵件必將成為敵對分子和反動勢力進行串聯、散布謠言和恐嚇信息的重要手段,在某些重要時刻,有可能對國家安全造成嚴重威脅。

圖1為利用反垃圾郵件綜合處理平臺捕獲的部分垃圾郵件圖像樣本。具體來說,圖1為受不同類型噪聲干擾的圖像樣本,在這些垃圾郵件圖像中使用了波動干擾、旋轉干擾、背景圖像干擾等多種干擾手段,給現有過濾系統制造了一定的困擾和防范阻礙。

圖1 圖像型垃圾郵件中幾種典型的圖像干擾方法

Fig.1 Typical interruption methods used in spam images

圖像型垃圾郵件的平均大小約是文本型垃圾郵件的10倍以上,對其進行傳播和存儲多會消耗更多的網絡帶寬、計算及存儲資源。有效過濾圖像型垃圾郵件,對于節約社會資源,維護網絡安全,減少對郵件用戶的侵害干擾則至關重要。對其開展深入、系統的研究亦將具有不可言喻的重要理論及現實意義。第3期 李鵬,等:圖像型垃圾郵件過濾技術研究進展 智能計算機與應用 第3卷

1 圖像型垃圾郵件過濾總體概述

1.1 常用概念

首先介紹幾個常用概念。

圖像型垃圾郵件:是指通過圖像的方式傳播垃圾內容的垃圾郵件,圖像既可以包含在郵件附件中,也可以托管于其它網站。

垃圾郵件圖像:是指圖像型垃圾郵件中含有垃圾信息的圖像,如具有特定企圖的政治、宗教圖像,具有商業目的的廣告宣傳圖像、色情圖像等。

CAPTCHA(Completely Automated Public Turing Test to Tell Computers and Humans Apart, 全自動區分計算機和人的圖靈測試)[7]:由美國卡內基梅隆大學開發,這種程序可以生成并評價人類可很容易通過但計算機無法通過的測試。常被用于為垃圾郵件圖像添加人為干擾,以降低OCR、分類器等的辨識能力。

1.2 垃圾郵件圖像特征

垃圾郵件圖像表現了許多有別于正常圖像的特征。谷歌公司的Mehta等[8]對垃圾郵件圖像的典型特征進行了詳細分析。本文亦對其做以如下歸納總結:

(1)近似復制與批量發送特征。垃圾郵件發送者通常利用相同的模板或者稱為近似復制的方法生成垃圾郵件圖像,再進行批量發送。

(2)文本特征。為躲避傳統垃圾郵件過濾器的檢測,大量文字信息將轉移至郵件圖像中進行發送。

(3)干擾與噪聲特征。為了降低OCR文本信息提取的準確性,垃圾郵件發送者通常借助CAPATCHA等技術在圖像中加入大量人為干擾因素,以降低特征檢測的有效性。美國普林斯頓大學的Wang等[9]總結了垃圾郵件圖像中經常出現的波浪形文字、變形、旋轉等21種干擾手段。

(4)人工生成圖像。同自然圖像相比,垃圾郵件圖像多由計算機生成,并非自然場景圖像,而且顏色通常較單調,紋理特征較簡單,同時多包含有人工修改痕跡。

(5)其它特征。考慮時間以及帶寬等因素,垃圾郵件發送者多采用圖像壓縮比較高的圖像格式,如.jpg、.gif和.png等,并且圖像的尺寸通常也不會過大。

1.3 國內外研究現狀

根據垃圾郵件圖像的特征,學者們提出了大量的過濾方法。目前,圖像型垃圾郵件的過濾技術主要基于近似特征、圖像中的文本特征、圖像淺層特征等,并結合機器學習等相關方法進行判斷。下面,對各種方法分專節展開詳細的分析與論述。

1.3.1 基于近似特征的過濾方法

相同來源的垃圾郵件圖像通常利用相同的模板生成,只是附加不同的隨機干擾。對此,可以利用批量發送的垃圾郵件圖像間的相似特征進行過濾。美國普林斯頓大學的Wang等[9]提出利用過濾器組進行近似特征圖像檢測,其中每個過濾器采用不同的特征,并分別進行分類器訓練。北京郵電大學的He等[10,11]提出將圖像的基本特征與閾值進行比較,并將圖像分為垃圾郵件圖像與可疑垃圾圖像,對于可疑圖像則進一步利用灰度和顏色直方圖與樣本圖像進行相似性判斷。

批量發送的圖像型垃圾郵件具有在一定時間內于網絡中大量、高密散發、且內容高度相似的特征。因此,可以在郵件服務器端對接收的郵件圖像進行聚類分析,從而獲取更多的有益信息。美國西北大學的Gao等[12-13]提出將圖像型垃圾郵件的過濾分為服務器端和客戶端兩部分,并在郵件服務器端進行圖像聚類,正常圖像通常對應較小的圖像聚類,而垃圾圖像則對應較大規模的圖像聚類。因此,可以對規模較大的聚類中的圖像的來源展開進一步分析。這種方法可以提前放過部分正常圖像,從而提高過濾效率。美國阿拉巴馬大學伯明翰分校的Zhang等[14]和Chen等[15]提出利用聚類識別來自相同源的垃圾郵件圖像的方法。相同聚類中的圖像來自相同源地址的可能性較高,這樣有利于對這些地址進行進一步的跟蹤分析。此外,谷歌公司的Mehta等[8]提出利用高斯混合模型對圖像進行描述,并利用Jensen-Shannon差異性判斷進行相似性度量的方法完成圖像聚類。

利用郵件批量發送的特征,可以通過聚類對來自相同源的批量圖像型垃圾郵件進行監測,有利于實時發現可疑的發送者,聚類結果可以作為后續判斷的基礎依據。這種方式對于降低計算開銷,提高系統吞吐量具有較好作用,但卻很難避免對于正常圖像的誤判。

1.3.2 基于圖像文本的過濾方法

(1)基于圖像文本內容的過濾方法

圖像型垃圾郵件的一個重要特征是垃圾郵件發送者常常會將本該通過文本方式發送的內容嵌入圖像中進行發送。因此可以檢測圖像文本中是否包含特定的關鍵字,如:“Viagra”,“發票”,“貸款”等。意大利卡利亞里大學的Fumera等[16]、美國南加州大學洛杉磯分校的Youn等[17]都提出了利用OCR工具識別郵件圖像中的文字,再將文字內容送入文本過濾器中判斷這幅圖像是否屬于垃圾圖像。但Fumera等[18]隨后指出,這種方法的最重要缺陷是:文字識別部分所需計算量大,在時間上難以滿足垃圾郵件過濾海量數據的實時處理要求;并且OCR僅對干凈的圖像具有較好的效果,為防止嵌入圖像中的文本信息被提取出來,垃圾郵件制造者多會使用一些干擾技術為圖像添加人為干擾,降低了OCR的識別準確率。

為了應對文本過濾器,垃圾郵件制造者還常采用錯拼、誤拼等方法混淆一些關鍵字,如:mortgage拼寫為“mort gage”, “mo>rtglage”等。同時,對于添加噪聲干擾的圖像, OCR提取的文本信息還可能存在大量的錯拼、誤拼等現象。另外,OCR通常很難辨別‘u’和‘v’, ‘i’和‘I’, ‘l(el)’和‘1(one)’等字符。因此,為了進一步提高OCR應用的準確性,一些學者提出了改進方法。澳大利亞堪培拉大學的Ma等[19]提出為樣本庫中的每個關鍵字建立馬爾科夫模型,由此對于OCR提取的未知字符序列,就可借助假設檢驗閾值依次判斷該字符序列是否為某關鍵字的誤拼。美國斯坦福大學的Lee等[20]利用字典樹隱馬爾科夫模型(LT-HMM)對郵件文本內容中的誤拼、錯拼等情況進行了詳細分析,利用英文字典中常用的45 475個單詞,以及ASCII碼表中除控制符外的字符構建了一個更加魯棒的隱馬爾科夫模型,并通過統計常用的單詞字符組合以及誤拼、錯拼情況構建了隱狀態轉換表和發射狀態轉換表。該方法可以對誤拼、錯拼、字符片段進行良好勘誤,且具有較高的魯棒性。但是LT-HMM具有大量的狀態,內存開銷較大。針對該問題,韓國浦項工科大學的Lee等[21]通過將具有相同發射概率的狀態組合為超級狀態,提出了一種利用動態加權隱馬爾科夫模型降低HMM復雜度的方法,該方法則有效降低了HMM的狀態數。上述這些手段均有利于提高利用圖像文本內容實行過濾的各類方法的準確性。

(2)基于文本區域特征的過濾方法

基于文本內容識別的過濾方法除了受OCR識別準確性影響外,計算開銷大也限制了其應用范圍的擴展。因此,一些學者提出利用圖像中的文字區域特征進行過濾的方法,從而避免進行文本內容識別。如美國SRI研究所的Aradhye等[22]提出定位圖像中的文本區域,再將文字區域在整幅圖像中所占的面積比值、顏色飽和度、顏色散度等特征送入支持向量機訓練后用于判斷垃圾郵件圖像。美國加州大學的Wu等 [23]提出利用圖像中內嵌的文字區域特征,標題或者計算機自動生成圖像的特征,圖像的位置信息特征則構成郵件的特征向量,再同樣借助支持向量機進行分類判斷。

與基于文本內容的過濾方法相比,該類判斷方法的效率有較大提高。但由于文本信息也可能在正常圖像中出現,因此這類方法容易誤斷一些含公文掃描圖像以及包含文本信息的宣傳圖像的正常公務郵件。而實際環境中,對于正常郵件的誤判可能會帶來極嚴重的影響,因此這類方法的實際應用效果仍有待進一步研究。

1.3.3 基于圖像淺層特征的過濾方法

為了提高圖像型垃圾郵件的判斷效率,很多研究者提出利用圖像淺層視覺特征進行快速綜合判斷的方法。這種方法類似于圖像分類,通過提取圖像特征,并將其歸類為正常圖像和垃圾郵件圖像。目前,這類方法的區別主要在于提取的圖像特征和使用的分類器不同。

(1)淺層特征結合傳統分類器

如美國賓夕法尼亞大學的Dredze等[24]提出利用圖像類型、大小、圖像高、寬、高寬比、顏色均值、色飽和度、邊緣特征、主色調覆蓋范圍等特征構成圖像屬性,并利用最大熵和貝葉斯分類器進行判別。美國安全計算公司的Krasser等[25]提出利用圖像像素位寬度、高度、圖像類型、文件大小、圖像面積、壓縮比等九個特征用于描述圖像的屬性。又結合決策樹和支持向量機來進行判斷。電子科技大學的萬明成等[26]提出利用垃圾郵件圖像的顏色數量、方差、連續出現的顏色數、主色覆蓋范圍、色飽和度表示圖像的顏色特征,再利用圖像特征點的主方向分布特征表示文字分布特征,同時使用支持向量機進行判斷。Wang等[27]提出利用圖像基本特征、顏色和紋理等圖像淺層特征表述圖像。

這種直接使用淺層視覺特征的方法也存在一些缺點,比如所選擇的特征和垃圾郵件圖像本身不一定具有強相關性,因而必須對所使用的特征進行仔細選擇,而且分類器的訓練還會受到樣本庫的影響,使得在實驗環境下效果很好的算法在實際網絡環境中卻未必能取得同樣的過濾效果。

(2)分類器設計改進

這類方法大量借助分類器進行判別,但存在以下幾點問題,而針對具體問題已然提出了一些改進方法:

①現在的分類器準確性受樣本庫規模影響。已有研究工作中使用的分類器大都為有監督學習方法,需要預知一個已標注的樣本庫,并以此為基礎訓練分類器。然而實際情況下,垃圾郵件圖像復雜多變,為了保證較高識別率,就需要一個規模較大的樣本庫,但標注工作帶來了很大的人工負擔。

針對該問題,美國西北大學的Gao等[28]提出利用主動學習的方法,結合支持向量機和高斯分類器每次選擇那些分類器判別最不確定的樣本進行標注,并進行分類器訓練,以達到使用最少的標注樣本而獲得最優分類效果的目的。

② 現在的分類器僅在靜態的樣本庫上訓練得到,不能實時反映網絡中垃圾郵件圖像的特征變化,即分類器不具有在線學習功能。

理想情況下的分類器應具有在線學習能力,能夠根據圖像的變化進行實時或者周期性地更新。浙江師范大學的張浩然等[29]通過分析回歸最小二乘支持向量機的數學模型,設計了一種回歸最小二乘支持向量機的增量和在線式學習算法。該方法具有較高的執行效率,同時具有一定的遺忘機制,減少了存儲空間和分類器的更新時間,適用于圖像型垃圾郵件的檢測。

③ 現在的過濾方法大都使用單一的分類器,并試圖獲取較高的判別準確性。實際環境下,垃圾郵件圖像經常變化,單一的分類器未必能滿足應用要求。

由于垃圾郵件圖像復雜多變,可以借助級聯分類器對圖像進行分層過濾,每層針對不同的圖像特征可以構造或者使用不同的分類器,這樣對于提高過濾效率及準確性具有更好的作用。

綜上可知,基于淺層特征的過濾方法性能受提取的特征和分類器兩方面的影響。所選特征應該能夠有效反映垃圾郵件圖像和正常圖像之間的差異。對于分類器,實際應用中仍然存在諸如泛化問題、過濾準確性受樣本庫影響等一定的問題。

2 圖像型垃圾郵件過濾相關產品及開源工具

目前,國際主流的反垃圾郵件服務商,如梭子魚、IronPort、McAfee、卡巴斯基、Fortinet等都提供對圖像型垃圾郵件過濾的功能支持。但其提供產品卻普遍缺乏對圖像內容的深層分析能力,對圖像型垃圾郵件的過濾卻主要依賴于行為分析和簡單的圖像指紋過濾,由此對圖像型垃圾郵件的主動發現功能均十分薄弱。例如,梭子魚通過維護基于OCR的模糊邏輯規則,實時更新垃圾郵件規則庫。通過復合OCR 引擎處理已經確認的垃圾郵件圖像,生成圖像指紋并自動打包傳給部署在世界各地的在線梭子魚垃圾郵件防火墻以更新核心威脅數據庫。IronPort提出了一種兩層的圖像垃圾郵件防護機制。第一層由上下文自適應掃描引擎對收到的郵件進行全面語境分析,以擴大傳統的基于內容的方法的分析能力;第二層利用多維模式識別技術對郵件圖像進行內層防護。McAfee則通過從郵件圖像中提取內部屬性,以此來判斷該圖像是否為垃圾郵件圖像。同時,McAfee也使用了圖像散列算法為圖像創建數字簽名,這種技術計算效率較高。卡巴斯基實驗室提出了一種“光柵圖像垃圾郵件識別技術”,其核心是一套基于概率研發的算法,能夠利用數據分析計算的方法判斷某幅圖像中是否包含文字信息,再運用其它算法提取圖像的特征,確定圖像中包含可讀文字信息的內容。這種方法能更加快速精準地定位包含于圖像中的垃圾信息,并能輕易識別專用于干擾文字信息的圖像,因而對變形文字同樣有效,在較大程度上提高了對圖像型垃圾郵件的檢測水平。

此外,一些開源的垃圾郵件過濾器,如SpamAssassin、SpamBayes、Bogofilter等都提供了針對文本垃圾郵件的過濾功能,但是對于圖像型垃圾郵件的過濾仍然欠佳。如SpamAssassin雖然提供了圖像型垃圾郵件過濾功能,但是主要借助于一些開源的OCR工具(如:FuzzyOCR、BayesOCR等)進行圖像文本內容提取,再對于提取的文本進行關鍵字判斷或者進行文本內容語義分析。通常OCR分析模塊計算復雜度較高,同時僅能夠識別“干凈”圖像中的文本,準確性又易受圖像噪聲干擾的影響,因此難以在實際的大規模復雜網絡環境中獲得廣泛應用。

3 公開的垃圾郵件圖像數據庫

用于測試的郵件圖像應由垃圾郵件圖像和正常圖像兩部分組成。由于垃圾郵件的特殊性,采集數據十分困難。圖像型垃圾郵件的獲取則更加困難,因此只有極少數研究機構或學者將其收集的垃圾郵件圖像公開。大部分研究者使用的垃圾郵件圖像多是從一些公開的垃圾郵件庫中搜集[16],如SpamArchive (www.spamarchive.org)和TREC (http://trec.nist.gov)垃圾郵件語料庫,或者從大量長期使用的個人郵箱中搜集而得[9-10,28]。需要指出的是,這些公開的垃圾郵件圖像庫都來自國外,圖像中的文本內容多為英文,目前國內還沒有公開的測試圖像庫。相對于垃圾郵件圖像而言,正常圖像的收集則相對簡單。正常圖像主要通過四類途徑獲取:

(1) 從個人郵箱中收集;

(2) 利用搜索引擎并使用如“photo” ,“baby”, “graphic”等關鍵詞在網上搜索[22];

(3) 手工生成一些圖像,如賀卡、公司圖標、動畫以及截屏等;

(4) 從一些公開的正常圖像庫中獲取。表1給出了部分研究者公開的垃圾郵件圖像和正常圖像庫。

4 垃圾郵件圖像數據收集方法

垃圾郵件圖像主體仍依賴從垃圾郵件中提取。由于郵件收集涉及隱私、信息內容安全等特殊性,使得垃圾郵件圖像數據采集更見難度。一些研究者通過對大量長期使用的郵箱進行搜索以全面收集圖像數據,但這種方法卻受到郵箱使用時間以及郵箱是否被垃圾郵件發送者獲知的影響。垃圾郵件發送者經常在網絡上通過搜集大量公開的郵件地址,實施垃圾郵件發送。網絡中可見大量公布的郵件地址將“@”符改寫為“at”或“#”,或者將郵件地址利用圖片方式公布,以此拒絕垃圾郵件。因此,可以通過在網絡上公開發布大量郵箱地址的方式來長期收集圖像型垃圾郵件。

蜜罐[30]是一種獨特的安全資源,可以用于探測和誘騙各種網絡行為以及攻擊手段,因此可以通過蜜罐系統來誘騙各種垃圾郵件。蜜罐系統提供虛假郵件服務,以此誘騙垃圾郵件,進而提取實際網絡環境中的圖像型垃圾郵件以用于實驗分析。這種方法與前者的區別是,通過個人郵箱進行收集的方式受郵件服務商的限制,因為郵件服務商可能會提前對垃圾郵件實行過濾,如此就降低了收集獲得的垃圾郵件圖像的數量。然而,蜜罐系統自身就可以是一個虛假的郵件服務商,因此具有更好的收集功能,但同時也需要更多的硬件和網絡資源的更大開銷。

5 討論與展望

圖像型垃圾郵件的頻發消耗了大量的帶寬、計算以及存儲資源,給社會帶來了不穩定因素,使得傳統垃圾郵件過濾系統面臨更為巨大的挑戰。在眾多研究者以及工業界的共同努力下,圖像型垃圾郵件得到了一定限度的遏制。但為了躲避過濾系統,圖像的特征則變得越來越復雜并呈現出新的變種,在垃圾郵件中所占比例仍比較高。現在的圖像型垃圾郵件過濾系統主要依靠圖像特征提取以及分類識別的方法,其性能則依賴于樣本庫特性、圖像特征提取方法和分類器指標數據等。從本文的分析可知,如何從依靠圖像型垃圾郵件樣本轉化到智能圖像垃圾郵件識別,提高過濾速度以及識別準確率仍然是一項艱巨的任務。下一步的相關研究工作可以從如下方面開展:

(1)顯著性特征提取。如何有效提取區別于正常圖像的垃圾郵件圖像特征將直接影響判斷結果。

(2)復雜場景中的敏感關鍵字發現。垃圾郵件圖像中經常包含大量文本,但是卻混雜了噪聲、背景干擾等。由于OCR處理效果不佳,因此需要研究復雜干擾場景中的敏感關鍵字的發現方法。

(3)垃圾郵件的發送途徑控制。 卡巴斯基的調查報告指出,垃圾郵件多由垃圾郵件發送者控制的大量僵尸網絡來實現發送。僵尸網絡能夠控制數以百萬的計算機,用于發送大量的圖像型垃圾郵件。這些垃圾郵件可能發送至不同的郵件服務商。 因此, 可以考慮聯合多個郵件服務商, 通過結合僵尸網絡的特征和網絡安全兩方面來嚴格控制其發送途徑。

參考文獻:

[1]ZHANG L, ZHU J, YAO T. An evaluation of statistical spam filtering techinques[J]. ACM Transactions on Asian Language Information Processing, 2004, 3(4):243-269.

[2]王斌, 潘文鋒. 基于內容的垃圾郵件過濾技術綜述[J]. 中文信息學報, 2005, 19(5):1-10.

[3]何培舟, 溫向明, 鄭偉. 圖像垃圾郵件的發展和防范[J]. 電信科學, 2008, 24(7):68-72.

[4]反垃圾郵件技術之巧用特征碼制服垃圾郵件[R/OL]. http://security.zdnet.com.cn/security_zone /2009/0222/1347922.shtml.

[5]賽門鐵克公司2009 年5月垃圾郵件報告[R/OL]. http://www.symantec.com/zh/cn/about/news/release/article.jsp?prid=20090601_01.

[6]互聯網協會公布的反垃圾郵件調查結果[R/OL]. http://www.softnext.com.cn /newsshow.asp?id=22.

[7]VON A L, BLUM M, LANGFORD J. Telling humans and computers apart automatically[J]. Communications of the ACM, 2004, 47(2):56-60.

[8]MEHTA B, NANGIA S, GUPTA M, et al. Detecting image spam using visual features and near duplicate detection[C]//Proceeding of the 17th International Conference on World Wide Web, Beijing, 2008:497-506.

[9]WANG Z, JOSEPHSON W, LV Q, et al. Filtering image spam with near-duplicate detection[C]// Proceedings of the International Conference on Email and Anti-Spam, 2007.

[10]HE P, WEN X, ZHENG W. A simple method for filtering image spam[C]//Proceedings of the Eighth IEEE/ACIS International Conference on Computer and Information Science, 2009:910-913.

[11]HE P, WEN X, ZHENG W, et al. Filtering image spam using file properties and color histogram[C]// Proceedings of the International Conference on Multimedia and Information Technology, 2008:276-279.

[12]GAO Y, CHOUDHARY A, HUA G. A comprehensive approach to image spam detection: from server to client solution[J]. IEEE Transaction on Information Forensics and Security, 2010, 5(4):826-836.

[13]GAO Y, CHOUDHARY A, HUA G. A nonnegative sparsity induced similarity measure with application to Cluster Analysis of Spam Images[C]// Proceedings of the IEEE International Conference on Acoustics Speech and Signal Processing, 2010:5594-5597.

[14]ZHANG C, CHEN W, CHEN X, et al. A multimodal data mining framework for revealing common sources of spam images[J]. Journal of Multimedia, 2009, 4(5):313-320.

[15]CHEN W, ZHANG C. Image spam clustering: an unsupervised approach[C]//Proceedings of the First ACM Workshop on Multimedia in Forensics, 2009:25-30.

[16]FUMERA G, PILLAI I, ROLI F. Spam filtering based on the analysis of text information embedded into images[J]. The Journal of Machine Learning Research, 2006, 7:2699-2720.

[17]YOUN S, MCLEOD D. Improved spam filtering by extraction of information from text embedded image E-mail[C]//Proceedings of the ACM Symposium on Applied Computing, 2009:1754-1755.

[18]FUMERA G, PILLAI I, ROLI F, et al. Image spam filtering using textual and visual information[C]// Proceedings of MIT Spam Conference, 2007.

[19]MA W, TRAN D, SHAMA D. Detecting image based spam email[J]. Advances in Hybrid Information Technology, 2007:168-177.

[20]LEE H, NG A Y. Spam deobfuscation using a hidden Markov model[C]//Proceedings of the 2nd Conference on Email and Anti-Spam, 2005.

[21]LEE S, JEONG I, CHOI S. Dynamically weighted hidden Markov model for spam deobfuscation[C]// Proceedings of the International Joint Conference on Artificial Intelligence, 2007:2523-2529.

[22]ARADHYE H B, MYERS G K, HERSON J A. Image analysis for efficient categorization of image-based spam E-mail[C]//Proceedings of the Eighth International Conference on Document Analysis and Recognition, 2005:914-918.

[23]WU C T, CHENG K T, ZHU Q, et al. Using Visual features for anti-spam filtering[C]//Proceedings of the IEEE International Conference on Image Processing, 2005, 3:501-504.

[24]DREDZE M, GEVARYAHU R, ELIAS-BACHRACH A. learning fast classifiers for image spam[C]//Proceedings of the Conference on Email and Anti-Spam, 2007:487-493.

主站蜘蛛池模板: 爽爽影院十八禁在线观看| 真人高潮娇喘嗯啊在线观看| 日韩高清成人| 天天摸夜夜操| 国产97公开成人免费视频| 午夜性爽视频男人的天堂| 亚洲国产日韩在线成人蜜芽| 黄色国产在线| 日韩经典精品无码一区二区| 一级在线毛片| 国产乱人乱偷精品视频a人人澡| 日韩人妻少妇一区二区| 国产精品区视频中文字幕| 亚洲欧美国产高清va在线播放| 亚洲精品波多野结衣| 亚洲综合狠狠| 亚洲无码精品在线播放| 免费高清自慰一区二区三区| 亚洲欧美国产五月天综合| 欧美日韩在线国产| 日韩精品久久久久久久电影蜜臀| 美女黄网十八禁免费看| 毛片一级在线| 免费可以看的无遮挡av无码 | 国产国语一级毛片| 亚洲性视频网站| 伊人激情综合| 国产精品亚欧美一区二区三区| 午夜视频在线观看免费网站| 亚洲日本一本dvd高清| 国产毛片久久国产| 久久国产精品波多野结衣| 在线观看视频99| 久草青青在线视频| 亚洲第一成年网| 91丝袜在线观看| 国产精品久线在线观看| 狠狠色综合久久狠狠色综合| 欧美国产日韩在线播放| 一区二区三区在线不卡免费| 在线精品欧美日韩| 美女视频黄又黄又免费高清| av天堂最新版在线| 国产精品分类视频分类一区| 国产欧美日韩在线在线不卡视频| 亚洲a级毛片| 国产偷倩视频| 久久婷婷五月综合色一区二区| 亚洲第一色网站| 五月婷婷精品| 国产精品第| 在线国产毛片| 美美女高清毛片视频免费观看| 亚洲女同欧美在线| 亚洲欧洲日本在线| 干中文字幕| 欧美午夜网| 欧美性猛交一区二区三区| 国产精品亚洲а∨天堂免下载| 97国产成人无码精品久久久| 在线高清亚洲精品二区| 亚洲精品中文字幕午夜| 国产成人精品一区二区秒拍1o| 99偷拍视频精品一区二区| 欧美亚洲欧美| 婷婷六月激情综合一区| 亚洲国产天堂久久九九九| 欧美国产在线看| 久热中文字幕在线观看| 好紧好深好大乳无码中文字幕| 一级毛片免费的| 久热中文字幕在线观看| 少妇被粗大的猛烈进出免费视频| 国产麻豆福利av在线播放| 天天躁狠狠躁| 色噜噜久久| 免费看av在线网站网址| 国产欧美成人不卡视频| 国产SUV精品一区二区6| 日本一本在线视频| 亚洲成人播放| 中文字幕人成人乱码亚洲电影|