何良 冷濤
摘 要 隨著互聯網的快速發展,釣魚網站的泛濫讓網民們的網絡安全受到了嚴重威脅,導致大量網民泄露了個人隱私與經濟上的損失。因互聯網不分國界的特性,釣魚網站也成為全球性問題。釣魚網站的收集與預警顯得尤其重要。本文對釣魚網站的特性與危害進行了較為翔實的闡述,對釣魚網站的收集與檢測技術進行了詳細的分析研究。
關鍵詞 釣魚網站;釣魚檢測;網頁特征;網絡釣魚;反釣魚
釣魚網站是指不法分子精心設計與人們所信任的政府、企業等組織的網站非常相似的仿冒網站,通過一些傳播方式將釣魚網站的URL發給用戶,誘導用戶訪問,來騙取用戶重要私密信息,進而實施其他欺詐行為[1]。
1 釣魚網站的特性
①釣魚網站傳播性廣。不法分子往往通過QQ、微信等即時通信工具、手機短信、論壇或者搜索頁面投放廣告、微博等社交平臺、電子郵件、惡意導航網站等方式大量傳播釣魚網站,又因不法分子將釣魚網站設計包裝與官方網站一致,使用戶很難區分網站真實性,誘導受害者訪問釣魚網站并輸入個人敏感信息。②釣魚網站偽裝性強。不法分子在制作釣魚網站會通過多種方法來偽裝成官方網站,迷惑用戶,使用戶難以判斷。一些釣魚網站使用了多種迷惑技術,可成功欺騙殺毒軟件與瀏覽器自帶的安全系統,使廣大網民防不勝防。③釣魚網站產業鏈化。釣魚網站已形成了黑色產業鏈,從釣魚網站的制作、推廣、盜取資金、洗錢、販賣個人數據、針對性詐騙等多個環節都有專業的團伙負責。整個過程完全實現了流水線式的作業,入門門檻低,投入資金少。只要有用戶上當,就可獲取不菲的收益。網絡釣魚黑色產業鏈的危害早已超過傳統的木馬和病毒,成為威脅網民切身利益的一大毒瘤。
2 釣魚網站的危害
釣魚網站的根本目的是為了獲取用戶個人敏感信息,在獲取敏感信息后,往往直接對用戶銀行資金進行盜取,或對用戶的購物網站、游戲網站等網站上的余額、積分、裝備等進行盜取再二次售賣。對不能直接盜取資金的,不法分子往往將獲取的大量用戶個人數據在暗網等處售賣,詐騙團伙購買后對受害者進行針對性詐騙。
3 釣魚網站的收集
①基于全球每日最新注冊域名的收集??筛鶕蘒CANN(互聯網名稱與數字地址分配機構)的數據服務頁面獲取到全球域名列表,每天持續收集,只要做差量就可得到全球的每天新增域名列表。因釣魚網站為逃避打擊,域名具有經常變動的特性,可根據獲取的每日新增域名列表數據作為待檢測數據。②基于字典形式主動式爬蟲收集。收集眾多政府、銀行、購物、企業網站等官網域名為字典,并在一定周期內保持更新。因釣魚網站域名和其冒充的相對應官網域名極度相似,用爬蟲智能窮舉分析釣魚網站域名。
4 釣魚網站的檢測
①基于URL黑名單的檢測技術。檢測用戶輸入的網址,通過對網頁的URL記錄建立黑白名單庫,并對其進行檢測分析。采取中國反釣魚聯盟(APAC)、國外PhishTank、反釣魚工作組(APWG)、與自建黑名單數據庫的對應釣魚網站黑名單數據,進行智能對比,一旦發現為黑名單中數據則預警,同時將其他模式發現的釣魚網站保存到黑名單數據庫?;赨RL黑白名單的檢測方法簡易、速率高且準確性高。②利用URL特征的檢測技術。通過對URL特征數據的訓練,構建分類器模型,對URL進行特征分類,最終判斷URL是否為釣魚網站的地址。從可疑URL中抽取出不同的特征,與官方網頁的這些特征作比較,判斷是否為釣魚URL[2]。具體操作為:對URL進行分割,對每一個部分與官方網站URL進行相識度匹配,判斷域名的長度是否一樣,另將每部分的相識度相加,相似度的值越近,相似度越高。③基于模擬登錄的檢測技術。釣魚網站往往是引誘用戶在網頁上填寫例如:賬號、密碼、身份證等敏感信息,根據此特點,可推斷出釣魚網站不校驗賬號密碼正確性,可使用隨機字符生成用戶名、隨機口令的檢測方法,對符合該特征的網站進行自動檢測。④基于web頁面敏感特征值的檢測技術。釣魚網站雖與冒充的官方網站有很高的相似度,但從web頁面的HTTP協議與DOM文檔對象模型上分析,可發現釣魚網站的頁面存在一些差異:URL的差異、表單字段的差異、資源引用的差異、域名信息的差異、Cookie的差異[3]??捎门老x批量對官網網站的web頁面數據進行收集,提取敏感特征,建立web頁面敏感特質值數據庫,將檢測的網址提取特征,與官方特征值相比較判斷。⑤基于深度學習的檢測技術。近年來,深度學習技術在各個專業領域的應用中都發揮很大作用,檢測釣魚網站URL的主要問題是怎樣對URL數據中的特征進行學習。將原始的URL數據轉換為高抽象程度的數據表達,這正是深度學習技術的強項。深度學習技術可對原始的URL數據進行逐層的特征抽取,自動學習URL層次化的特征表示,更有利于對釣魚網站的URL進行檢測。
5 結束語
釣魚網站已成為威脅網絡安全的突出問題,并日趨嚴重。釣魚網站更新速度快,制作成本極低,非法獲利豐厚。經實驗驗證,本文所研究的釣魚網站收集與檢測技術,多種方式的結合使釣魚網站的檢測速度和檢測精度有了顯著的提升,具有極強的可操作性和有效性,有利于保護網絡環境和人民信息財產的安全。
參考文獻
[1] 唐海騰.釣魚網站分析及其對策研究[J].信息與電腦(理論版), 2014,(9):64-65.
[2] 滕雯靜.基于鏈接分析的釣魚網站檢測方法[D].南京:南京郵電大學,2014.
[3] 宋明秋,曹曉蕓.基于敏感特征的網絡釣魚網站檢測方法[J].大連理工大學學報,2013,(6):128-132.
*[基金項目] 科研項目:瀘州市科技局苗子工程 2016-R-70(3/24) ,四川省公安廳重點攻關與應用創新項目(2018TJKYLX019)。