李碩 車宇
(中國核動力研究設計院 四川省成都市 610041)
數據挖掘技術在計算機網絡安全病毒防御中的優勢較為顯著,將網絡數據結合在一起綜合分析,數據挖掘技術涉及的范圍較廣,要充分結合當前計算機網絡安全病毒的實際特點,詳細的對數據源模塊、數據決策模塊以及規則庫模塊進行研究,使之適應計算機網絡安全病毒防御的需要。
隨著現代化科學信息技術的不斷發展,人們對計算機網絡的需求逐漸增加,在計算機網絡運行的過程中容易受到多種因素的影響,網絡病毒現象時有發生,給計算機網絡系統帶來嚴重威脅,網絡病毒的特征具有多樣性,對計算機中的數據資源造成破壞。
(1)病毒的傳染特點較為明顯,計算機病毒的產生與人為因素有關,主要通過編制程序代碼的形式植入到用戶的計算機系統內,并在病毒傳播的過程中自動匹配符合傳染條件的程序,通過自動搜索的形式隨即傳播。當計算機存在病毒時處理不及時將會產生新的傳染源并繼續對其它文件以及程序造成影響。
(2)病毒傳播方式較多,計算機網絡病毒產生的前提是計算機處于正常運行的狀態,一些社會上的不法分子往往通過電子郵件等多種形式傳播病毒,不及時處理將會影響計算機系統的平穩運行。其中,最主要的病毒傳播途徑是系統漏洞,可以對計算機遠程主機系統進行操控,此時的病毒將會自動的搜索,借助系統存在的漏洞侵入電腦中,破壞計算機系統。
(3)病毒的破壞能力較強,當前最為常見的病毒主要有黑客以及木馬,具有較強的攻擊性。同時,黑客以及木馬病毒的隱蔽性較強,不易被使用者發現,導致使用者的關鍵信息數據經常出現丟失的現象,重要信息將被泄露,阻礙了計算機系統的安全運行。
數據挖掘技術在計算中網絡安全病毒防御中的應用效果較為突出,將數據挖掘技術應用其中,主要通過數據分析方式,準確的將數據進行分類的處理,并在具體的分類過程中找出數據之間存在的關聯性。同時,數據挖掘技術包含的方面具有多樣性,要將數據的整理、收集以及清理等結合在一起綜合分析,并在計算機網絡病毒防御工作中發揮價值。數據挖掘技術有效的掌握了病毒的產生以及傳播方式,在數據挖掘技術的支持下通過計算機主機掃描的方式檢測病毒,并以此為依據構建科學合理的病毒防御機制,在此環節中,需要發揮數據挖掘模塊以及數據源模塊的優勢,并與預處理數據模塊相結合,通過分析數據包的形式對計算機存在的病毒信息進行記錄處理,該技術的應用可以提升計算機系統抵御病毒的能力,借助報警裝置的作用針對計算機網絡系統中存在的病毒現象進行及時的報警,隨即自動啟動防御程序,為用戶營造良好的計算機網絡運行環境[1]。
數據源主要指的是抓包程序,當計算機系統處于正常運行的狀態時,其中數據源中包含的信息具有多樣性,主要包括觀測數據、分析測定數據、圖形數據、統計調查數據以及遙感數據等,數據源是開放式數據庫連接驅動,能夠連接到數據庫上必需的信息。注重觀察抓包程序運行狀態,并及時接收信息,隨即需要對收集上來的信息進行處理,此時需要與數據預處理模塊相連接,確保數據分析的準確性。
數據決策較為關鍵,發揮數據挖掘技術的優勢,通過構建數據庫的形式將收集到的數據進行實時的匹配,在此環節中需要與規則庫進行連接,并在檢驗計算機網絡安全病毒的環節中,與規則庫進行比較,當出現二者之間的信息保持一致的狀態時,此時數據決策模塊中出現病毒,針對該方式可以準確的對計算機系統是否感染病毒進行判定。同時,監測數據決策模塊的運行狀態,在與規則庫進行連接的過程中,要詳細的分析與規則庫數據不相匹配的現象,當發生該現象時則計算機網絡系統可能存在新的網絡病毒,此時則需要進一步的與規則庫進行比較,并對該新型病毒進行分類。
規則庫的作用較為顯著,實時關注數據庫的運行狀態,并對該數據庫進行優化與處理,規則庫在數據處理的過程中,可以及時的將病毒信息進行展示,并與數據庫中的信息相匹配,準確的識別出計算機網絡系統中可能存在的病毒風險,并對病毒的類型進行分析,納入到規則庫中。規則庫具有較強的記錄功能,當計算機網絡系統存在病毒問題時,規則庫將會及時的發現系統中存在的病毒,并對病毒特征進行記錄,隨即開展計算機網絡病毒對比分析工作[2]。
數據資源預處理是數據挖掘技術的重要組成部分,一定程度上有助于提升數據挖掘的效果。數據資源預處理模塊是提升數據辨識度的關鍵,計算機網絡系統在運行的環節中,數據資源預處理模塊與數據源模塊進行連接,實時獲取數據源中的數據信息,并對數據源模塊傳輸過來的數據信息進行分析以及歸類,在必要時還可以實現數據之間的轉換。數據資源預處理模塊的適應能力較強,在操作的過程中通過數據轉換的形式與計算機網絡系統進行識別,確保數據信息處理的準確性。數據預處理模塊中的數據信息來源具有多樣性,主要涉及目標IP 地址以及源IP 地址等,數據預處理可以實現清理異常值、糾正錯誤數據等功能,主要包括數據清理、數據集成、數據變換以及數據歸約等,該模塊的應用一定程度上提高了數據挖掘模式的質量,降低實際挖掘所需要的時間。
數據挖掘模塊是數據挖掘技術中的重要組成部分,在應用數據挖掘技術的環節中,借助數據挖掘中的挖掘算法的優勢對數據進行歸納與分析,隨即產生事件庫,有助于保證數據分析結果的準確性。在應用數據挖掘模塊的過程中,主要是對各項數據進行精確的分析,并從眾多數據中找出其中存在的規律,其中主要涉及的是數據準備、規律尋找和規律等。
關聯規則在計算機網絡安全病毒防御中的應用效果較為顯著,由于計算機系統內部之間的緊密性較強,注重將關聯分析理念應用其中,在開展關聯分析的過程中,針對數據庫自身具有關聯性的特點從中總結出數據庫中的運行規律,實時關注計算機網絡系統的運行狀態,當網絡系統出現異常的現象,將會及時準確的發現病毒并處理病毒,避免對計算機網絡系統的平穩運行造成影響。關聯規則的應用一定程度上可以詳細的對數據之間的關系進行整合與分析,有助于從整體上提升數據挖掘技術的應用水平。數據挖掘技術通過關聯規則的方式來對計算機網絡病毒進行精準定位,實時搜集數據知識,當發現病毒時,并與整體數據信息進行比較,當與數據信息之間呈現出一定的規律時,則體現出關聯性,數據內容存在關聯的形式具有多樣性,可以是因果關系,也可以是時序的轉變,針對計算機網絡安全病毒防御操作的實際情況進行關聯性的分析,并關注系統數據的運行狀態,從中總結出計算機病毒數據的關聯規則[3]。
分類規則的應用效果較好,在計算機網絡安全病毒防御的過程中,實時收集數據,并對其進行分類處理,隨即通過建立模型的方式對病毒進行分類,在此環節中主要以機器學習以及統一學習為主,針對計算機網絡系統中存在的病毒進行分類處理,并由專業人員制定針對性的應對方案,該規則的應用一定程度上可以減少人力資源的消耗,有助于從整體上提升數據分類的質量與效率,減少病毒對計算機網絡系統造成影響,是分析計算機網絡安全病毒防御的重要形式。在應用分類規則的環節中,關注預定分類的實際特點,將計算機信息系統中的不同數據個體進行結合分析。數據分類主要包括學習階段以及分類階段兩個方面,在學習階段中,主要指的是構建分類模型,用分類算法分析訓練數據集得到的模型,在分類階段中,主要是指使用模型預測給定數據的類標號,通過檢驗數據集來評估分類規則的準確性。應用在計算機網絡安全病毒防御工作中,實時找出數據庫中的一組數據對象的共同特點,并在分類的過程中按照分類模式將其劃分,將數據庫中的數據項映射到給定的類別中,及時預測病毒信息,確保計算機網絡系統的安全性。
序列分析規則的應用主要是通過序列分析的方式進行操作,在計算機網絡安全病毒防御的過程中,可以準確的總結出存在病毒的排列規律,并對病毒進行控制。在序列分析的過程中,相關的技術人員可以實時的獲取病毒的種類,根據病毒在系統中運行的規律制定出有效的防治病毒的方案。在查找病毒的環節中,借助序列分析規則的優勢構建序列模型,并在此環節中,為了提升查找病毒的速度,可以將挖掘算法應用其中,實現對病毒的控制,一定程度上有助于提升計算機網絡安全病毒防御能力,能夠適應當前計算機網絡系統運行的實際需要。序列模式挖掘參數主要包括時間序列的時間長度、時間窗口以及發現模式中事件發生的時間間隔等[4]。
如今,計算機網絡系統中存在的病毒具有多樣性,以其自身具有傳播快的特點對使用者的信息安全造成一定的影響。計算機病毒相對復雜,像木馬以及黑客病毒則不容易被發現,而將計算機挖掘技術應用其中一定程度上可以對病毒進行精準識別,提升計算機系統的病毒防御能力。在應用異類規則的過程中,可以及時的發現數據中的偏離點,針對存在與之不相符合的數據進行定位與查找,為計算機病毒防御攻擊提供理論依據。將異類規則應用在計算機網絡安全病毒防御工作中,實時關注數據信息的孤立點,找出其中存在的不同規律的信息,并與普通規則進行比較,并分析得出的數據結果,以此為依據來提升計算機系統的病毒防御能力。
聚類規則在計算機網絡安全病毒防御中的應用效果較為顯著,計算機系統在運行的環節中實時收集各階段的數據包,并交由專業人員對其進行分析,并將分析出的數據按照規律將其進行分組,其中小組之間存在一定的差異性,整合小組內部數據包中的數據,并通過聚類分析的方式了解數據的分布情況,將數據真實的反應出來。常見的聚類分析算法主要包括K-Means 劃分法、層次聚類法以及DBSCAN 密度法等幾種,以K-Means 劃分法為例進行分析,在聚類標準制定的過程中,主要是將不同種類的樣本劃分到不同類中,使得每個點都屬于離它最近的質心對應的類。需要注意的是,聚類與分類之間存在差異性,主要體現在距離規則主要是針對數據的相似性和差異性將一組數據分為幾個類別。同時,在對該規則中的相同類別的數據進行分析時可以發現其數據之間具有較強的相似性,聚類規則的應用呈現出一定的辨識度,雖然相同類別的數據的相似度較高,但是不同類別之間數據的相似度卻很低,跨類的數據關聯性很低,有助于從整體上提升計算機系統的病毒防御能力,保證計算機系統的平穩運行。
計算機網絡安全病毒防御中的數據挖掘技術的應用方式具有多樣性,要將關聯規則、分類規則、序列分析規則以及異類規則進行結合,并在實際的應用過程中建立完善的技術標準體系,加強技術人才隊伍建設,構建監督運行保障機制,針對在運行環節中存在的問題進行及時的糾正,以此保證計算機系統安全運行。