梁雪霆
摘 要:隨著互聯網的快速發展和普及,信息傳播方式發生重大轉變,人們的生活、生產也更加便利。但是,不可否認的是,計算機網絡病毒同樣發展起來,嚴重威脅人們的信息安全。數據挖掘技術是一種新型的技術,可以挖掘、出來、分析計算機網絡中的數據,可用于防御計算機網絡病毒,從而進一步保障人們的信息安全。本文先簡單概述數據挖掘技術,然后從數據挖掘技術的構成、計算機網絡病毒防御系統兩個方面來研究計算機網絡病毒防御技術,旨在為后續研究提供一定的參考。
關鍵詞:數據挖掘技術;網絡病毒;計算機
在現代化技術的高速發展下,人們已經進入一個嶄新的時代——網絡時代,人們的衣、食、住、行均與網絡息息相關。與此同時,計算機網絡病毒不斷增多,由于其種類、傳播方式均具有多樣性,嚴重威脅計算機網絡系統安全,也損害了廣大計算機網絡用戶的信息安全[1]。基于此,計算機網絡病毒防御技術越來越受到人們的關注,且成為該領域的研究熱點。
1 數據挖掘技術概述
所謂數據挖掘技術,指的是以所處一定范圍之內的所有數據為研究對象,對其進行收集、分類、歸類,根據數據處理結果,判斷是否存在某種潛在關系和數據規律的技術。它主要包含三個環節:即準備數據、尋找數據存在的規律、表現數據規律,數據挖掘技術的工作流程如下:當設置好數據挖掘模式后,挖掘引擎就會根據數據庫的相關要求展開工作,即對準備好的數據進行分析、歸類,利用相關技術找出各個數據之間存在的關系,或是數據規律,從而為后期的數據分析提供依據。在實際的應用中,數據挖掘技術的過程比較繁雜,很大一部分屬于準備、規劃階段,但其重點在于對數據的預處理,它屬于基礎環節,同時也是后續工作的必要條件[2]。數據預處理階段涉及的操作過程也比較多,比如數據的凈化過程、轉化過程、整合過程等。
2 數據挖掘技術的計算機網絡病毒防御技術
近年來,隨著人們對數據挖掘技術研究的深入,人們將其用于保障計算機信息安全中,即防御計算機網絡病毒。
(一)數據挖掘技術的構成分析
計算機網絡病毒發展迅速,嚴重威脅計算機信息安全。在計算機網絡病毒進行傳播時,通過對有關數據進行掃描,比如系統數據、網絡用戶數據,可以為數據挖掘技術提供依據。在計算網絡病毒防御中,數據挖掘技術的應用過程比較復雜,涉及的步驟也比較繁雜,為了有效掌握每個環節的特征,需要進行分模塊分析研究,包括預處理模塊、數據挖掘模塊等。
從數據挖掘技術的構成來看,主要包括以下幾個成分:(1)數據預處理模塊,它主要是借助數據預處理模塊,可以對數據挖掘、分析操作進行簡化,并且還能整體提高數據挖掘效果,確保其準確度、辨識度。具體來講,其操作流程如下:完成數據收集后,對數據進行導入處理,將其傳輸到預處理模塊,對數據進行分析、歸類,并且使其轉變成可被系統識別、處理的內容,然后以數據包(比如目標IP地址、端口信息等)所包含的信息為依據,事實相關流程。(2)決策模塊,它主要是通過對數據的挖掘來構建數據庫,實施匹配處理,并且將數據庫與關聯庫二者聯系起來,若二者之間出現高度聯系的信息,則提示可能感染計算機病毒。(3)數據收集模塊,它通過抓取、收集計算機網絡中的數據包,實現對數據信息的收集。通常情況下,當數據信息被收集后,就會獲取比較重要的功能信息。(4)數據挖掘模塊,它是數據挖掘技術中最核心的部分。在數據挖掘模塊中,同樣包含多個部位,但比較關鍵的是事件庫和數據庫挖掘算法。通過數據挖掘,可以獲取較為準確的數據結構。(5)規則庫模塊,它的作用在于幫助優化數據挖掘信息庫。若網絡病毒出現在計算機系統中,啟動規則庫模塊,可以分析、識別數據信息。當然,在實際的運行中,在數據挖掘時,網絡病毒屬性的獲取規則會被改變或調整,并且還會將其保留、使用于數據挖掘中,從而協助計算機系統,分析潛在的網絡病毒。
(二)計算機網絡病毒防御系統分析
以數據挖掘技術為基礎的計算機網絡病毒防御系統中,其主要包括三個主要的操作過程中,即關聯規則、聚類、分類。
(1)關聯規則分析
它指的是在同一類別的數據中,存在可以被發現的知識,以≥2個變量為對象,實施取值處理,若結果顯示數據存在一定的規律,則提示數據之間具有某種關聯。在數據挖掘技術中,主要的幾種關聯關系包括:簡單關聯、及時序關聯、因果關聯。在計算機網絡病毒防御中,要想找到數據庫中的關聯網,關聯分析這一環節必不可少。
(2)聚類分析
在數據挖掘技術中,聚類操作同樣發揮著不可取代的作用,它主要是根據數據的不同類別、特點,分解所獲取到的數據信息。當完成系統中所有數據的聚類操作后,就可以有效了解系統中數據分布的情況,主要是疏密情況,這樣一來,一方面,它可以呈現出組與組之間數據存在的關系;另一方面,還能體現出全局的分布模式。
(3)分類分析
所謂分類分析,它指的是對個體進行分類、歸類處理,使其處于預先設定的類別當中。該操作的主要目的是利用多種機器學習方法、統計方法,并且采用相關計算機處理技術,建立數據的分類模型,然后以數據庫中存在的數據為對象,實施分類出來,并以此為依據,對其他數據進行分析、歸類處理。
3 結語
綜上所述,在互聯網的發展是一把雙刃劍,既給人們的生產、生活帶來極大便利,同時也給用戶的計算機信息安全帶來嚴重威脅。
參考文獻:
[1]王娜.數據挖掘技術在計算機網絡病毒防御中的應用分析[J].計算機光盤軟件與應用,2013(08):155,157.
[2]李英杰.數據挖掘技術的計算機網絡病毒防御技術研究[J].電腦知識與技術,2015(02):1-2.