文/肖平
現(xiàn)階段計(jì)算機(jī)網(wǎng)絡(luò)的應(yīng)用過程中網(wǎng)絡(luò)病毒給計(jì)算機(jī)網(wǎng)絡(luò)的功能帶來了極大的影響,因此,在應(yīng)用計(jì)算機(jī)網(wǎng)絡(luò)過程中應(yīng)當(dāng)選擇適宜的防御技術(shù),對計(jì)算機(jī)網(wǎng)絡(luò)病毒進(jìn)行防御,減少網(wǎng)絡(luò)病毒所帶來的負(fù)面影響。
現(xiàn)階段計(jì)算機(jī)網(wǎng)絡(luò)病毒的種類相對較多,網(wǎng)絡(luò)病毒大多均是由具有一定專業(yè)技能的黑客所編寫,編寫的多為計(jì)算機(jī)高級(jí)程序,這就使得網(wǎng)絡(luò)病毒難以被發(fā)現(xiàn),在發(fā)現(xiàn)時(shí)已給網(wǎng)絡(luò)系統(tǒng)帶來了極大的影響。除此之外,也有部分黑客通過簡單的指令改變對病毒重新編寫,從而形成新的病毒程序,這就使得病毒種類越來越多,極具變化性與不確定性。
病毒在網(wǎng)絡(luò)之間的傳播速度極快,由于網(wǎng)絡(luò)均是互通的,同時(shí)現(xiàn)階段全世界范圍內(nèi)已形成了系統(tǒng)化的網(wǎng)絡(luò)體系,這樣的連接方式也使得網(wǎng)絡(luò)病毒的傳播更加快速,為其傳播提供的有利條件。病毒傳播途徑較多,若入侵計(jì)算機(jī)網(wǎng)絡(luò),將會(huì)給其造成嚴(yán)重的破壞。其入侵途徑主要有系統(tǒng)漏洞、電子郵件與不良網(wǎng)頁等等,簡而言之,網(wǎng)絡(luò)病毒擴(kuò)散速度異常之快,同時(shí)也會(huì)給用戶造成極大的困擾,甚至?xí)刮募蛑匾獢?shù)據(jù)丟失,從而帶來極大的經(jīng)濟(jì)損失。
一般情況下計(jì)算機(jī)網(wǎng)絡(luò)病毒的侵襲都會(huì)依賴木馬技術(shù)與黑客技術(shù),以上多種病毒均體現(xiàn)了混合性的特點(diǎn),網(wǎng)絡(luò)運(yùn)行環(huán)境下難以發(fā)現(xiàn)上述病毒的存在。若被上訴病毒侵襲,那么將會(huì)產(chǎn)生較強(qiáng)的破壞力,導(dǎo)致用戶文件丟失或是重要數(shù)據(jù)被篡改,伴隨著信息泄露等諸多情況,嚴(yán)重的則會(huì)造成計(jì)算機(jī)系統(tǒng)癱瘓,無法發(fā)揮其應(yīng)用功能,制約著計(jì)算機(jī)網(wǎng)絡(luò)的安全運(yùn)行。
計(jì)算機(jī)網(wǎng)絡(luò)病毒防御技術(shù)中的數(shù)據(jù)挖掘技術(shù)可謂是重要組成,此技術(shù)的應(yīng)用過程中主要對各項(xiàng)數(shù)據(jù)進(jìn)行歸類、分析與聚類,通過以上方式找尋網(wǎng)絡(luò)病毒數(shù)據(jù)的規(guī)律,在此基礎(chǔ)上對計(jì)算機(jī)網(wǎng)絡(luò)內(nèi)部病毒加以防御,切實(shí)提高自身的防御能力。所以,數(shù)據(jù)挖掘技術(shù)的應(yīng)用主要可分為三個(gè)步驟,首先為數(shù)據(jù)準(zhǔn)備,其次為尋找規(guī)律,最后為表示規(guī)律,以上三個(gè)環(huán)節(jié)都是極其重要的步驟,直接影響計(jì)算機(jī)防御的效果,接下來本文主要針對計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中數(shù)據(jù)挖掘技術(shù)的應(yīng)用相關(guān)問題進(jìn)行分析,詳見下述。
數(shù)據(jù)源模塊是數(shù)據(jù)挖掘技術(shù)應(yīng)用過程中的主要程序,其程序來源為抓包程序,數(shù)據(jù)源模塊的運(yùn)行過程中主要在網(wǎng)絡(luò)向主機(jī)系統(tǒng)發(fā)送數(shù)據(jù)的環(huán)節(jié)收集相關(guān)的數(shù)據(jù)包,并對數(shù)據(jù)包進(jìn)行分析。原始網(wǎng)絡(luò)數(shù)據(jù)包存在于數(shù)據(jù)源模塊之中,這也就意味著某個(gè)數(shù)據(jù)庫信息的數(shù)據(jù)結(jié)構(gòu)組處于數(shù)據(jù)源模塊之中。在程序獲取相關(guān)的數(shù)據(jù)信息后,將會(huì)直接進(jìn)入下一程序,通常為預(yù)處理模塊。
預(yù)處理模塊主要是將所抓取的數(shù)據(jù)包進(jìn)行預(yù)處理,這一階段為基礎(chǔ)階段,要求預(yù)處理模塊發(fā)揮自身的功能優(yōu)勢,對所抓取的數(shù)據(jù)信息進(jìn)行分析與轉(zhuǎn)化,通過有效的變化與識(shí)別,對數(shù)據(jù)信息進(jìn)行高效處理,保證數(shù)據(jù)處理效率,通過預(yù)處理的方式,可縮減數(shù)據(jù)處理時(shí)間,并保證數(shù)據(jù)分析效果。
規(guī)則庫模塊的應(yīng)用主要用來發(fā)現(xiàn)規(guī)則與尋找規(guī)則,將規(guī)則集聚集到一處,然后再分析計(jì)算機(jī)網(wǎng)絡(luò)病毒出現(xiàn)的常見特征,對這些特征進(jìn)行識(shí)別,從而有效的聚類分析,并對應(yīng)以相應(yīng)的數(shù)據(jù),并將與病毒相關(guān)的信息記錄與數(shù)據(jù)挖掘工作環(huán)節(jié),這樣即可對網(wǎng)絡(luò)系統(tǒng)中所潛在的病毒數(shù)據(jù)全面分析,日后的計(jì)算機(jī)網(wǎng)絡(luò)運(yùn)行過程中若出現(xiàn)類似的數(shù)據(jù)信息,那么意味著可能出現(xiàn)病毒,此時(shí)即可發(fā)揮規(guī)則庫模塊的作用,發(fā)出相應(yīng)的提醒,進(jìn)而起到病毒防御的效果。不僅如此,規(guī)則庫模塊的應(yīng)用還能對不同網(wǎng)絡(luò)病毒進(jìn)行鑒別,其聚類分析功能可以對不同的數(shù)據(jù)集做出標(biāo)記,首先將不同種類的數(shù)據(jù)集進(jìn)行分析,分組完畢后歸類成多組數(shù)據(jù),每組數(shù)據(jù)之間都有一定的差異,規(guī)則庫模塊借助數(shù)據(jù)組之間的差異,從而完成病毒鑒定,保證鑒定效果。
數(shù)據(jù)庫挖掘模塊的應(yīng)用過程中主要用來對挖掘的數(shù)據(jù)信息進(jìn)行匯總,通過有效的算法收集方式,對所挖掘的數(shù)據(jù)信息進(jìn)行整合,逐步形成完整的事件庫,事件庫中包含各類的病毒數(shù)據(jù),數(shù)據(jù)挖掘模塊將會(huì)對數(shù)據(jù)進(jìn)行分析而后傳輸給決策模塊,決策模塊將自行處理這部分?jǐn)?shù)據(jù)。簡而言之,數(shù)據(jù)挖掘模塊起到了數(shù)據(jù)傳送以及匯總、整合的效果,同時(shí)也是數(shù)據(jù)挖掘技術(shù)應(yīng)用的核心內(nèi)容,發(fā)揮了極其重要的作用。
該模塊更多的功能體現(xiàn)在數(shù)據(jù)挖掘結(jié)果的歸類方面,可自行分析規(guī)則庫中的主要規(guī)律,只有明確規(guī)則故障的規(guī)律方可掌握計(jì)算機(jī)各類病毒的主要特征。如若所挖掘的數(shù)據(jù)與最終的規(guī)則模塊相匹配,那也就意味著計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)中存在病毒,并提高重視。如若兩者未能匹配,仍舊存在異常,那么就要針對此現(xiàn)象發(fā)出警報(bào),進(jìn)一步發(fā)揮預(yù)防模塊的作用,并對新的異常情況進(jìn)行分析與記錄,經(jīng)過多項(xiàng)模塊的數(shù)據(jù)分析,若確定為新的計(jì)算機(jī)網(wǎng)絡(luò)病毒,那么則要將其納入到規(guī)則庫中,為日后的計(jì)算機(jī)網(wǎng)絡(luò)病毒防御提供保障。
序列分析在統(tǒng)計(jì)動(dòng)態(tài)數(shù)據(jù)處理中可謂是較為常見的分析方法,此方法的應(yīng)用過程中主要將隨機(jī)數(shù)據(jù)序列規(guī)律作為研究分析的重點(diǎn),在此基礎(chǔ)上搜索試驗(yàn)庫中所涵蓋的病毒數(shù)據(jù)相關(guān)的序列,而后再實(shí)施數(shù)據(jù)挖掘,分析重點(diǎn)并構(gòu)建序列模式模型,這一過程中將會(huì)有效利用數(shù)據(jù)挖掘算法,對常發(fā)生的時(shí)間序列進(jìn)行搜索。數(shù)據(jù)挖掘序列分析算法的應(yīng)用程序:若事件庫D交易T與時(shí)間戳間的關(guān)系較為密切,與此同時(shí),交易位于(t1,t2)的區(qū)間之內(nèi),并且,D中包含x、y、z,此時(shí)的序列規(guī)則即可表示為xy-}z,規(guī)則支持度為Support (x}JY}JZ),此時(shí)的置信度為support(X U Y U Z)。
關(guān)聯(lián)規(guī)則指的是某類數(shù)據(jù)中可能存在可以被發(fā)現(xiàn)的內(nèi)容,通常均在變量取值中體現(xiàn)了一定的規(guī)律,規(guī)律的存在表明這部分?jǐn)?shù)據(jù)之間存在密切的關(guān)系,同時(shí)聯(lián)系較為緊密。數(shù)據(jù)挖掘技術(shù)的應(yīng)用主要對數(shù)據(jù)間的關(guān)聯(lián)規(guī)則進(jìn)行分析,可將其分為時(shí)序關(guān)聯(lián)、簡單關(guān)聯(lián)與因果關(guān)聯(lián)等等,數(shù)據(jù)挖掘技術(shù)的應(yīng)用過程中需要對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析,而后再找尋數(shù)據(jù)之間的密切聯(lián)系,從中發(fā)現(xiàn)規(guī)律,在此基礎(chǔ)上逐步找出關(guān)聯(lián)間的關(guān)聯(lián)網(wǎng),進(jìn)而明確數(shù)據(jù)庫內(nèi)部全部數(shù)據(jù)的關(guān)聯(lián)規(guī)則,對不同的規(guī)則進(jìn)行分類,形成多組數(shù)據(jù)組,以供日后計(jì)算機(jī)網(wǎng)絡(luò)病毒防御的參考與借鑒。
聚類分析主要指的是對所獲得的數(shù)據(jù)包進(jìn)行分解,分解后形成不同的組別,每個(gè)組間都會(huì)存在許多相同點(diǎn)或不同點(diǎn),基于數(shù)據(jù)間的異同,對數(shù)據(jù)實(shí)時(shí)聚類分析,從中識(shí)別全部數(shù)據(jù)的分布疏密度,并對整體分布模式進(jìn)行觀察,從而了解每組數(shù)據(jù)的特征,以及數(shù)據(jù)之間所存在的關(guān)聯(lián)性。
異類分析也被稱作孤立點(diǎn)分析,異類分析主要分析數(shù)據(jù)庫內(nèi)較為突出的不同點(diǎn),也就是與其他數(shù)據(jù)偏離較大的數(shù)據(jù)信息,這部分?jǐn)?shù)據(jù)信息與常規(guī)數(shù)據(jù)的規(guī)模上存在極大偏差,可結(jié)合這一特性針對性的實(shí)施集聚分析,找尋其中的孤立點(diǎn),明確此孤立點(diǎn)是否與其他數(shù)據(jù)有密切的聯(lián)系,若不存在聯(lián)系,同時(shí)偏差較大,計(jì)算機(jī)網(wǎng)絡(luò)內(nèi)部也存在異常,那么極有可能這部分?jǐn)?shù)據(jù)為病毒數(shù)據(jù),應(yīng)提高警惕。
綜上所述,本文主要針對計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中數(shù)據(jù)挖掘技術(shù)的整合應(yīng)用相關(guān)問題進(jìn)行分析,首先闡述了網(wǎng)絡(luò)病毒的主要特征,表現(xiàn)在病毒種類多、傳播速度快、破壞性大等等,而后又針對計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行概述,最后探討了技術(shù)構(gòu)成與技術(shù)的整合應(yīng)用,希望本文首次分析可為有關(guān)的研究人士帶來借鑒與參考,發(fā)揮數(shù)據(jù)挖掘技術(shù)的應(yīng)用優(yōu)勢,進(jìn)而提高計(jì)算機(jī)網(wǎng)絡(luò)的病毒防御能力,減少網(wǎng)絡(luò)侵襲。