鄭 輝
(安徽工業(yè)經(jīng)濟(jì)職業(yè)技術(shù)學(xué)院 計(jì)算機(jī)與藝術(shù)學(xué)院,安徽 合肥 230051)
計(jì)算機(jī)的發(fā)展讓網(wǎng)絡(luò)的入侵也開始向大規(guī)模和多層次方向發(fā)展,這對(duì)人們的財(cái)產(chǎn)安全十分不利.這時(shí),該如何預(yù)測(cè)網(wǎng)絡(luò)在入侵下病毒的傳播方向就成為了需要解決的問題[1].通過對(duì)大規(guī)模的網(wǎng)絡(luò)入侵下病毒的傳播方向進(jìn)行預(yù)測(cè)并以模型的方式呈現(xiàn)受到大家的普遍關(guān)注,而且方法也很多[2-3].
殷守軍[4]提出了一種用于確定病毒在大規(guī)模入侵過程中的傳播方向的模型,通過與模糊推理方法相結(jié)合,利用模糊方法對(duì)收集到的網(wǎng)絡(luò)病毒的傳播方向進(jìn)行劃分,選擇高概率網(wǎng)絡(luò)入侵病毒的傳播方向,通過概率推理方法,首先對(duì)網(wǎng)絡(luò)病毒在網(wǎng)絡(luò)入侵過程中的傳播方式是如何退出的進(jìn)行模糊分類,然后對(duì)網(wǎng)絡(luò)入侵病毒在網(wǎng)絡(luò)中的傳播方向進(jìn)行篩選,從而得出網(wǎng)絡(luò)入侵病毒從一個(gè)方向向另一個(gè)方向傳播的狀態(tài)轉(zhuǎn)移概率值,通過建立網(wǎng)絡(luò)入侵過程中病毒在網(wǎng)絡(luò)中的傳播方向預(yù)測(cè)模型,提高網(wǎng)絡(luò)入侵檢測(cè)的準(zhǔn)確性;針對(duì)傳統(tǒng)艦船網(wǎng)絡(luò)安全防護(hù)下入侵病毒檢測(cè)性能差的問題,莫裕清[5]提出了一種檢測(cè)和防范入侵病毒的研究方法,通過對(duì)收集到的網(wǎng)絡(luò)傳播信息進(jìn)行編碼,對(duì)其進(jìn)行稀疏自編碼,用神經(jīng)網(wǎng)絡(luò)算法對(duì)入侵病毒進(jìn)行檢測(cè),再聚類提取其特征,建立入侵病毒的防御模型,從而保護(hù)艦船網(wǎng)絡(luò)不受入侵病毒的干擾,實(shí)驗(yàn)表明,通過對(duì)入侵病毒的檢測(cè)和防御,可以較傳統(tǒng)方法提高31個(gè)百分點(diǎn)的防御效果,從而達(dá)到更好的防御效果.基于以上背景,本文設(shè)計(jì)了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型,從而提高復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散的預(yù)測(cè)精度.
在對(duì)復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒進(jìn)行擴(kuò)散預(yù)測(cè)過程中,先確定復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵意圖,建立入侵意圖攻擊行為集函數(shù).在此基礎(chǔ)上,估計(jì)復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒的擴(kuò)散方程,基于擴(kuò)散方程構(gòu)建了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型.
假設(shè)在復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下提取到的病毒擴(kuò)散特征為fi,得到復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下病毒擴(kuò)散的狀態(tài)為
(1)
其中,Mi表示每一個(gè)病毒擴(kuò)散特征的權(quán)值系數(shù),confi表示復(fù)雜網(wǎng)絡(luò)入侵下病毒擴(kuò)散狀態(tài)的觀察序列,需要滿足i=1,2,3,4…的條件.
復(fù)雜網(wǎng)絡(luò)入侵病毒擴(kuò)散轉(zhuǎn)移概率計(jì)算公式為

(2)
其中,ε表示復(fù)雜網(wǎng)絡(luò)入侵病毒擴(kuò)散被觀測(cè)的概率.
根據(jù)以上過程得出的結(jié)論,構(gòu)建復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型.
為了提高復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)精度,定義了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵攻擊行為[6],制定了網(wǎng)絡(luò)入侵攻擊計(jì)劃,獲取到復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵意圖.先定義復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵行為,即
(3)
其中,Xi和Xj分別表示i時(shí)刻和j時(shí)刻的網(wǎng)絡(luò)入侵攻擊行為,W{Xi,Xj}表示i時(shí)刻和j時(shí)刻的網(wǎng)絡(luò)入侵攻擊行為之間存在的因果關(guān)系,d″wergv表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵行為的類型集合,j′jkl表示有效的網(wǎng)絡(luò)入侵攻擊計(jì)劃權(quán)重.

(4)
其中,p′werkk表示復(fù)雜網(wǎng)絡(luò)中每一個(gè)攻擊節(jié)點(diǎn)的獨(dú)立性分布情況,d′dfg表示復(fù)雜網(wǎng)絡(luò)入侵行為的隨機(jī)變量集r′wert的聯(lián)合概率分布.
令復(fù)雜網(wǎng)絡(luò)主動(dòng)式攻擊之間的因果關(guān)系權(quán)重為η′sd[7],那么獲取到復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵意圖為
(5)
其中,s′sde表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵行為在相鄰時(shí)刻內(nèi)的條件概率,v′fhj表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散的聯(lián)合概率分布,h′hjk表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵行為在節(jié)點(diǎn)變量上的轉(zhuǎn)移概率,k′kl表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵行為的類型權(quán)重.
在復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)過程中,引入Deep Belief Nets理論定義了復(fù)雜網(wǎng)絡(luò)主動(dòng)式攻擊行為,通過制定復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵攻擊計(jì)劃,得到復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵意圖,確定了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵意圖攻擊行為集函數(shù).
在復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵的影響下,計(jì)算機(jī)病毒擴(kuò)散過程都是以非線性的形式存在的,而不具有擴(kuò)散疊加特征[8].采用傳統(tǒng)的評(píng)估模型[9],估計(jì)復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程,無法界定復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵強(qiáng)度,也會(huì)導(dǎo)致復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程的估計(jì)誤差較大[10],具體過程如下
Step1:計(jì)算復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵因子,描述復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵的具體情況,計(jì)算公式為
(6)
其中,x1和y1表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵行為的初始特征向量,x2和y2表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵行為改變后的特征向量,n表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵次數(shù),h表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵的特征系數(shù).
Step2:計(jì)算復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程估計(jì)系數(shù),描述復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程的預(yù)測(cè)狀態(tài),計(jì)算公式為
(7)
其中,i表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵的次數(shù)序號(hào).
Step3:計(jì)算復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程估計(jì)系數(shù)的預(yù)測(cè)準(zhǔn)確率,公式為
(8)
以上三個(gè)步驟可以預(yù)測(cè)復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程系數(shù),實(shí)現(xiàn)復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程的估計(jì),在復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵的影響下,病毒擴(kuò)散過程具有不可控制的擴(kuò)散性和隨機(jī)性[11],傳統(tǒng)的病毒擴(kuò)散過程評(píng)估模型無法在復(fù)雜網(wǎng)絡(luò)建模中界定復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵強(qiáng)度,由于無法預(yù)判復(fù)雜網(wǎng)絡(luò)的主動(dòng)式入侵強(qiáng)度,假設(shè)入侵強(qiáng)度一直處于一定的閾值和時(shí)間內(nèi),導(dǎo)致復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程的估計(jì)結(jié)果存在誤差.
在構(gòu)建復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型過程中,以復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程的評(píng)估結(jié)果為依據(jù),利用概率推理的方式[12],計(jì)算復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒在擴(kuò)散過程中的狀態(tài)轉(zhuǎn)移概率值,基于此,構(gòu)建復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型.

(9)
其中,pj表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程中的初始狀態(tài)概率分布值,pR表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下的病毒擴(kuò)散隨機(jī)變量.
令復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下病毒擴(kuò)散的轉(zhuǎn)移函數(shù)為W,計(jì)算公式為
(10)

在復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型構(gòu)建過程中,假設(shè)D1和D2表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下病毒擴(kuò)散預(yù)測(cè)樣本的補(bǔ)償系數(shù),xmax表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下病毒擴(kuò)散依存的最大經(jīng)驗(yàn)權(quán)值,xmin表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下病毒擴(kuò)散依存的最小經(jīng)驗(yàn)權(quán)值,如果在有限的時(shí)間內(nèi),復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下病毒擴(kuò)散的條件概率變化過程對(duì)方向集合是平穩(wěn)的[14],那么得到復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散的聯(lián)合分布概率為
(11)
其中,itermax表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵下病毒擴(kuò)散的觀察函數(shù),利用公式(11)計(jì)算復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散的目標(biāo)函數(shù),公式為
(12)
其中,Z(t)表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒在t時(shí)刻的擴(kuò)散方向[15],pa表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒的擴(kuò)散狀態(tài)集合,p表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒的擴(kuò)散方向集合,Z(t-1)表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散狀態(tài)Y(t-1)的新方向.
將復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型的訓(xùn)練集表示為
(13)
其中,X(t)表示復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散狀態(tài)集函數(shù).
如果Z(t-1)決定著Z(t),那么構(gòu)建復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散狀態(tài)的轉(zhuǎn)移公式為
(14)

根據(jù)以上過程推導(dǎo),構(gòu)建了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型,表示為
(15)
具體算法流程如圖1所示.

圖1 復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)流程
綜上所述,通過確定復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵意圖攻擊行為集函數(shù),估計(jì)了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程,以復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程的評(píng)估結(jié)果為依據(jù),構(gòu)建了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型,實(shí)現(xiàn)了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散的預(yù)測(cè).
為了驗(yàn)證提出的復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型是有效的,模擬Internet環(huán)境下的子網(wǎng),盡量在不同局域網(wǎng)內(nèi)進(jìn)行實(shí)驗(yàn),并選擇35臺(tái)電腦對(duì)外開放通信地址.為了減輕病毒對(duì)計(jì)算機(jī)的危害,選擇VBS腳本病毒進(jìn)行實(shí)驗(yàn).實(shí)驗(yàn)硬件環(huán)境:AMD Ryzen 7 5800X 3.8GHz 處理器,8 GB內(nèi)存空間.實(shí)驗(yàn)軟件環(huán)境:Windows 10操作系統(tǒng),MATLAB R2019a.實(shí)驗(yàn)數(shù)據(jù)集采用復(fù)雜網(wǎng)絡(luò)中的NSL-KDD數(shù)據(jù)集,為實(shí)驗(yàn)測(cè)試提供了一個(gè)網(wǎng)絡(luò)連接數(shù)據(jù).在數(shù)據(jù)集中隨機(jī)抽取部分?jǐn)?shù)據(jù)作為訓(xùn)練樣本與測(cè)試樣本,其中訓(xùn)練集正常記錄數(shù)為3672,攻擊記錄數(shù)為2045;測(cè)試集正常記錄數(shù)為3673,攻擊記錄數(shù)為2261.基于上述實(shí)驗(yàn)環(huán)境,分別引入文獻(xiàn)[4]的預(yù)測(cè)模型和文獻(xiàn)[5]的預(yù)測(cè)模型,從精確度、時(shí)間效率和預(yù)測(cè)誤差三個(gè)方面進(jìn)行實(shí)驗(yàn)測(cè)試.
三個(gè)病毒擴(kuò)散預(yù)測(cè)模型的精確度和時(shí)間效率測(cè)試結(jié)果如表1所示.

表1 結(jié)果統(tǒng)計(jì)
從表1的結(jié)果可以看出,采用本文設(shè)計(jì)的復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型在精確度和時(shí)間效率兩個(gè)方面的有效性,明顯高于其他兩個(gè)病毒擴(kuò)散預(yù)測(cè)模型,原因是本文設(shè)計(jì)的復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型在預(yù)測(cè)之前,確定了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵意圖攻擊行為集函數(shù),通過復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散狀態(tài)轉(zhuǎn)移的計(jì)算,從而提高了模型的有效性.
三個(gè)病毒擴(kuò)散預(yù)測(cè)模型的預(yù)測(cè)誤差測(cè)試結(jié)果如圖2所示.

圖2 預(yù)測(cè)誤差測(cè)試結(jié)果
從圖2的結(jié)果可以看出,采用本文設(shè)計(jì)的復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型在誤差率上,遠(yuǎn)遠(yuǎn)低于其他兩個(gè)病毒擴(kuò)散預(yù)測(cè)模型,原因是本文設(shè)計(jì)的病毒擴(kuò)散預(yù)測(cè)模型,針對(duì)入侵病毒在擴(kuò)散過程中具有不確定性,推理出擴(kuò)散過程中的狀態(tài)轉(zhuǎn)移概率值,保證了該模型在復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)中的精確度.
本文提出了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型,通過確定復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵意圖攻擊行為集函數(shù),估計(jì)了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程,以復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散過程的評(píng)估結(jié)果為依據(jù),構(gòu)建了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散預(yù)測(cè)模型,實(shí)現(xiàn)了復(fù)雜網(wǎng)絡(luò)主動(dòng)式入侵病毒擴(kuò)散的預(yù)測(cè).結(jié)果顯示,該預(yù)測(cè)模型具有更高的精度.