任遠(yuǎn)芳 牛坤 丁靜 謝剛



文章編號(hào)? 1000-5269(2024)01-0103-07
DOI:10.15958/j.cnki.gdxbzrb.2024.01.16
收稿日期:2023-05-10
基金項(xiàng)目:貴州省省級(jí)本科教學(xué)內(nèi)容和課程體系改革資助項(xiàng)目(2022&25);貴州省科技計(jì)劃資助項(xiàng)目(黔科合支撐[2023]一般371);貴州大學(xué)引進(jìn)人才科研項(xiàng)目(貴大人基合字2022[21])
作者簡介:任遠(yuǎn)芳(1987—),女,助理實(shí)驗(yàn)師,碩士,研究方向:多媒體教室、教育技術(shù)、信息安全,E-mail:835705116@qq.com.
*通訊作者:任遠(yuǎn)芳,E-mail:835705116@qq.com.
摘? 要:為改善信息安全風(fēng)險(xiǎn)評(píng)價(jià)的精確度,利用改進(jìn)的粒子群算法,提出了一種新的優(yōu)化回歸型支持向量機(jī)的信息安全風(fēng)險(xiǎn)評(píng)估方法。首先,通過模糊理論對(duì)信息安全風(fēng)險(xiǎn)因素進(jìn)行量化預(yù)處理;其次,經(jīng)過預(yù)處理后的數(shù)據(jù)輸入到回歸型支持向量機(jī)模型中;再次,利用改進(jìn)的粒子群算法來優(yōu)化和訓(xùn)練回歸型支持向量機(jī)的參數(shù),得到了優(yōu)化后的信息安全風(fēng)險(xiǎn)評(píng)估模型;最后,通過仿真實(shí)驗(yàn)對(duì)該模型的性能進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,提出的方法能很好地量化評(píng)估信息系統(tǒng)風(fēng)險(xiǎn),提高了信息安全風(fēng)險(xiǎn)評(píng)估的精確性,是一種有效的評(píng)估方法。
關(guān)鍵詞:信息安全;風(fēng)險(xiǎn)評(píng)估;模糊理論;回歸型支持向量機(jī);粒子群算法;參數(shù)優(yōu)化
中圖分類號(hào):TP309
文獻(xiàn)標(biāo)志碼:A
隨著網(wǎng)絡(luò)化和信息化的日益進(jìn)步,網(wǎng)絡(luò)安全事件層出不窮。2021年1月3日,國外安全團(tuán)隊(duì)cyble發(fā)現(xiàn)有人出售中國公民信息。緊接著,1月26日,巴西數(shù)據(jù)庫泄露。以上安全事件大都是違法分子利用一些系統(tǒng)的漏洞進(jìn)行入侵和攻擊所導(dǎo)致的。可見,如何保證網(wǎng)絡(luò)安全是長期以來的重要探討課題。近年來,針對(duì)網(wǎng)絡(luò)安全方面,新的法律法規(guī)、工作指南陸續(xù)發(fā)布。2021年8月,《中華人民共和國個(gè)人信息保護(hù)法》正式公布。2023年7月,中國信息安全測(cè)評(píng)中心發(fā)布了《安全可靠測(cè)評(píng)工作指南(試行)》。由此可見,做好安全事件的預(yù)防顯得尤其重要,也很有必要。信息安全風(fēng)險(xiǎn)評(píng)估是其中一種有效的預(yù)防方法。目前,對(duì)信息安全風(fēng)險(xiǎn)評(píng)估研究,引起了國內(nèi)外不少學(xué)者的關(guān)注,對(duì)此提出了眾多評(píng)估方法。最為人們所熟知的有模糊數(shù)學(xué)[1]、馬爾可夫鏈[2]、BP神經(jīng)網(wǎng)絡(luò)(BP neural network, BP-NN)[3]、小波神經(jīng)網(wǎng)絡(luò)[4]等方法。但是由于以上的風(fēng)險(xiǎn)評(píng)估具有非線性、不確定、小樣本等特性,如果只采用以上某一種模型,會(huì)存在局限性,導(dǎo)致出現(xiàn)了不少問題。如僅采用模糊數(shù)學(xué)等傳統(tǒng)的數(shù)學(xué)模型進(jìn)行評(píng)估,存在的問題有具有一定的局限性、缺乏自適應(yīng)、操作較繁瑣、缺乏自學(xué)習(xí)等。而神經(jīng)網(wǎng)絡(luò)雖然在非線性問題處理上有一定的優(yōu)勢(shì),但卻存在學(xué)習(xí)樣本多、易于陷入局部極小值、過擬合等缺點(diǎn)。通過引入支持向量機(jī)(support vector machine,SVM)[5],能夠很好地彌補(bǔ)神經(jīng)網(wǎng)絡(luò)的不足,SVM已成功地應(yīng)用于信息安全風(fēng)險(xiǎn)評(píng)估 [6]。因此,本文為了更好的對(duì)信息安全進(jìn)行評(píng)估,引入了回歸型支持向量機(jī)(support vector regression, SVR)。為了保證SVR的性能,必須對(duì)其參數(shù)選取嚴(yán)格把控。為了獲取精確的、適宜的參數(shù),又將引入了粒子群(particle swarm optimization, PSO)算法。這種算法本身的結(jié)構(gòu)較為簡單,收斂速度快,屬于智能搜索算法。與此同時(shí),也存在一些缺點(diǎn),比如過于早熟,容易陷入局部最值等。
鑒于此,為了能夠精確地、科學(xué)地對(duì)信息安全進(jìn)行評(píng)估,本文將模糊理論、改進(jìn)的PSO算法和SVR這三者的優(yōu)點(diǎn)相結(jié)合,提出了一種優(yōu)化的SVR的信息安全風(fēng)險(xiǎn)評(píng)估模型。并通過模擬仿真實(shí)驗(yàn),驗(yàn)證此模型的性能較好。實(shí)驗(yàn)結(jié)果表明,該模型能夠精確地評(píng)估信息安全的系統(tǒng)性風(fēng)險(xiǎn)。
1? 信息風(fēng)險(xiǎn)評(píng)估
信息安全風(fēng)險(xiǎn)評(píng)估是指通過分析信息系統(tǒng)受到的威脅,從而識(shí)別信息系統(tǒng)的脆弱性,綜合評(píng)估信息系統(tǒng)的風(fēng)險(xiǎn),并提出相應(yīng)的防護(hù)對(duì)策和整改措施[7]。信息安全風(fēng)險(xiǎn)評(píng)估主要包括資產(chǎn)識(shí)別、威脅識(shí)別和脆弱性識(shí)別三個(gè)基本要素。對(duì)信息系統(tǒng)進(jìn)行較為精確地安全風(fēng)險(xiǎn)評(píng)估時(shí),確定其風(fēng)險(xiǎn)等級(jí)的一個(gè)重要過程就是計(jì)算風(fēng)險(xiǎn)值。計(jì)算風(fēng)險(xiǎn)值(value at risk,Var)的公式如下:
Var=G(A,T,V)=G(L(T,V),F(xiàn)(Ia,Va))(1)
式中,G為信息安全風(fēng)險(xiǎn)的計(jì)算函數(shù);A為資產(chǎn);T 為威脅;V為脆弱性;L為威脅利用資產(chǎn)的脆弱性造成安全事件發(fā)生的可能性;F為安全事件發(fā)生后造成的損失程度;Ia為安全事件所作用的資產(chǎn)價(jià)值;Va為脆弱性的嚴(yán)重程度。
通過對(duì)公式(1)分析可以得知,G是一個(gè)復(fù)雜的函數(shù),反映的是非線性關(guān)系。信息安全風(fēng)險(xiǎn)值是信息風(fēng)險(xiǎn)評(píng)估的重要階段,對(duì)整個(gè)評(píng)估結(jié)果有重要影響。
2? 基于改進(jìn)PSO算法優(yōu)化SVR的信息安全風(fēng)險(xiǎn)評(píng)估模型
2.1? 輸入量的模糊處理
由于SVR只適宜處理定量數(shù)據(jù),無法處理定性數(shù)據(jù),而信息安全的風(fēng)險(xiǎn)因素具有主觀性、不易確定。將風(fēng)險(xiǎn)因素直接輸入SVR進(jìn)行學(xué)習(xí)和訓(xùn)練是不合適的。因此,本文要量化風(fēng)險(xiǎn)因素,可采用模糊理論對(duì)其做量化處理,將處理后的數(shù)據(jù)作為SVR的輸入。具體的實(shí)現(xiàn)步驟如下[8]:
1)建立影響信息系統(tǒng)的因素集合。對(duì)信息系統(tǒng)的資產(chǎn)、威脅和脆弱性展開分析,找出影響信息安全的風(fēng)險(xiǎn)因素。并將影響因素組成一個(gè)集合,即信息系統(tǒng)的影響因素集U={u1,u2,…,un}。
2)應(yīng)用德爾菲法進(jìn)行風(fēng)險(xiǎn)評(píng)價(jià)時(shí),必須對(duì)風(fēng)險(xiǎn)因素進(jìn)行分析,并將其分為m級(jí),評(píng)判集為V={v1,v2,…,vm}。
3)構(gòu)建隸屬度矩陣R。通過專家組成的評(píng)判小組評(píng)價(jià),根據(jù)專家意見,構(gòu)造出的模糊映射如下:
f:U→F(V)(2)
ui→f(ui)=(ri1,ri2,…rim)∈F(V)(3)
其中,f表示風(fēng)險(xiǎn)因素ui隸屬于某個(gè)評(píng)語的概率;F(V)表示評(píng)判集V上的全體模糊集。
假設(shè)風(fēng)險(xiǎn)因素ui對(duì)評(píng)判集V的隸屬向量為Ri={ri1,ri2,…,rim} (i=1,2,…,n)。由隸屬向量Ri可以求得隸屬度矩陣R。
4) 對(duì)評(píng)判集V中的各評(píng)價(jià)指標(biāo),賦不同的權(quán)重[9]。假設(shè)權(quán)重分配集為A={a1,a2,…,am},權(quán)重是按照評(píng)語的高低進(jìn)行分配,并且權(quán)重的總和為1,即∑mi=1ai=1。由模糊變換公式計(jì)算可以得到:
B=ART(4)
其中,B表示各信息安全風(fēng)險(xiǎn)因素在某一指標(biāo)下的權(quán)重,反映了風(fēng)險(xiǎn)因素的評(píng)價(jià)值,并且其值的大小處于(0,1)之間,可以作為SVR的輸入量。
2.2? 改進(jìn)后的PSO-SVR模型
2.2.1? SVR模型
支持向量機(jī)不僅能解決分類問題,而且能進(jìn)行回歸擬合等,具有廣泛的應(yīng)用前景。支持向量機(jī)是將 SVM用于回歸估計(jì)的一種方法。
支持向量機(jī)在回歸估計(jì)方面的應(yīng)用就是SVR模型。假設(shè)具有m個(gè)樣本的樣本數(shù)據(jù)集為{(xi, yi), i=1,2,…,m},其中,xi=[x1i,x2i,…,xki]T為第i個(gè)樣本的輸入列向量,yi為輸出值。SVR的基本原理是利用一種非線性映射(也就是輸入空間到輸出空間),把輸入數(shù)據(jù)x映射到高維特征空間E,然后進(jìn)行線性回歸。其線性回歸函數(shù)的公式如下:
f(x)=w·Φ(x)+b(5)
其中,b、w分別表示為偏置量、超平面的權(quán)值向量。一般情況下,SVR的損失函數(shù)為線性不靈敏損失函數(shù),其函數(shù)的表示如下:
Lε=f(x)-y-ε,f(x)-y≥ε
0,f(x)-y<ε (6)
其中,f(x)、y分別表示為回歸函數(shù)的預(yù)測(cè)值、真實(shí)值。
在回歸函數(shù)中,對(duì) w,b的估計(jì)可以通過使目標(biāo)函數(shù)最小化來獲得,其公式如下[10]:
min{12‖w‖2+C∑mi=1(ξi+ξ*i)}(7)
s.t.yi-w·Φ(x)-b≤ε+ξi
w·Φ(x)+b-yi≤ε+ξ*i
ξi≥0,ξ*i≥0(8)
其中,C表示懲罰因子。其值越大,即會(huì)對(duì)大于Lε的數(shù)據(jù)懲罰越大。ξi和ξ*i表示松弛變量,ε規(guī)定了回歸函數(shù)的誤差要求。
可引入拉格朗日函數(shù),將其轉(zhuǎn)化為對(duì)偶形式,如下所示:
max[-12∑mi=1∑mj=1(αi-α*i)(αj-α*j)K(xi,xj)-
∑mi=1(αi+α*i)ε+∑mi=1(αi-α*i)yi](9)
s.t.∑mi=1(αi-α*i)=00≤αi≤C0≤α*i≤C (10)
其中,K(xi, xj)表示核函數(shù);αi和α*i表示拉格朗日乘子。
根據(jù)如上的對(duì)偶計(jì)算公式,可求得回歸函數(shù),如下:
f(x)=∑mi=1(αi-α*i)K(xi,x)+b(11)
在SVR模型中,其泛化能力、預(yù)測(cè)精密度與選擇的參數(shù)密切相關(guān)。參數(shù)優(yōu)化本身就是一個(gè)不斷尋找優(yōu)化解的過程,可采用群智能優(yōu)化模型對(duì)參數(shù)進(jìn)行優(yōu)化,由此得到SVR模型的最優(yōu)參數(shù)。本文構(gòu)建的SVR模型包含的參數(shù)屬于徑向基核函數(shù)的一部分,其中懲罰因子C和核參數(shù)σ對(duì)該模型的影響最為重要。通過參數(shù)優(yōu)化,尋求最佳參數(shù),并將優(yōu)化后的模型用于評(píng)估信息安全風(fēng)險(xiǎn)程度,以提高評(píng)估的精確性。
2.2.2? PSO算法
PSO算法[11]是由Kennedy 、Eberhart 提出的優(yōu)化算法。這個(gè)算法主要是用來求解最優(yōu)化問題的,它的基本原理是群智理論,其基本思路為將待求解的問題設(shè)為一組解,并將其描述為一組粒子,以每組粒子中的每個(gè)粒子為一種可行解。每個(gè)粒子的極值Pbest代表它所經(jīng)過的最佳位置,即尋找到的最優(yōu)解。粒子群體全局極值Gbest代表當(dāng)前整個(gè)粒子群中最好的粒子位置,也就是當(dāng)前群發(fā)現(xiàn)的最優(yōu)解,粒子在所求解的空間內(nèi)作運(yùn)動(dòng),通過追蹤Pbest和Gbest來更新個(gè)體的位置,每一次粒子的位置發(fā)生變化,都需要計(jì)算出相應(yīng)的適應(yīng)度,將計(jì)算出的新粒子與Pbest、Gbest這三個(gè)適應(yīng)度值相比較并更新Pbest和Gbest。粒子i更新速度和位置的公式如下:
vij(t+1)=wvij(t)+c1R1(pij(t)-xij(t))+c2R2(pgj(t)-xij(t)) (12)
xij(t+1)=xij(t)+vij(t+1)(13)
其中,i = (1, 2,…,n);j = (1, 2,…,D);n表示粒子的個(gè)數(shù);D表示搜索空間的維數(shù);vij表示粒子的速度;xij表示粒子的位置;w表示慣性權(quán)重,為常數(shù);c1和c2表示學(xué)習(xí)因子;R1和R2為[0, 1]之間的隨機(jī)數(shù);pi表示粒子i的最佳位置,pg表示整個(gè)群體中所有粒子i的最佳位置。
2.2.3? 優(yōu)化后的SVR參數(shù)
標(biāo)準(zhǔn)PSO算法存在一定的缺陷,一是容易出現(xiàn)過于早熟且收斂;二是非常容易陷入局部的最優(yōu)解。為了解決該算法的以上問題,需改進(jìn)PSO算法。通過遺傳算法中的交叉操作可以讓后代粒子繼承雙親粒子的優(yōu)點(diǎn),增強(qiáng)對(duì)粒子間的區(qū)域搜索能力。而遺傳算法的變異操作則可以增加粒子的多樣性,可以使粒子避免早熟收斂,能夠更好地找到全局最優(yōu)解。為此,本文將遺傳算法的交叉操作以及變異操作引入到PSO算法中,對(duì)PSO算法進(jìn)行改進(jìn)。采用改進(jìn)的PSO算法對(duì)SVR的參數(shù)進(jìn)行優(yōu)化選擇,構(gòu)建改進(jìn)的PSO-SVR模型。并將該模型應(yīng)用于信息安全風(fēng)險(xiǎn)評(píng)估。
改進(jìn)的PSO算法優(yōu)化SVR參數(shù)的具體實(shí)現(xiàn)步驟如下:
1) 初始化。首先,隨機(jī)產(chǎn)生 M個(gè)粒子,其中每一個(gè)粒子都包含C、σ這兩個(gè)參數(shù)。假設(shè)需求解的總體樣本集(即種群),簡稱為U。需初始化如下參數(shù):粒子的初始速度vi;粒子的初始位置xi;算法的最大迭代次數(shù)N;收斂精度δ。
2) 對(duì)每個(gè)粒子進(jìn)行解碼,并將其用作SVR的訓(xùn)練參數(shù),進(jìn)行學(xué)習(xí),訓(xùn)練樣本。最終求出各粒子的適應(yīng)度,它的適應(yīng)度函數(shù),是一個(gè)與所有樣本量的誤差平方和倒數(shù)的線性函數(shù)。如公式(14)所示。由此可知,若誤差較小,那么相應(yīng)的適應(yīng)度值就較大,即適應(yīng)性就較好。
F=k∑Hi=1(ti-yi)2+d(14)
其中,F(xiàn)為適應(yīng)度函數(shù);k、d都為常數(shù);H為樣本的個(gè)數(shù);yi表示為SVR的預(yù)測(cè)風(fēng)險(xiǎn)值;ti表示為實(shí)際的風(fēng)險(xiǎn)評(píng)估值。
3) 種群每次更新后,求出粒子群的平均適應(yīng)度值Favg,如公式(15)所示。將適應(yīng)度值大于或者等于Favg的適應(yīng)度值求平均得到F′avg。將適應(yīng)度值小于Favg的適應(yīng)度值求平均得到F″avg。將種群U分成3份。適應(yīng)度值大于或者等于F′avg的粒子為子種群U1,適應(yīng)度值小于F′avg并且大于或者等于F″avg的粒子為子種群U2,適應(yīng)度值小于F″avg的粒子為子種群U3。
Favg=1M∑Mi=1Fi(15)
4) 引入遺傳算法的操作。由于子種群U1具有較優(yōu)的適應(yīng)度,使用公式(12)和公式(13)來更新粒子的速度和位置。通過應(yīng)用遺傳算法,對(duì)子種群U2進(jìn)行交叉操作,隨機(jī)地進(jìn)行兩兩交叉配對(duì),同時(shí)利用交叉概率pc來進(jìn)行交叉操作。
5) 對(duì)粒子i和粒子j的速度進(jìn)行交叉操作的公式如下:
vi(t+1)=θ1×vi(t)+(1-θ1)×vj(t)vj(t+1)=(1-θ1)×vi(t)+θ1×vj(t) (16)
對(duì)粒子i和粒子j的位置進(jìn)行交叉操作的公式如下:
xi(t+1)=θ2×xi(t)+(1-θ2)×xj(t)xj(t+1)=(1-θ2)×xi(t)+θ2×xj(t) (17)
其中,θ1和θ2為[0, 1]之間的隨機(jī)值。經(jīng)交叉操作后,將子代和父代的粒子的適應(yīng)度進(jìn)行對(duì)比,選擇適應(yīng)度較高的粒子進(jìn)行后續(xù)迭代。對(duì)于適應(yīng)度較差的子種群U3,利用變異概率pm對(duì)其進(jìn)行變異操作。
6) 更新個(gè)體極值與群體全局極值。經(jīng)過步驟4)的操作后,將計(jì)算出的新粒子與Pbest、Gbest的適合度值進(jìn)行對(duì)比。當(dāng)新粒子比Pbest的適應(yīng)度更好時(shí),就會(huì)對(duì)原Pbest進(jìn)行更新,并對(duì)Pbest進(jìn)行優(yōu)先位置賦值。
7) 進(jìn)行重復(fù)迭代。重復(fù)上述步驟2)到步驟5),直至下列條件得到滿足(即目標(biāo)函數(shù)達(dá)到收斂精度δ或者迭代次數(shù)達(dá)到預(yù)設(shè)的最大次數(shù)N),結(jié)束迭代。通過以上多次訓(xùn)練,就可得到SVR的最優(yōu)參數(shù)。
綜上所述,基于改進(jìn)的PSO算法優(yōu)化SVR信息安全風(fēng)險(xiǎn)評(píng)估流程圖,如圖1所示。
3? 仿真實(shí)驗(yàn)與結(jié)果分析
3.1? 數(shù)據(jù)選樣及預(yù)處理
本論文以MATLAB R2009a為軟件平臺(tái),應(yīng)用 lib svm工具箱函數(shù),對(duì)SVR模型進(jìn)行構(gòu)建、訓(xùn)練和仿真。為了獲得更好的比較評(píng)估效果,通過BP-NN、SVM、PSO-SVR和改進(jìn)的PSO-SVR評(píng)估模型,分別進(jìn)行信息安全風(fēng)險(xiǎn)評(píng)估。模型的評(píng)價(jià)指標(biāo)為平均相對(duì)誤差。平均相對(duì)誤差定義如下:
ARE=1l∑li=1ti-yiyi(18)
其中,l為測(cè)試樣本的個(gè)數(shù);yi表示為第i個(gè)樣本的實(shí)際評(píng)估值;ti表示為第i個(gè)樣本的預(yù)測(cè)值。平均相對(duì)誤差值越小,說明模型的預(yù)測(cè)誤差越小,預(yù)測(cè)精度越高,評(píng)估的準(zhǔn)確性越高。
本文實(shí)驗(yàn)收集60個(gè)信息系統(tǒng)的評(píng)估案例。選取未授權(quán)訪問(X1)、數(shù)據(jù)泄露(X2)、信息篡改(X3)、信息丟失(X4)、拒絕服務(wù)(X5)、系統(tǒng)功能崩潰(X6)作為信息系統(tǒng)的風(fēng)險(xiǎn)因素。每個(gè)因素的風(fēng)險(xiǎn)值是經(jīng)過上述的模糊理論處理得到的。系統(tǒng)的風(fēng)險(xiǎn)評(píng)估值是對(duì)信息系統(tǒng)進(jìn)行綜合評(píng)估得到的。以下實(shí)驗(yàn)數(shù)據(jù)(其中各因素值四舍五入,取一位小數(shù)顯示在表格中;評(píng)估值取四位小數(shù))是運(yùn)用模糊理論進(jìn)行預(yù)處理得到的,其具體步驟是[8]:
Step1:構(gòu)建影響信息系統(tǒng)的影響因素集為U={X1,X2,X3,X4,X5,X6}
Step2:由專家進(jìn)行評(píng)價(jià),結(jié)合所有專家的評(píng)語,將專家意見分為五個(gè)等級(jí),即{ 較低(0.0~0.2),低(0.2~0.4),中(0.4~0.6),高(0.6~0.8),較高(0.8~1.0)} ,簡稱為{LL,L,M,H,HH}。其中,數(shù)值大小(例如0.0~0.2)表示該因素的風(fēng)險(xiǎn)程度,數(shù)值越大風(fēng)險(xiǎn)越大。由5位經(jīng)驗(yàn)極其豐富的專家對(duì)以上各指標(biāo)評(píng)分,最終得到以下的評(píng)分情況,如表1所示。
Step3:根據(jù)表1得到評(píng)估指標(biāo)的隸屬度矩陣D。
D=0.1? 0.2? 0.3? 0.20.4? 0.3? 0.5? 0.30.2? 0.4? 0.5? 0.20.3? 0.2? 0.4? 0.20.2? 0.2? 0.3? 0.10.2? 0.3? 0.2? 0.0
Step4:對(duì)評(píng)判集中的每個(gè)指標(biāo)賦予權(quán)重值,將評(píng)價(jià)向量數(shù)量化。根據(jù)相關(guān)資料[12],構(gòu)建權(quán)重分配集
A=[925,725,525,325,125]。由式(2) ,得到風(fēng)險(xiǎn)評(píng)價(jià)值B=[0.2,0.3,0.4,0.2,0.4]。
Step5:對(duì)本實(shí)驗(yàn)的所有原始數(shù)據(jù)都進(jìn)行如上處理,最終得到本文的實(shí)驗(yàn)數(shù)據(jù)。表2為訓(xùn)練樣本數(shù)據(jù)其中的5組樣本數(shù)據(jù)。
Step6:采用6個(gè)風(fēng)險(xiǎn)因素的風(fēng)險(xiǎn)值作為輸入變量,系統(tǒng)的風(fēng)險(xiǎn)評(píng)估值作為輸出變量。將收集到的60組樣本數(shù)據(jù)分為訓(xùn)練樣本集和測(cè)試樣本集。選取前面55組數(shù)據(jù)作為訓(xùn)練樣本集,后面5組數(shù)據(jù)作為測(cè)試樣本集。其中,測(cè)試樣本數(shù)據(jù)如表3所示。
3.2? 參數(shù)設(shè)置
在本文實(shí)驗(yàn)中,SVR模型的核函數(shù)為徑向基核函數(shù),其公式如下:
K(x,xi)=exp(-‖x-xi‖2σ2)(19)
SVR具體類型為ε-SVR。設(shè)置損失函數(shù)的值為0.01。懲罰因子C的取值范圍為[0.1,100],核參數(shù)σ的取值范圍為[0.01,10]。
BP-NN采用輸入層(6個(gè)節(jié)點(diǎn)數(shù)),隱含層(11個(gè)節(jié)點(diǎn)數(shù)),輸出層(1個(gè)節(jié)點(diǎn)數(shù))的網(wǎng)絡(luò)結(jié)構(gòu)。動(dòng)量項(xiàng)系數(shù)η=0.7,學(xué)習(xí)率μ=0.01。隱含層、輸出層這兩層的傳遞函數(shù)分別為Sigmoid型正切函數(shù)tansig、purelin函數(shù)。
PSO算法的種群數(shù)量M=40,學(xué)習(xí)因子c1=1.5,c2=1.6,慣性權(quán)重w=0.7,最大迭代次數(shù)N=200。改進(jìn)的PSO算法中交叉操作使用的交叉概率pc=0.4,變異操作使用的變異的概率pm=0.06。
3.3? 實(shí)驗(yàn)結(jié)果分析
在 SVR中輸入訓(xùn)練樣本集合,再利用PSO算法及改進(jìn)的PSO算法對(duì)這些樣本進(jìn)行訓(xùn)練,得到最佳的優(yōu)化參數(shù)(如表4所示)。最后分別采用BP-NN、SVM、PSO-SVR和改進(jìn)的PSO-SVR評(píng)估模型,對(duì)5組試驗(yàn)樣本集數(shù)據(jù)進(jìn)行檢驗(yàn)。各模型的仿真結(jié)果、相對(duì)誤差比較,分別詳見表5、表6。
從表5和表6的仿真結(jié)果比較可得出以下結(jié)論,相比BP-NN、SVM、PSO-SVR評(píng)估模型,本文采用的改進(jìn)的PSO-SVR評(píng)估模型的平均相對(duì)誤差MAPE分別減小了55.11%、46.86%、24.76%。由此表明,改進(jìn)后的 PSO-SVR評(píng)估模型不但降低了對(duì)風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果的預(yù)測(cè)誤差,而且還提高了對(duì)風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果的預(yù)測(cè)精度和準(zhǔn)確性。
4? 結(jié)束語
本文使用改進(jìn)的PSO算法優(yōu)化SVR,提出一種基于改進(jìn)PSO算法優(yōu)化SVR的信息安全風(fēng)險(xiǎn)評(píng)估方法,并引入信息安全風(fēng)險(xiǎn)數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)驗(yàn)證。仿真實(shí)驗(yàn)結(jié)果表明,該評(píng)估方法能很好地評(píng)估信息系統(tǒng)風(fēng)險(xiǎn),能較好地預(yù)測(cè)風(fēng)險(xiǎn)。這種方法不但提高了信息安全風(fēng)險(xiǎn)評(píng)估的精確性,而且在一定程度上預(yù)防了潛在的信息安全風(fēng)險(xiǎn),降低了網(wǎng)絡(luò)攻擊帶來的損失。
參考文獻(xiàn):
[1]孫德紅, 王慧, 解姍姍. 模糊數(shù)學(xué)計(jì)算的信息安全風(fēng)險(xiǎn)評(píng)估模型研究[J]. 九江學(xué)院學(xué)報(bào)(自然科學(xué)版), 2018, 33(1): 64-68.
[2] 李鶴田, 劉云, 何德全. 基于Markov鏈的信息安全風(fēng)險(xiǎn)評(píng)估模型[J]. 鐵道學(xué)報(bào), 2007, 29(2): 50-53.
[3] 李森宇. 基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的信息安全風(fēng)險(xiǎn)評(píng)估方法研究[D]. 徐州: 中國礦業(yè)大學(xué), 2018.
[4] 馮雪峰, 龔軍, 呂小毅. 模糊神經(jīng)網(wǎng)絡(luò)信息安全風(fēng)險(xiǎn)評(píng)估方法在信息系統(tǒng)中的應(yīng)用[J]. 現(xiàn)代計(jì)算機(jī)(專業(yè)版), 2018(24): 50-54.
[5] LIN S W,YING K C,CHEN S C, et al. Particle swarm optimization for parameter determination and feature selection of support vector machines[J]. Expert Systems with Applications, 2008, 35(4): 1817-1824.
[6] 黨德鵬, 孟真. 基于支持向量機(jī)的信息安全風(fēng)險(xiǎn)評(píng)估[J]. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010, 38(3): 46-49.
[7] 阮慧, 黨德鵬. 基于RBF模糊神經(jīng)網(wǎng)絡(luò)的信息安全風(fēng)險(xiǎn)評(píng)估[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2011, 32(6): 2113-2115.
[8] 王鑫, 唐作其, 許碩. 基于模糊理論和BRBPNN的信息安全風(fēng)險(xiǎn)評(píng)估[J]. 計(jì)算機(jī)仿真, 2019, 36(11): 184-189.
[9] ZHAO D, WANG C, MA J F. A risk assessment method of the wireless network security[J]. Journal of Electronics, 2007, 24(3): 428-432.
[10]吳景龍, 楊淑霞, 劉承水. 基于遺傳算法優(yōu)化參數(shù)的支持向量機(jī)短期負(fù)荷預(yù)測(cè)方法[J]. 中南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2009, 40(1): 180-184.
[11]紀(jì)震, 廖惠連, 吳青華. 粒子群優(yōu)化算法及應(yīng)用[M]. 北京:科學(xué)出版社, 2009.
[12]陳曼英. 基于模糊理論的地鐵火災(zāi)風(fēng)險(xiǎn)評(píng)估及控制研究[D]. 泉州: 華僑大學(xué), 2013.
(責(zé)任編輯:于慧梅)
Research on Risk Assessment of Information Security Based on
SVR Optimized by Improved PSO Algorithm
REN Yuanfang*1, NIU Kun2, DING Jing3, XIE Gang4
(1.Network and Information Management Center, Guizhou University, Guiyang 550025, China; 2.Academic Affairs Office of
Guizhou University, Guiyang 550025, China; 3.School of Computer Science and Technology, Guizhou University, Guiyang 550025, China;4.Guizhou Sida Wisdom Education Technology Co., Ltd.,Guiyang 550025, China)
Abstract:
To improve the accuracy of information security risk assessment, a method of information security risk assessment based on support vector regression (SVR) optimized by improved particle swarm optimizatio (PSO) algorithm is proposed. First, the indexes of information security risk factors are pre-treated by fuzzy theory, and the pre-treated data is inputted to the SVR model. Then, the improved PSO algorithm is used to optimize the parameters of SVR. Moreover, the SVR model is trained and an optimized information security risk assessment model is obtained. Finally, the performance of the model is verified by the simulation experiment. The experimental results show that the risk of information security can be better quantified and the accuracy of information security risk assessment is increased by the proposed method. So, the method is an effective method.
Key words:
information security; risk assessment; fuzzy theory; support vector regression; particle swarm optimization algorithm; parameter optimization