胡凱波,於立峰,鄭美芬,崔 娜
(浙江浙能蘭溪發(fā)電有限責(zé)任公司,浙江 金華 321100)
智能電網(wǎng)的深度融合,提升了電網(wǎng)的整體調(diào)度能力和效率。但伴隨5G、人工智能和大量終端設(shè)備接入,信息物理融合系統(tǒng)(Cyber-Physical System,CPS)網(wǎng)絡(luò)的安全風(fēng)險也在不斷增加。由于CPS由感知層、傳輸層和應(yīng)用層構(gòu)成,所以針對CPS的攻擊類型復(fù)雜多樣,如虛假數(shù)據(jù)注入攻擊(False Data Injection Attacks,F(xiàn)DIA)[1]、拒絕服務(wù)攻擊[2]、傳感器欺騙攻擊[3]、重放攻擊[4]以及惡意軟件訪問隱私數(shù)據(jù)攻擊[5]等。在以上攻擊類型中,以FDIA攻擊最為常見,破壞性最強(qiáng)。攻擊者篡改傳感器量測數(shù)據(jù),或刪除量測數(shù)據(jù),造成決策系統(tǒng)發(fā)出錯誤決策,進(jìn)而嚴(yán)重威脅CPS網(wǎng)絡(luò)安全。針對CPS的虛假數(shù)據(jù)注入攻擊,王電鋼[6]、王羽[7]等從博弈論的角度就攻防過程進(jìn)行建模,并構(gòu)建防御策略,以提高CPS網(wǎng)絡(luò)的安全性;阮兆文[8]等針對FDIA攻擊中的數(shù)據(jù)篡改問題,提出一種基于聚類算法與狀態(tài)預(yù)測的檢測方法,該方法的本質(zhì)是基于狀態(tài)估計;陳碧云[9]、劉鑫蕊[10]等則針對量測冗余度低給CPS帶來的威脅問題,提出自適應(yīng)無跡卡爾曼濾波動態(tài)估計結(jié)合神經(jīng)網(wǎng)絡(luò)的攻擊檢測方法,結(jié)果顯示可有效提高攻擊檢測的辨識率;魏書珩等[11]也提出一種基于狀態(tài)估計的FDIA攻擊檢測方法。以上研究都是從數(shù)據(jù)篡改給CPS網(wǎng)絡(luò)帶來的穩(wěn)定性、安全性影響方面進(jìn)行分析,進(jìn)而躲避傳統(tǒng)攻擊檢測機(jī)制中的攻擊向量設(shè)計問題。針對攻擊向量設(shè)計的假設(shè),使攻防兩方對CPS網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、傳感器量測分布等均知曉,但實(shí)際中電網(wǎng)企業(yè)會采取各種攻擊防護(hù)措施,因此不可能完全知曉網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和量測分布,很難建立攻擊模型。同時研究認(rèn)為,電網(wǎng)節(jié)點(diǎn)和攻擊向量都呈正態(tài)分布[12]。基于該分布特性,結(jié)合攻擊者惡意注入的攻擊向量和系統(tǒng)采集數(shù)據(jù),提出一種基于高斯混合模型結(jié)合機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)攻擊檢測方法,并就該方法的正確率等進(jìn)行驗(yàn)證。
GMM原理如圖1所示。該模型是基于一個概率密度函數(shù),即設(shè)全部數(shù)據(jù)點(diǎn)X={x1,x2,...,xN}為同一密度函數(shù)中獨(dú)立抽樣得到的,且該概率密度函數(shù)為高斯函數(shù)的組合,具體表達(dá)式為[14]
式(1)中,ωm表示數(shù)據(jù)點(diǎn)xi產(chǎn)生于第i個高斯成員的先驗(yàn)概率,,且?m=1,…,K;G(xi;μm,∑m)為高維高斯函數(shù)。
根據(jù)式(1),只需根據(jù)觀測的數(shù)據(jù)點(diǎn),求解式(1)中的參數(shù)ΘK,其中Θm={αm,μm,∑m}。由此,根據(jù)以上描述,就將無監(jiān)督學(xué)習(xí)問題直接轉(zhuǎn)換為概率中的參數(shù)估計問題。而針對參數(shù)估計問題,通常采用極大似然估計方法。
實(shí)踐認(rèn)為,F(xiàn)DIA檢測算法精度受狀態(tài)估計精度的影響[15]。但狀態(tài)估計的精度受兩方面影響:一是攻擊向量的攻擊強(qiáng)度。一般來說,檢測算法對攻擊強(qiáng)度較大的攻擊向量更具敏感性;二是檢測閾值。該值通常是根據(jù)經(jīng)驗(yàn)設(shè)定,它對于檢測算法精度起到關(guān)鍵影響。由于電力系統(tǒng)節(jié)點(diǎn)的電壓服從高斯分布,因而攻擊構(gòu)造的虛假數(shù)據(jù)注入攻擊向量也服從高斯分布。在最優(yōu)潮流條件的約束下,電網(wǎng)節(jié)點(diǎn)電壓狀態(tài)數(shù)據(jù)分布較為集中,而攻擊向量卻較為分散。據(jù)此,除要構(gòu)造2種不同的高斯分布外,還要引用高斯混合模型。考慮到智能電網(wǎng)未受攻擊和遭受攻擊的傳感器量測數(shù)據(jù)分別服從不同的高斯分布,因此采用高斯混合模型對兩組量測數(shù)據(jù)的分布特征進(jìn)行擬合。基于高斯混合模型聚類的FDIA檢測流程如圖2所示。首先,根據(jù)遭受攻擊前后的傳感器量測數(shù)據(jù)分布特征,利用采集的最優(yōu)潮流數(shù)據(jù),構(gòu)造正負(fù)樣本數(shù)據(jù),然后利用訓(xùn)練集數(shù)據(jù)對GMM參數(shù)進(jìn)行訓(xùn)練,獲得優(yōu)化后的GMM參數(shù);利用測試樣本數(shù)據(jù)對GMM分類效果進(jìn)行檢驗(yàn),看是否可準(zhǔn)確識別虛假數(shù)據(jù)注入攻擊;最后,通過仿真實(shí)驗(yàn)對構(gòu)建的攻擊檢測效果進(jìn)行驗(yàn)證。
依據(jù)智能電網(wǎng)節(jié)點(diǎn)電壓和攻擊向量服從正態(tài)分布的規(guī)律,將所有的量測數(shù)據(jù)分為正常和異常,這兩種數(shù)據(jù)分別屬于不同的高斯分量,同時通過這兩個高斯分量構(gòu)成高斯混合模型。設(shè)某時刻的測量向量服從多維度的高斯分布,那么測量序列為
將測量序列構(gòu)造為高斯混合模型,通過K個高斯分布向量加權(quán)求和,得到
式中,pi(x)表示高斯混合模型的各個分量;ωi表示各分量所對應(yīng)的加權(quán)系數(shù);xn(t)表示D維傳感器測量的特征矢量。
pi(x)根據(jù)高維高斯函數(shù),可表示為
由于高斯混合模型的各分量相互獨(dú)立,所以可用對角矩陣的形式來表示協(xié)方差矩陣。
對式(5)進(jìn)行整理,得到
式(6)中,d={1,2,…,D}。
利用傳感器樣本數(shù)據(jù)對GMM進(jìn)行訓(xùn)練,即利用EM算法對各個分量模型參數(shù)進(jìn)行估計,從而獲得一組最優(yōu)的GMM參數(shù)。具體求解步驟如下所示:
(1)建立完整樣本集似然函數(shù)。
(2)對似然函數(shù)的期望進(jìn)行求解。
將式(8)展開,則有
(3)計算使似然函數(shù)取得最大值的混合模型參數(shù)。
特征向量屬于第l個隱狀態(tài)的概率為
由此根據(jù)式(10),確定加權(quán)系數(shù)、均值、方差等參數(shù)。
通過以上計算,得到GMM的最優(yōu)參數(shù),并在最優(yōu)參數(shù)下,對測試的量測數(shù)據(jù)進(jìn)行分類。
在構(gòu)建的GMM基礎(chǔ)上,將待檢測數(shù)據(jù)最大后驗(yàn)概率設(shè)定為判別準(zhǔn)則,然后利用軟分類法對測量值進(jìn)行檢測,以達(dá)到檢測分類的目的。因此,設(shè)智能電網(wǎng)中的K個檢測量所對應(yīng)的高斯模型參數(shù)依次是λ1,λ2,…,λk-1,λk,待檢測數(shù)據(jù)特征向量Z=(z1,z2,…,zT-1,zT)屬于第i個高斯分量的后驗(yàn)概率為
測量矢量的最大后驗(yàn)概率密度函數(shù)為
根據(jù)最大后驗(yàn)概率密度,對測量矢量進(jìn)行歸類。其中,i*表示該測量屬于第i個高斯分量。由于測量矢量屬于某一高斯分量的先驗(yàn)概率是未知的,因此需進(jìn)行初始化,假定先驗(yàn)概率是相同的,由此,式(15)可表示為
利用最大對數(shù)似然函數(shù)進(jìn)行求解。取對數(shù)似然函數(shù),則有
最終分類的判別準(zhǔn)則為
利用式(18)的判別準(zhǔn)則,對待檢測數(shù)據(jù)進(jìn)行歸類,實(shí)現(xiàn)正常數(shù)據(jù)與虛假數(shù)據(jù)的分離,從而達(dá)到攻擊檢測的目的。
為驗(yàn)證上述檢測方法的準(zhǔn)確性,在IEEE-18節(jié)點(diǎn)測試系統(tǒng)上搭建仿真驗(yàn)證平臺,用以驗(yàn)證本文提出的基于GMM的FDIA檢測效果。同時為對比GMM的優(yōu)劣,將SVM算法與GMM算法進(jìn)行對比。
參考部分研究成果,分別以TP、TN、FP、FN表示真陽性、真陰性、假陽性、假陰性,然后采用Accuracy進(jìn)行評價。若訓(xùn)練樣本數(shù)據(jù)中包含同等數(shù)量的未受攻擊和遭受攻擊數(shù)據(jù),此時的檢測準(zhǔn)確率為
3.2.1 基本數(shù)據(jù)
以IEEE-18節(jié)點(diǎn)系統(tǒng)為例,該系統(tǒng)內(nèi)置17條支路和18個節(jié)點(diǎn),包含節(jié)點(diǎn)注入功率、支路端口功率、母線節(jié)點(diǎn)電壓幅值等多個測量值。其中,IEEE-18系統(tǒng)母線節(jié)點(diǎn)注入功率如表1所示。

表1 IEEE-18系統(tǒng)的母線節(jié)點(diǎn)注入功率Tab.1 Bus node input power of IEEE-18 system
在現(xiàn)實(shí)場景中,由于智能電網(wǎng)處于動態(tài)平衡狀態(tài),發(fā)電量與負(fù)荷調(diào)配都會對系統(tǒng)節(jié)點(diǎn)參數(shù)造成影響。因此本次仿真將最小成本設(shè)定為目標(biāo)函數(shù),由此得到節(jié)點(diǎn)的最優(yōu)潮流。另外結(jié)合電力系統(tǒng)量測方程,將疊加方差等于R的測量噪聲設(shè)為傳感器量測數(shù)據(jù),并利用Matpower計算狀態(tài)向量。在不同攻擊強(qiáng)度條件下生成攻擊向量,并疊加到傳感器的量測數(shù)據(jù)中,用作傳感器在智能電網(wǎng)遭受攻擊時所采集的數(shù)據(jù)。同時設(shè)定攻擊樣本數(shù)據(jù)與未受攻擊樣本數(shù)據(jù)均為300個。利用樣本數(shù)據(jù)對高斯混合模型進(jìn)行訓(xùn)練,其中攻擊強(qiáng)度等于測量值的50%,正常測量向量與非正常測量向量的協(xié)方差矩陣分別為
3.2.2 GMM訓(xùn)練結(jié)果
GMM參數(shù)估計結(jié)果如表2所示。

表2 GMM參數(shù)估計結(jié)果Tab.2 Estimation results of GMM parameters
由表2可見,IEEE-18系統(tǒng)節(jié)點(diǎn)電壓呈遞增態(tài)勢,因此攻擊值也表現(xiàn)出遞增趨勢。在量測數(shù)據(jù)統(tǒng)計特性一致的情況下,在節(jié)點(diǎn)3以后的混合模型權(quán)值均超過了0.5。
3.2.3 分類結(jié)果
利用訓(xùn)練后的GMM參數(shù),并依據(jù)準(zhǔn)則對樣本數(shù)據(jù)進(jìn)行分類,在節(jié)點(diǎn)8以后的聚類效果如圖3所示。
由圖3的分類可見,訓(xùn)練后的GMM能夠?qū)颖緮?shù)據(jù)完全分離開。為更好地驗(yàn)證該模型,提高量測數(shù)據(jù)之間的離散度,改變狀態(tài)協(xié)方差矩陣對角元素的數(shù)量,設(shè)定攻擊向量和未受攻擊測量值的數(shù)量均為5000個,利用訓(xùn)練后的高斯混合模型對疊加后的樣本數(shù)據(jù)進(jìn)行分類,得到圖4的分類結(jié)果。
由圖4可見,本文提出的檢測成功完成了測試集數(shù)據(jù)的聚類,并且準(zhǔn)確檢測出壞數(shù)據(jù)。
3.2.4 IEEE-18系統(tǒng)下不同算法的對比
對比基于高斯混合模型的檢測方法與基于支持向量機(jī)的檢測效果,從而驗(yàn)證本檢測方法的優(yōu)勢,對比結(jié)果如圖5所示。
由圖5-6可見,兩種檢測算法在不同的攻擊強(qiáng)度條件下表現(xiàn)出大體相當(dāng)?shù)臋z測準(zhǔn)確性,但若兼顧測量值的統(tǒng)計特性,可發(fā)現(xiàn)基于高斯混合模型的檢測算法在檢測精度方面具有更優(yōu)性能。
通過以上研究可以看出,通過構(gòu)建GMM,實(shí)現(xiàn)了智能電網(wǎng)的虛擬數(shù)據(jù)注入攻擊檢測,且大幅度提高了檢測的精度。而通過仿真也看出,GMM的檢測精度,受攻擊強(qiáng)度和協(xié)方差矩陣的影響。因此,要提高GMM分類的精度,關(guān)鍵要對以上參數(shù)進(jìn)行優(yōu)化。