基于虛假數(shù)據(jù)注入攻擊的網(wǎng)絡(luò)安全檢測

2022-08-02 09:25:48胡凱波於立峰鄭美芬

系統(tǒng)仿真技術(shù) 2022年1期

胡凱波，於立峰，鄭美芬，崔娜

（浙江浙能蘭溪發(fā)電有限責(zé)任公司，浙江金華 321100）

智能電網(wǎng)的深度融合，提升了電網(wǎng)的整體調(diào)度能力和效率。但伴隨5G、人工智能和大量終端設(shè)備接入，信息物理融合系統(tǒng)（Cyber-Physical System，CPS）網(wǎng)絡(luò)的安全風(fēng)險也在不斷增加。由于CPS由感知層、傳輸層和應(yīng)用層構(gòu)成，所以針對CPS的攻擊類型復(fù)雜多樣，如虛假數(shù)據(jù)注入攻擊（False Data Injection Attacks，F(xiàn)DIA）［1］、拒絕服務(wù)攻擊［2］、傳感器欺騙攻擊［3］、重放攻擊［4］以及惡意軟件訪問隱私數(shù)據(jù)攻擊［5］等。在以上攻擊類型中，以FDIA攻擊最為常見，破壞性最強(qiáng)。攻擊者篡改傳感器量測數(shù)據(jù)，或刪除量測數(shù)據(jù)，造成決策系統(tǒng)發(fā)出錯誤決策，進(jìn)而嚴(yán)重威脅CPS網(wǎng)絡(luò)安全。針對CPS的虛假數(shù)據(jù)注入攻擊，王電鋼［6］、王羽［7］等從博弈論的角度就攻防過程進(jìn)行建模，并構(gòu)建防御策略，以提高CPS網(wǎng)絡(luò)的安全性；阮兆文［8］等針對FDIA攻擊中的數(shù)據(jù)篡改問題，提出一種基于聚類算法與狀態(tài)預(yù)測的檢測方法，該方法的本質(zhì)是基于狀態(tài)估計；陳碧云［9］、劉鑫蕊［10］等則針對量測冗余度低給CPS帶來的威脅問題，提出自適應(yīng)無跡卡爾曼濾波動態(tài)估計結(jié)合神經(jīng)網(wǎng)絡(luò)的攻擊檢測方法，結(jié)果顯示可有效提高攻擊檢測的辨識率；魏書珩等［11］也提出一種基于狀態(tài)估計的FDIA攻擊檢測方法。以上研究都是從數(shù)據(jù)篡改給CPS網(wǎng)絡(luò)帶來的穩(wěn)定性、安全性影響方面進(jìn)行分析，進(jìn)而躲避傳統(tǒng)攻擊檢測機(jī)制中的攻擊向量設(shè)計問題。針對攻擊向量設(shè)計的假設(shè)，使攻防兩方對CPS網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、傳感器量測分布等均知曉，但實(shí)際中電網(wǎng)企業(yè)會采取各種攻擊防護(hù)措施，因此不可能完全知曉網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和量測分布，很難建立攻擊模型。同時研究認(rèn)為，電網(wǎng)節(jié)點(diǎn)和攻擊向量都呈正態(tài)分布［12］。基于該分布特性，結(jié)合攻擊者惡意注入的攻擊向量和系統(tǒng)采集數(shù)據(jù)，提出一種基于高斯混合模型結(jié)合機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)攻擊檢測方法，并就該方法的正確率等進(jìn)行驗(yàn)證。

1 高斯混合模型（Gaussian Mixture Model，GMM）

GMM原理如圖1所示。該模型是基于一個概率密度函數(shù)，即設(shè)全部數(shù)據(jù)點(diǎn)X={x1，x2，...，xN}為同一密度函數(shù)中獨(dú)立抽樣得到的，且該概率密度函數(shù)為高斯函數(shù)的組合，具體表達(dá)式為［14］

式（1）中，ωm表示數(shù)據(jù)點(diǎn)xi產(chǎn)生于第i個高斯成員的先驗(yàn)概率，，且?m=1，…，K；G(xi；μm，∑m)為高維高斯函數(shù)。

根據(jù)式（1），只需根據(jù)觀測的數(shù)據(jù)點(diǎn)，求解式（1）中的參數(shù)ΘK，其中Θm={αm，μm，∑m}。由此，根據(jù)以上描述，就將無監(jiān)督學(xué)習(xí)問題直接轉(zhuǎn)換為概率中的參數(shù)估計問題。而針對參數(shù)估計問題，通常采用極大似然估計方法。

2 基于高斯混合模型的FDIA檢測模型構(gòu)建

2.1 攻擊檢測模型整體流程

實(shí)踐認(rèn)為，F(xiàn)DIA檢測算法精度受狀態(tài)估計精度的影響［15］。但狀態(tài)估計的精度受兩方面影響：一是攻擊向量的攻擊強(qiáng)度。一般來說，檢測算法對攻擊強(qiáng)度較大的攻擊向量更具敏感性；二是檢測閾值。該值通常是根據(jù)經(jīng)驗(yàn)設(shè)定，它對于檢測算法精度起到關(guān)鍵影響。由于電力系統(tǒng)節(jié)點(diǎn)的電壓服從高斯分布，因而攻擊構(gòu)造的虛假數(shù)據(jù)注入攻擊向量也服從高斯分布。在最優(yōu)潮流條件的約束下，電網(wǎng)節(jié)點(diǎn)電壓狀態(tài)數(shù)據(jù)分布較為集中，而攻擊向量卻較為分散。據(jù)此，除要構(gòu)造2種不同的高斯分布外，還要引用高斯混合模型。考慮到智能電網(wǎng)未受攻擊和遭受攻擊的傳感器量測數(shù)據(jù)分別服從不同的高斯分布，因此采用高斯混合模型對兩組量測數(shù)據(jù)的分布特征進(jìn)行擬合。基于高斯混合模型聚類的FDIA檢測流程如圖2所示。首先，根據(jù)遭受攻擊前后的傳感器量測數(shù)據(jù)分布特征，利用采集的最優(yōu)潮流數(shù)據(jù)，構(gòu)造正負(fù)樣本數(shù)據(jù)，然后利用訓(xùn)練集數(shù)據(jù)對GMM參數(shù)進(jìn)行訓(xùn)練，獲得優(yōu)化后的GMM參數(shù)；利用測試樣本數(shù)據(jù)對GMM分類效果進(jìn)行檢驗(yàn)，看是否可準(zhǔn)確識別虛假數(shù)據(jù)注入攻擊；最后，通過仿真實(shí)驗(yàn)對構(gòu)建的攻擊檢測效果進(jìn)行驗(yàn)證。

2.2 GMM具體構(gòu)建

依據(jù)智能電網(wǎng)節(jié)點(diǎn)電壓和攻擊向量服從正態(tài)分布的規(guī)律，將所有的量測數(shù)據(jù)分為正常和異常，這兩種數(shù)據(jù)分別屬于不同的高斯分量，同時通過這兩個高斯分量構(gòu)成高斯混合模型。設(shè)某時刻的測量向量服從多維度的高斯分布，那么測量序列為

將測量序列構(gòu)造為高斯混合模型，通過K個高斯分布向量加權(quán)求和，得到

式中，pi(x)表示高斯混合模型的各個分量；ωi表示各分量所對應(yīng)的加權(quán)系數(shù)；xn(t)表示D維傳感器測量的特征矢量。

pi(x)根據(jù)高維高斯函數(shù)，可表示為

由于高斯混合模型的各分量相互獨(dú)立，所以可用對角矩陣的形式來表示協(xié)方差矩陣。

對式（5）進(jìn)行整理，得到

式（6）中，d={1，2，…，D}。

2.3 GMM參數(shù)估計

利用傳感器樣本數(shù)據(jù)對GMM進(jìn)行訓(xùn)練，即利用EM算法對各個分量模型參數(shù)進(jìn)行估計，從而獲得一組最優(yōu)的GMM參數(shù)。具體求解步驟如下所示：

（1）建立完整樣本集似然函數(shù)。

（2）對似然函數(shù)的期望進(jìn)行求解。

將式（8）展開，則有

（3）計算使似然函數(shù)取得最大值的混合模型參數(shù)。

特征向量屬于第l個隱狀態(tài)的概率為

由此根據(jù)式（10），確定加權(quán)系數(shù)、均值、方差等參數(shù)。

通過以上計算，得到GMM的最優(yōu)參數(shù)，并在最優(yōu)參數(shù)下，對測試的量測數(shù)據(jù)進(jìn)行分類。

2.4 虛假數(shù)據(jù)注入攻擊檢測分類準(zhǔn)則

在構(gòu)建的GMM基礎(chǔ)上，將待檢測數(shù)據(jù)最大后驗(yàn)概率設(shè)定為判別準(zhǔn)則，然后利用軟分類法對測量值進(jìn)行檢測，以達(dá)到檢測分類的目的。因此，設(shè)智能電網(wǎng)中的K個檢測量所對應(yīng)的高斯模型參數(shù)依次是λ1，λ2，…，λk-1，λk，待檢測數(shù)據(jù)特征向量Z=(z1，z2，…，zT-1，zT)屬于第i個高斯分量的后驗(yàn)概率為

測量矢量的最大后驗(yàn)概率密度函數(shù)為

根據(jù)最大后驗(yàn)概率密度，對測量矢量進(jìn)行歸類。其中，i*表示該測量屬于第i個高斯分量。由于測量矢量屬于某一高斯分量的先驗(yàn)概率是未知的，因此需進(jìn)行初始化，假定先驗(yàn)概率是相同的，由此，式（15）可表示為

利用最大對數(shù)似然函數(shù)進(jìn)行求解。取對數(shù)似然函數(shù)，則有

最終分類的判別準(zhǔn)則為

利用式（18）的判別準(zhǔn)則，對待檢測數(shù)據(jù)進(jìn)行歸類，實(shí)現(xiàn)正常數(shù)據(jù)與虛假數(shù)據(jù)的分離，從而達(dá)到攻擊檢測的目的。

3 仿真驗(yàn)證

3.1 仿真平臺與檢測評價指標(biāo)

為驗(yàn)證上述檢測方法的準(zhǔn)確性，在IEEE-18節(jié)點(diǎn)測試系統(tǒng)上搭建仿真驗(yàn)證平臺，用以驗(yàn)證本文提出的基于GMM的FDIA檢測效果。同時為對比GMM的優(yōu)劣，將SVM算法與GMM算法進(jìn)行對比。

參考部分研究成果，分別以TP、TN、FP、FN表示真陽性、真陰性、假陽性、假陰性，然后采用Accuracy進(jìn)行評價。若訓(xùn)練樣本數(shù)據(jù)中包含同等數(shù)量的未受攻擊和遭受攻擊數(shù)據(jù)，此時的檢測準(zhǔn)確率為

3.2 IEEE-18節(jié)點(diǎn)系統(tǒng)檢測結(jié)果

3.2.1 基本數(shù)據(jù)

以IEEE-18節(jié)點(diǎn)系統(tǒng)為例，該系統(tǒng)內(nèi)置17條支路和18個節(jié)點(diǎn)，包含節(jié)點(diǎn)注入功率、支路端口功率、母線節(jié)點(diǎn)電壓幅值等多個測量值。其中，IEEE-18系統(tǒng)母線節(jié)點(diǎn)注入功率如表1所示。

表1 IEEE-18系統(tǒng)的母線節(jié)點(diǎn)注入功率Tab.1 Bus node input power of IEEE-18 system

在現(xiàn)實(shí)場景中，由于智能電網(wǎng)處于動態(tài)平衡狀態(tài)，發(fā)電量與負(fù)荷調(diào)配都會對系統(tǒng)節(jié)點(diǎn)參數(shù)造成影響。因此本次仿真將最小成本設(shè)定為目標(biāo)函數(shù)，由此得到節(jié)點(diǎn)的最優(yōu)潮流。另外結(jié)合電力系統(tǒng)量測方程，將疊加方差等于R的測量噪聲設(shè)為傳感器量測數(shù)據(jù)，并利用Matpower計算狀態(tài)向量。在不同攻擊強(qiáng)度條件下生成攻擊向量，并疊加到傳感器的量測數(shù)據(jù)中，用作傳感器在智能電網(wǎng)遭受攻擊時所采集的數(shù)據(jù)。同時設(shè)定攻擊樣本數(shù)據(jù)與未受攻擊樣本數(shù)據(jù)均為300個。利用樣本數(shù)據(jù)對高斯混合模型進(jìn)行訓(xùn)練，其中攻擊強(qiáng)度等于測量值的50%，正常測量向量與非正常測量向量的協(xié)方差矩陣分別為

3.2.2 GMM訓(xùn)練結(jié)果

GMM參數(shù)估計結(jié)果如表2所示。

表2 GMM參數(shù)估計結(jié)果Tab.2 Estimation results of GMM parameters

由表2可見，IEEE-18系統(tǒng)節(jié)點(diǎn)電壓呈遞增態(tài)勢，因此攻擊值也表現(xiàn)出遞增趨勢。在量測數(shù)據(jù)統(tǒng)計特性一致的情況下，在節(jié)點(diǎn)3以后的混合模型權(quán)值均超過了0.5。

3.2.3 分類結(jié)果

利用訓(xùn)練后的GMM參數(shù)，并依據(jù)準(zhǔn)則對樣本數(shù)據(jù)進(jìn)行分類，在節(jié)點(diǎn)8以后的聚類效果如圖3所示。

由圖3的分類可見，訓(xùn)練后的GMM能夠?qū)颖緮?shù)據(jù)完全分離開。為更好地驗(yàn)證該模型，提高量測數(shù)據(jù)之間的離散度，改變狀態(tài)協(xié)方差矩陣對角元素的數(shù)量，設(shè)定攻擊向量和未受攻擊測量值的數(shù)量均為5000個，利用訓(xùn)練后的高斯混合模型對疊加后的樣本數(shù)據(jù)進(jìn)行分類，得到圖4的分類結(jié)果。

由圖4可見，本文提出的檢測成功完成了測試集數(shù)據(jù)的聚類，并且準(zhǔn)確檢測出壞數(shù)據(jù)。

3.2.4 IEEE-18系統(tǒng)下不同算法的對比

對比基于高斯混合模型的檢測方法與基于支持向量機(jī)的檢測效果，從而驗(yàn)證本檢測方法的優(yōu)勢，對比結(jié)果如圖5所示。

由圖5-6可見，兩種檢測算法在不同的攻擊強(qiáng)度條件下表現(xiàn)出大體相當(dāng)?shù)臋z測準(zhǔn)確性，但若兼顧測量值的統(tǒng)計特性，可發(fā)現(xiàn)基于高斯混合模型的檢測算法在檢測精度方面具有更優(yōu)性能。

4 結(jié) 語

通過以上研究可以看出，通過構(gòu)建GMM，實(shí)現(xiàn)了智能電網(wǎng)的虛擬數(shù)據(jù)注入攻擊檢測，且大幅度提高了檢測的精度。而通過仿真也看出，GMM的檢測精度，受攻擊強(qiáng)度和協(xié)方差矩陣的影響。因此，要提高GMM分類的精度，關(guān)鍵要對以上參數(shù)進(jìn)行優(yōu)化。