羅 康,鈕 焱,李 軍
(湖北工業大學 計算機學院,湖北 武漢 430068)
基于SCM-ANFIS的網絡節點資源風險評估
羅 康,鈕 焱,李 軍
(湖北工業大學 計算機學院,湖北 武漢 430068)
隨著互聯網應用的逐漸深入,一旦網絡癱瘓將會造成巨大的經濟損失,網絡安全問題成為重點關注的問題。本文提出了一種利用自適應模糊推理系統(ANFIS)對網絡節點資源的風險評估模型。將網絡行為劃分為正常行為和攻擊行為,通過網絡資源如流量、CPU、磁盤、內存資源占有率的變化分析出網絡節點資源的風險等級,并且獲得了較好的準確度。實驗結果表明基于減法聚類的自適應模糊推理系統(SCM-ANFIS)模型是一種較好的網絡節點資源風險評估模型。
ANFIS;網絡安全;網絡行為;網絡風險
網絡節點資源風險是指由于網絡存在的脆弱性、人為等因素導致網絡安全事件發生的可能性及可能對網絡節點資源造成的嚴重影響[1]。網絡節點資源風險評估就是對網絡節點資源發生緊張或崩潰的可能性進行的一種概率評測。傳統的網絡風險評估方法有概率統計[2]、信息熵[3]、貝葉斯攻擊圖的定量評估[4]、依據證據推理的網絡安全態勢評估[5]等,但這些方法往往缺乏及時性、時效性低且計算復雜。例如基于貝葉斯攻擊圖的定量評估方法計算過于復雜。由于網絡節點資源風險評估的復雜性、非線性、不確定性和時效性高等特點,采用傳統的網絡節點資源風險評估方法存在一定的局限性,評價方法帶有較大的主觀隨意性和模糊性,在操作上比較復雜,并且缺乏自學習能力。而自適應模糊推理系統(Adaptive Neuro Fuzzy Inference System,ANFIS)具備常規方法所不具備的智能特性,可以處理不確定性問題,且具有自學習和獲取知識的能力,適宜處理非線性問題。李鵬程等人為了解決如何降低人因失誤風險問題,提出了基于ANFIS的人因失誤風險嚴重度識別[6],文中利用影響失誤風險嚴重度的HEP(人因失誤概率)、EEP(失誤影響概率)和ECS(失誤后果嚴重度)三大因素作為度量失誤風險程度的標準,該模型克服了專家判斷的主觀性、模糊性和不確定性等缺陷,使人因風險評價更加符合實際情況。陳安輝在碩士畢業論文中提出了基于GA-ANFIS的股指預測研究模型[7],利用影響股指變化的因素作為股指預測模型的輸入參數,較好的預測出股指的變化。網絡節點資源風險受到流量、CPU、磁盤及內存等的影響,符合ANFIS模型的使用條件,鑒于ANFIS所具有的優點,本文通過自適應模糊推理系統(ANFIS)模型評估網絡行為對網絡節點資源產生的風險等級,以便及時有效維護和保障網絡的安全。
ANFIS是源于T-S(Tune Sugeno)模型的一種神經模糊推理系統[8],模型將輸入變量進行線性重組來作為輸出變量。
ANFIS模型基本過程為,首先設定模型的輸入層的輸入個數為 2,輸出層輸出個數為 1,相對一階 Sugeno類型的模糊系統[9],其推理方式可以表示為:
Rule1:若 a為 M1,并且 b為 N1,則 s1= p1a+q1b + u1;
Rule2:若a為M2,并且 b為N2,則 s2= p2a+q2b + u2;
上述表達方程中,a及b是指變量,Mi及Ni是指語言變量值,pi及 qi是指結論參數,si是指第 i個推理的結果。
典型的兩變量輸入模糊推理系統用圖 1來描述,由上圖可以看出,模糊推理系統模型有五層,同一層的各節點都具有相似的功能。

圖1 ANFIS結構Fig.1 The structure of ANFIS
第1層為輸入層,將輸入數據對象變量模糊化,輸出模糊集隸屬度,隸屬度函數通常采用鐘型函數,如公式(1)所示。O1,i指Mi及Ni的隸屬函數類型,Mi及Ni為模糊集,它們取決于連接點i的隸屬類型。

第2層計算每條模糊規則的適應度,連接點用∏來表示,通常采用乘法計算模糊規則的適應度,如下公式表示:

模糊推理層的任意節點的作用是進行模糊推理,可以用它對模糊規則的前件進行配對。第一步是對任意推理規則的適應值Wi進行運算,第二步是計算模糊集合,并且取集合中最大值為連接權系數。
第3層的節點數與第2層相同,歸一化模糊規則的適應度值。歸一化層在圖1可以用字母k表達,其計算方法用如下公式表示:

第4層產生模糊推理規則,每個節點的傳遞函數是線性函數。在第四層中任意節點 i是指自適應節點,其輸出值是:

式(4)中,p1,q1,u1稱為結論參數。
第5層的作用是計算所有規則的輸出總和,進行加權平均計算該層總的輸出結果作為最后輸出,用Σ表示:

ANFIS的系統結構屬于一個具有多個網絡層的前向網絡[11,12],任意兩層間的連接權值能夠通過對所給數據對象進行不斷自適應調節,ANFIS網絡結構參數學習采用混合學習算法:在前向傳遞過程中,輸入不同網絡行為對網絡資源節點產生影響的數據之后,通過各層節點函數對數據進行計算從而得到各層網絡每個節點的輸出結果,然后利用線性最小二乘估計來進行模糊規則后件的結論參數進行辨識,從而得出每一組輸入數據的輸出誤差;在網絡反向傳遞過程中,采用梯度下降法將輸出誤差從輸出節點反向傳入輸入節點,同時不斷調整模糊規則所屬隸屬度函數的參數。循環往復上述操作流程,在輸出誤差滿足誤差標準或者迭代次數達到迭代上限,則結束上述操作。
由于網絡節點資源受到正常行為和攻擊行為的影響,因此將網絡節點資源的風險評估按照正常行為和攻擊行為兩方面來評估網絡節點資源的風險等級。首先確定網絡節點資源風險評估結構,輸入參數分為正常行為和攻擊行為,由于網絡行為對網絡節點資源的影響流量、CPU、磁盤、內存指標占用率,網絡帶寬,線程數目等,如果每個指標都做為風險評估模型的輸入量,評估模型將會變得異常復雜,訓練數據會非常龐大,實現起來有較大困難,且不具備實用性。因此本文選取了流量、CPU、磁盤、內存四個指標生成網絡節點資源風險評估的基本結構,如圖2所示。
2.1 減法聚類
聚類分析的基本思想就是物以類聚[13]。以網絡節點資源風險評估為例,將不同的網絡行為對節點資源變化內存、流量、CPU和磁盤的占用情況作為基本特征屬性,將這些數據分成不同的類別,這樣可以比較直觀的發現數據集的分布情況,以便于生成合理的網絡結構模型。減法聚類是一種十分快速的密度聚類算法,算法的復雜度不受數據集的維度影響。算法開始時將每一個數據對象都看作一個潛在的聚類中心,計算每個數據對象的密度值,密度值即為數據對象的密度指標,存在很多鄰近點的數據對象,其密度指標必然較大,成為聚類中心的可能性就越大。選出密度指標最大的數據對象,并確定為數據集的第一個聚類中心點。修正其他數據對象的密度值,再次尋找新的聚類中心點,依次循環下去,直到滿足條件為止。
由于ANFIS網絡結構復雜度由輸入節點的模糊規則決定,而隸屬度函數最終決定了模糊規則數。而使用減法聚類生成ANFIS[14-16]網絡結構時,一個重要優勢在于生成的模糊規則數比傳統的ANFIS方法生成的模糊規則更加符合網絡節點資源風險評估模型的輸入輸出數據。當輸入數據維度增大且數據量急劇增長時,也可以避免模型的模糊規則數出現爆炸式增長,從而導致ANFIS網絡結構十分復雜。
2.2 SCM-ANFIS結構
網絡節點資源風險評估模型的輸入值為兩種網絡行為對網絡節點資源產生的影響,分別是內存、流量、CPU以及磁盤的占用情況。在確定模型的輸入后,以網絡節點資源評估風險值作為輸出構造出了基于Sugeno模糊推理的ANFIS模型,該模型是將模糊邏輯和神經元網絡有機結合的新型模糊推理系統結構,具有以任意精度逼近任意線性和非線性函數的功能,并且收斂速度快,樣本需要量少等特點,如圖3所示。

圖2 網絡節點資源風險評估結構Fig.2 Network node resource structure of risk assessment

圖3 ANFIS模型圖Fig.3 ANFIS model
為了驗證ANFIS模型對網絡節點資源風險評估的有效性,本文通過實驗對網絡節點資源的風險評估進行了研究。首先構造一個內外網絡互聯模型,在外網模擬正常行為和攻擊行為訪問內網。通過服務器分別對互聯網進行網頁瀏覽、視頻播放和文件下載訪問,同時使用LOIC進行基于HTTP的DDOS攻擊來模擬異常流量的產生。每種網絡行為持續進行500秒。通過節點性能監視器中的數據收集器,分別收集 4種行為所消耗的流量、CPU、內存和磁盤這四個網絡資源指標的數據,并對采集的數據進行歸一化處理。
選取訓練數據為500組,每組數據包括了網絡節點資源風險的數據指標以及該指標對應的網絡節點資源風險等級。橫坐標表示樣本個數,縱坐標表示該樣本點對應的網絡節點資源的風險等級,樣本數據如圖4所示。
為了達到較小的誤差,需要不斷對影響范圍、擠壓因子、接受率以及拒絕率四個參數進行調整,進過多次訓練,將Ri設置為0.2,Sf設置為1.25,Ar設置為0.2,Rj設置為0.15。采用減法聚類方法產生的ANFIS模型結構,并且采用混合訓練方法的訓練誤差降低至0.008。訓練完成后,隸屬度函數變化對比如圖5所示。

圖4 網絡節點資源樣本Fig.4 Network node resource samples

圖5 隸屬度函數Fig.5 Membership function
根據樣本數據的訓練檢測結果可以看出,基于減法聚類的 ANFIS模型可以較好的擬合采集的數據,其RMSE(均方根誤差)為 0.0345,樣本數據的檢測結果如圖6所示。實驗中利用采集到區別于 500組訓練數據的100組數據作為檢驗數據,檢驗該模型是否能夠切實有效的評估出網絡節點資源的風險情況,100組數據的驗證結果如圖7所示。

圖6 樣本數據檢測結果Fig.6 Sample data test results

圖7 驗證結果Fig.7 Validation results
根據圖7所示,橫坐標表示驗證的數據點的組數,縱坐標表示數據點對應的網絡節點資源存在的風險等級,從實驗結果圖中,我們可以看出這兩條曲線具有較好的擬合結果,其RMSE(均方根誤差)為0.0044,。實驗結果表明,基于減法聚類的ANFIS網絡節點資源風險評估模型能夠有效的評估網絡節點資源風險等級。
本文針對網絡節點資源風險評估應用,提出了一種基于 SCM-ANFIS的網絡節點資源風險評估模型,采用減法聚類算法生成的網絡結構,相比于傳統的ANFIS模型,降低了模型的規則數目,簡化了模型結構,更加符合實際應用場景。經過仿真驗證,網絡節點資源風險評估模型誤差在1%內,實驗結果表明基于 SCM-ANFIS的網絡節點資源風險評估模型能夠很好的評估網絡行為下的節點資源風險等級。因此,本方法具有較高的評估準確度和較強的實用價值。
[1] 史志才. 網絡風險評估方法研究[J]. 計算機應用, 1001-9081(2008)10-2471-03.Shi zhi-cai. Research on Methods of Network Risk Evaluation[J]. Computer Applications, 1001-9081 (2008) 10-2471-03.
[2] 吳金宇. 網絡安全風險評估關鍵技術研究[D]. 北京: 北京郵電大學, 2013.Wu jinyu. research on key tochnologies of network security risk assessment[D]. Bei Jing: Beijing University of Posts and Telecommunications, 2013.
[3] 李林, 劉毅, 楊駿. 無線網絡安全風險評估方法的應用研究[J]. 計算機仿真, 1006-9348(2011)09-0147-04.LI Lin, Liu Yi, Yang Jun. Application of Wireless Network Safety Risk Assessment[J]. Computer Simulation, 1006-9348 (2011)09-0147-04.
[4] 張樹偉, 劉文芬, 魏江宏. 基于博弈模型的網絡風險量化評估方法[J], 信息工程大學學報. 1671-0673. 2014.ZHANG Shu-wei, LIU Wen-fen, WEI Jiang-hong. Network Security Risk Quantification Assessment Based On Game Model[J], Journal of Information Engineering University.1671-0673. 2014.
[5] 周湶, 孫威, 張昀, 等. 基于改進型ANFIS的負荷密度指標求取新方法[J]. 電力系統保護與控制. 1674-3415(2011)01-0029-06.Zhou Quan, Sun Wei, Zhang Yun, et al. A new method to obtain load density based on improved ANFIS[J]. Power System Protection and Control. 1674-3415(2011)01-0029-06.
[6] 李鵬程, 陳國華, 張力, 等. 基于ANFIS的人因失誤風險嚴重度識別[J]. 中國安全科學學報. 1003-3033(2014)01-0072-06.LI Peng-cheng, CHEN Guo-hua, ZHANG Li, et al. An ANFIS-based approach to identifying criticality of human error risk. China Safety Science Journal. 1003-3033 (2014)01-0072-06.
[7] 陳安輝. 基于GA-ANFIS的股指預測研究[D]. 哈爾濱: 哈爾濱工業大學, 2015.Chen Anhui. Prediction Research About Stock Index Based On GA-ANFIS[D]. Harbin: Harbin Institute of Technology, 2015.
[8] Ebru Akkaya. ANFIS based prediction model for biomass heating value using proximate analysis components[J]. Fuel,2016, 180.
[9] Faiza Belhachat, Cherif Larbes. Global Maximum Power Point Tracking Based on ANFIS Approach for PV Array Configurations under Partial Shading Conditions[J]. Renewable and Sustainable Energy Reviews, 2017.
[10] 吳陳, 陳冠洋. 基于ANFIS的溫濕度控制[J]. 電子設計工程, 1674-6236(2015)13-0086-04.Wu Chen, Chen Guanyang. Temperature and humidity control based on ANFIS[J]. Electronic Design Engineering,1674-6236(2015)13-0086-04.
[11] 葛建坤, 羅金耀, 李小平, 等. 基于ANFIS的溫室氣溫模糊控制仿真[J]. 農業工程學報, 2010, 26(8): 216-221.Ge Jiankun, Luo Jinyao, Li Xiaoping, et al. Simulation of fuzzy control for greenhouse temperature based on ANFIS[J].Transactions of the CSAE, 2010, 26(8): 216-221.
[12] Ebru Akkaya, et al. ANFIS based prediction model for biomass heating value using proximate analysis components[J].Fuel-Joural-Elsevier, 180(2016)687-693.
[13] 杜淑穎. 基于大型數據集的聚類算法研究[J]. 軟件, 2016,37(01): 132-135.DU Shu-ying. The Research on Clustering Algorithm for Large Datasets[J]. SOFTWARE, 2016, 37(01): 132-135.
[14] Mohsen Motahari-Nezhad, Mohammad Sh. Mazidi. An Adaptive Neuro-Fuzzy Inference System (ANFIS) Model for Prediction of Thermal Contact Conductance between Exhaust Valve and its Seat[J]. Applied Thermal Engineering, 2016.
[15] Afshin Tatar, Ali Barati-Harooni, Adel Najafi-Marghmaleki,Behzad Norouzi-Farimani, Amir H Mohammadi. Predictive model based on ANFIS for estimation of thermal conductivity of carbon dioxide[J]. Journal of Molecular Liquids, 2016.
[16] Yongtao Tan, Chenyang Shuai, Liudan Jiao, Liyin Shen. An adaptive neuro-fuzzy inference system (ANFIS) approach for measuring country sustainability[J]. Environmental Impact Assessment Review, 2017, 65.
Network Node Resource Risk Assessment Based on SCM-ANFIS
LUO Kang, NIU Yan, LI Jun
(School of Computing, Hubei University of Technology, Wuhan, China)
With the gradual deepening of Internet applications, once the network paralysis will cause huge economic losses, and network security issues become the focus of attention. This paper presents a risk assessment model for network node resources using Adaptive Neuro Fuzzy Inference System (ANFIS). The network behavior is divided into normal behavior and attack behavior, through the network resources such as traffic, CPU, disk, memory resource share changes in the analysis of network node resource risk level, and get a better accuracy. The experimental results show that the Adaptive Neuro Fuzzy Inference System based on sub-clustering (SCM-ANFIS) is a kind of network node resource risk assessment model.
: ANFIS; Network security; Network behavior; Network risks
TP393
A
10.3969/j.issn.1003-6970.2017.10.018
本文著錄格式:羅康,鈕焱,李軍. 基于SCM-ANFIS的網絡節點資源風險評估[J]. 軟件,2017,38(10):100-105
湖北省教育廳科學研究計劃資助項目(D2014403)
羅康(1992-),男,湖北工業大學計算機學院碩士研究生,主要研究方向:網絡安全;鈕焱(1969-),男,湖北武漢人,湖北工業大學計算機學院教授,主要研究方向:網絡安全。
李軍(1976-),男,湖北工業大學計算機學院副教授,主要研究方向:網絡安全。