吳天昊,王勁松,宋留勇,吳少強
(戰略支援部隊 信息工程大學,河南 鄭州 450001)
網絡空間安全防護體系中,重要網絡目標的某些防護指標之間存在一定沖突,且其各參數具有不可共度性,無法進行簡單的線性效益比較,如增設帶寬、頻譜等防護資源代價的同時,卻降低了網絡目標的隱蔽性。網絡目標的防護方案設計科學、合理、精確是確保網絡空間目標安全的關鍵一環,指揮者對方案優化模式的設計與選擇對網絡目標的防護效果發揮決定作用。
對目標方案優選評估的研究,目前主要采用的是概率、模糊理論或是MADM(多屬性決策賦權)等方法[1-2],分析模型往往局限于尋找最優解或目標方案排序,且要求候選方案已給定,各指標參數為確定離散值[1]。網絡空間下的精確指揮,其戰場信息難以精準把控、目標勢態瞬息萬變,考慮設計網絡目標防護方案過程中各指標參數不確定,屬性值連續變化且沒有統一度量標準,難以尋找最優解等諸多特點,本文針對網絡目標防護的不確定多目標決策問題,提出一種并非尋求最優解,而尋求滿意解集,依據指揮者偏好進行輔助決策的方式,以求解MODM(multi-objective decision making)的Pareto解集(非劣解集)作為研究方法[1],構建優選指標體系,并通過仿真實例,驗證方法的有效性。
MODM,即多目標優化決策,其方案在條件范圍內數目是無限多個,在優化決策前無法一一列舉,此外,各方案指標的參數亦為連續變化值,因此,只可在決策過程中逐步尋找優化方案。
設定該MODM問題為
式中:f(x)為目標函數;g(x)為約束條件,且均連續可微。
定義:Pareto解,即有效非劣解,在多目標決策中,f(x)為多目標決策問題向量目標函數,其分量fj(x),j=1,2,…,n,n取越大越優。對x0∈X, 若在X中不存在x0使fj(x)≥fj(x0),j=1,2,…,n,則稱x0為向量優化問題的非劣解[3-4]。
MODM在方案優化決策中應用的模式為,設有n維決策變量,在不同的方案集Z定義方案,多目標優化決策就是在Z構成的方案集中求解非劣解,通過縮小可行域的范圍來尋找較優解,即滿意解。
與對敵網絡節點的摧毀進攻等其他網絡作戰行動不同,網絡重要目標的防護指標更加復雜,防護方案不單是考慮單個或多個作戰階段的防護效果,而是長期地、持續不斷地對網絡目標進行綜合性防御并對敵目標識別嗅探系統進行干擾。顯然,防護效果越佳,防護資源代價越高。過度追求防護效果會造成軍事資源的浪費,或是造成軍事資源分配不均衡,這就要求指揮者對網絡目標防護方案中多目標之間的矛盾沖突作以權衡。本文針對重要網絡目標防護的實際需求,利用多目標優化決策模型處理不確定性問題的優勢,以網絡目標價值、目標受威脅程度、防護資源代價3個準則層為基本衡量標準,構建網絡目標防護指標體系。
(1) 目標價值。目標價值是指該網絡目標在作戰中發揮的效能與影響。目標越重要,越要加大力度予以保護,因此,考慮目標的價值因素是設計制定防護方案的關鍵環節,是分配防護資源的重要依據。結合網絡戰場實際情況及上級意圖,設定該網絡目標具備網絡戰場控制能力、打擊能力和支援能力,對網絡作戰體系實力和效能產生一定影響,具有對敵指揮中心、能源基地、要塞樞紐等重要目標的網絡系統進行干擾與摧毀的效用。
(2) 受威脅程度。受威脅程度是網絡目標防護方案設計的重點,與上述目標價值具有關聯性。受威脅程度包含該網絡目標的安全性與風險性,安全性包括服務抗毀性、IP地址偽裝性、網關隱蔽性和網絡恢復性4個三級指標,風險性包括被嗅探監視系數(可能性)、被木馬入侵系數(可能性)、權限篡改難度和信息盜取難度4個三級指標。受威脅程度越高,網絡目標越易被發現,越易被攻擊和摧毀,越難以恢復效能,其防護力度就要相應加強。
(3) 防護代價。防護代價指防護方案中需要實施的人力物力資源,在網絡目標防護過程中起到決定性作用,也是指揮者作出優化決策的核心內容。防護代價可劃分為防護手段、工具資源和人員編配3個指標,每個指標的細化分類在下節圖中有直觀體現。在指標體系中的防護代價不僅要考慮其獲取及實施的難度程度,還要考慮資源代價的投入量,可采用層次分析法AHP(analytic hierarchy process)方法確定其權重[5]。
參考美、俄網絡作戰的實戰經驗,結合網絡設施建設的實際情況,分析對網絡目標構成直接或潛在影響因素,經過征求專家意見,建立如圖1所示的網絡目標防護指標體系。本文采取的分類方式與建立的指標意在說明多目標決策非劣解及偏好設置在方案優化中的應用,對輔助指揮者決策并確定方案具有參考意義。
單目標優化模型目的是求得唯一最優解,告知指揮者“應該這樣決策”。所謂的“最優方案”看似最優,但卻存在2個問題:一是忽視了戰場復雜性。能夠取得最優解是理想情況,而在現實作戰方案的設計中,往往難以把握各指標間的比重,直接獲取最優解的情況較少。二是限制了指揮者的主觀能動性。在不同的戰場環境、局勢、態勢下,指揮者可依據自身的指揮藝術和經驗對方案加以完善,而非按照模型給出的最優解進行決策。
網絡目標防護方案的多目標優選決策模型能
夠較好解決以上2個問題,通過多目標優化決策計算可獲取指標的一組有效非劣解及相關信息,指揮者可以依據自身偏好進行選擇判斷[1-3]。該模型是通過2項程序分別縮小方案集的過程,如圖2所示,第1步:以MODM模型計算得出非劣解集(可行方案);第2步:通過指揮者偏好賦權計算得出滿意方案。
設定網絡目標防護方案各指標模型中有n個決策變量,p個目標函數和m個約束條件[1]。那么,網絡目標防護方案多目標優化的最大化標準型為[6]
(1)
在方案的應用模型中,若將各不可比較的指標變量視為不同維度的向量,則模型表達為
輸入空間的向量為
x=(x1,x2,…,xn)T,x∈Rn,
(2)
式中:Rn為非劣解集。
輸出空間的向量[7]:
f=(f1,f2,…,fm)T,x∈Rm.
(3)
在有偏好的多目標決策中,如果目標函數為凹函數且可行域為凸集,可設定加權向量w∈W,它反應了多目標決策問題的Pareto解與決策者選定的滿意解之間的關系,即在求得的非劣解集中,只有符合指揮決策者主觀偏好的有效解,可視為加權問題的滿意解(最終方案)[4]。
在不考慮存在負偏好值的情況下,定義權值為
(4)
式中:Rn為加權向量集合,對w∈W偏好加權的問題可列為
(5)
式中:f(x)和g(x)分別為目標函數和約束條件[8]。
利用多目標優選決策建立的網絡目標防護方案優化模型的基本步驟為:
Step 1:量化指標,設置參數。
Step 2:依據約束條件設定決策變量的可行域。
Step 3:計算得出Pareto解集。
Step 4:若得出最優解x0,則x0為最終方案,流程終止;若無法找到最優解,進行下步。
Step 5:則設定決策者偏好w=(w1,w2,…,wn)。
Step 6:依據偏好進行賦權,得出滿意解,則該滿意解為最終方案。
算法基本流程圖如圖3所示。
在某網絡目標防護方案設計決策的過程中遇有如下問題:指標體系中,三級指標i10(網關隱蔽性)、i22(帶寬及頻譜)和i23(局域網配制)存在沖突,需要指揮者確定各指標參數值。3項指標的不可共度性表現為:增設i22權重會降低i10的參數值,i23的配制影響制約i10,i22的性能。
在無參考數據的情況下,若決策者根據傳統方法進行決策,只能通過對比試驗對約束條件內的值代入目標函數,并通過仿真來計算目標函數的最優解。這種方法不僅遲滯了決策者的決策效率,且錯誤率高。本文通過實驗來驗證MODM非劣解模型在指揮決策中的優勢。


表1 決策變量的等級標準
根據專家給出的約束條件,設定并應用多目標優選決策函數為[9]
(6)
根據3.3節中式(5),轉化為最大化標準型為
(7)
用Matlab進行求解,得出如圖4所示。
圖4中f1,f2,f3三維量綱代表目標函數與指標參數的映射關系。由于圖5中所示的投影為凹的,因此中間部分為局部非劣解,應該舍棄[4]。
由圖6,7可得該多目標優化函數的決策范圍為[7,10]
(8)
式中:f為根據可行域得到的目標決策函數范圍,即輸出空間或決策范圍[11-13]。
由此求得非劣解(指標參數可行域):
(9)
通過約束條件得出非劣解范圍為
(10)
二者取交集求得最終非劣解的范圍為
(11)
由以上步驟將滿意解集縮小到最小范圍內。
所謂的滿意解,是依據指揮者的偏好縮小可行解的范圍。偏好的設置要根據作戰指揮中的實際情況,因勢而定。目前,對偏好賦權的研究文獻十分廣泛,針對不同決策方式有著不同的偏好賦權方法。針對有多位專家或多個決策者時,對偏好的設置可參考文獻[14],針對模糊決策時,對偏好的設置可參考文獻[15]。由于本文研究方向為輔助決策,意在為指揮者提供可行有效的決策信息,因此,在不考慮有多個決策者的情況下,結合網絡目標防護方案指標體系,給出幾種較為簡單實用的縮小可行域的方法:
(1) 依據指揮者的意圖。比如,若指揮者意圖實現網絡目標的配制最優,那么可以圖4中亮色區域選擇指標參數,若指揮者意圖強調網絡目標隱蔽性強,那么可以在圖4中暗色區域選擇指標參數。同理,指揮者意圖實現防護效果最佳或是強調軍事資源的節約,則可分別在不同區域選擇可行解。
(2) 依據指揮者的要求。比如,指揮者要求,網絡目標防護設置中,局域網配置適中即可(50%),帶寬投入不需要流暢,僅保證傳輸即可(70%),但是隱蔽性必須達到最優(100%)。那么其偏好可設定為w=(1,0.5,0.7),歸一化后得w0=(0.454,0.227,0.318),通過3.3中式(4)的計算可得出指示參數范圍為
(12)
決策范圍為
(13)
(3) 依據指揮者的主觀偏好。比如,指揮決策者對各指標的權重有主觀設定,給出對此3項指標的主觀正值偏好值為w=(3/25,5/25,1/25),歸一化后得w0=(0.333,0.556,0.111),通過3.3節式(4)的計算可得出指示參數范圍為
(14)
決策范圍為
(15)
式(8),(13),(15)中:f均為根據可行域得到的目標決策函數范圍。
由實驗結果可以看出,通過多目標決策模型的構建并對目標函數和約束條件求解Pareto解,明顯縮小了決策變量的范圍,證明了本文提出的方法能夠優化和確立網絡目標防護方案指標參數,達到優化方案的目標。在網絡空間下的指揮決策中,運用本文提出的方法,可避免指揮決策者在大量方案數據中尋找最優解,而是在求解后的解域中尋找滿意解,對輔助指揮者科學、精確、合理設計優化網絡目標防護方案具有較強的應用價值。
針對網絡目標防護方案中部分指標存在沖突且不可線性比較的現實問題,本文構建了網絡目標防護方案指標體系,通過建立多目標優化決策的數學模型,提出一種通過計算非劣解集,并依據指揮者偏好進行選擇的應用方法。通過實例仿真證明了該方法能夠達到縮小決策范圍,優化方案質量的效果,對輔助指揮者決策并確定優化方案具有參考意義。未來相關研究要針對方案不確定性問題,在方案的有效性及減小誤差值方面給出決策建議。