山東師范大學(xué)管理科學(xué)與工程學(xué)院 劉靖宇
基于靜態(tài)博弈的計(jì)算機(jī)網(wǎng)絡(luò)對(duì)抗防御問(wèn)題研究
山東師范大學(xué)管理科學(xué)與工程學(xué)院 劉靖宇
信息時(shí)代的到來(lái)使得網(wǎng)絡(luò)攻擊逐漸進(jìn)入公眾的視野,基于計(jì)算機(jī)網(wǎng)絡(luò)的對(duì)抗防御過(guò)程分析也隨之成為研究的熱點(diǎn)。針對(duì)計(jì)算機(jī)網(wǎng)絡(luò)對(duì)抗防御問(wèn)題的復(fù)雜性和產(chǎn)生原因,從防御者的靜態(tài)博弈角度出發(fā),著重分析攻防兩方在對(duì)抗間的博弈戰(zhàn)略選擇和防御間的彼此依賴,提出面對(duì)不同環(huán)境時(shí)攻防兩方應(yīng)采取的最佳戰(zhàn)略。最后通過(guò)對(duì)戰(zhàn)略的分析指出該研究的不足并對(duì)該研究的未來(lái)進(jìn)行展望。
計(jì)算機(jī)網(wǎng)絡(luò)防御;計(jì)算機(jī)網(wǎng)絡(luò)對(duì)抗;靜態(tài)博弈
近些年來(lái),隨著計(jì)算機(jī)網(wǎng)絡(luò)的高覆蓋率以及網(wǎng)絡(luò)性能的顯著提升,不僅改變了傳統(tǒng)工業(yè)的發(fā)展模式,也使人類的日常生活在計(jì)算機(jī)網(wǎng)絡(luò)設(shè)備的輔助下進(jìn)入了高速發(fā)展的信息時(shí)代。計(jì)算機(jī)網(wǎng)絡(luò)飛速發(fā)展的同時(shí)也給人類帶來(lái)了諸多危害和不便,計(jì)算機(jī)病毒、網(wǎng)絡(luò)犯罪、信息泄露、黑客攻擊等嚴(yán)重危害計(jì)算機(jī)網(wǎng)絡(luò)安全的因素也隨之而來(lái)。
因此,人們加大了對(duì)計(jì)算機(jī)網(wǎng)絡(luò)的對(duì)抗和防御問(wèn)題的研究。現(xiàn)階段,對(duì)計(jì)算機(jī)網(wǎng)絡(luò)的對(duì)抗防御研究可以轉(zhuǎn)化為對(duì)計(jì)算機(jī)網(wǎng)絡(luò)的攻防問(wèn)題研究。基于博弈論,對(duì)該問(wèn)題的研究就是把計(jì)算機(jī)網(wǎng)絡(luò)中的攻擊和防御轉(zhuǎn)化為一種博弈關(guān)系,并以此來(lái)研究計(jì)算機(jī)網(wǎng)絡(luò)中的對(duì)抗模型。
計(jì)算機(jī)網(wǎng)絡(luò)中的攻防問(wèn)題是基于攻防雙方的信息不對(duì)稱產(chǎn)生的,這種信息不對(duì)稱可能是由于技術(shù)缺陷引起的,大多數(shù)情況是由攻防雙方對(duì)信息的可以保護(hù)引起的,本文將從不確定性、不可預(yù)見(jiàn)性和算法缺憾性分析計(jì)算機(jī)網(wǎng)絡(luò)中的攻防問(wèn)題[1]。
計(jì)算機(jī)網(wǎng)絡(luò)空間的最大特點(diǎn)是對(duì)所有群體開放且沒(méi)有確定邊界,再加上幾乎不受地形、氣候等自然因素的影響,所以任何存在計(jì)算機(jī)網(wǎng)絡(luò)的空間都可以被看作是一個(gè)攻防空間。這就使得現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)設(shè)備及系統(tǒng)的連接和交互變得更加容易,但同時(shí),不同性能的系統(tǒng)的連接會(huì)導(dǎo)致信息的不對(duì)稱和效果的未知性,從而加大系統(tǒng)運(yùn)行的風(fēng)險(xiǎn)。此外,由于計(jì)算機(jī)網(wǎng)絡(luò)算法的高度耦合性和網(wǎng)絡(luò)開發(fā)力度的加大,系統(tǒng)內(nèi)部算法的脆弱性也顯露無(wú)疑,一次正常的網(wǎng)絡(luò)攻擊對(duì)一個(gè)系統(tǒng)可能不會(huì)產(chǎn)生很大影響,但由于系統(tǒng)間的高耦合性,就會(huì)導(dǎo)致“多米諾骨牌”效應(yīng)的出現(xiàn),使得整個(gè)網(wǎng)絡(luò)系統(tǒng)的癱瘓和崩潰。再加上近些年云盤、云計(jì)算等高共享網(wǎng)絡(luò)環(huán)境的異軍突起,更增加了計(jì)算機(jī)網(wǎng)絡(luò)邊界的模糊性和不確定性[2]。
由于信息不對(duì)稱和不可預(yù)見(jiàn)性,攻擊者通常在攻防過(guò)程中占據(jù)優(yōu)勢(shì)地位,其通過(guò)網(wǎng)絡(luò)嗅探等方法尋找防御者的信息漏洞,再通過(guò)對(duì)漏洞的信息進(jìn)行數(shù)據(jù)分析與數(shù)據(jù)挖掘找到防御者系統(tǒng)的致命弱點(diǎn),從而達(dá)到入侵并控制防御者網(wǎng)絡(luò)系統(tǒng)的目的。隨著網(wǎng)絡(luò)性能的提升以及攻擊技術(shù)的不斷改進(jìn),攻擊者的攻擊變得越來(lái)越得心應(yīng)手,攻擊的范圍也逐步擴(kuò)大。對(duì)于防御者,他會(huì)利用網(wǎng)絡(luò)系統(tǒng)的觸發(fā)器技術(shù),密切監(jiān)測(cè)和攔截各種對(duì)自身不利的信息。一旦發(fā)現(xiàn)自己成為被攻擊的對(duì)象,將在最短的時(shí)間內(nèi)做出回應(yīng)并修復(fù)自身系統(tǒng)以此最大限度的保護(hù)自身的系統(tǒng)。
計(jì)算機(jī)網(wǎng)絡(luò)中的網(wǎng)絡(luò)服務(wù)、網(wǎng)絡(luò)協(xié)議、軟件硬件系統(tǒng)以及程序設(shè)計(jì)語(yǔ)言都不是完美的,都存在著或多或少的漏洞。這些漏洞有的人們已經(jīng)發(fā)現(xiàn)并成功攻破,但絕大多數(shù)的漏洞是目前人們無(wú)法解決的,因而它們對(duì)系統(tǒng)網(wǎng)絡(luò)的危害也是很難估計(jì)的。最重要的一點(diǎn)是,現(xiàn)今的算法沒(méi)有達(dá)到完全的智能化,不能達(dá)到與人類的思維完全契合。
計(jì)算機(jī)網(wǎng)絡(luò)攻防問(wèn)題是一個(gè)復(fù)雜且存在很大變數(shù)的問(wèn)題。博弈論是研究決策者面對(duì)不同戰(zhàn)略選擇時(shí)對(duì)自己和對(duì)方面臨的選擇進(jìn)行全方位分析并從中爭(zhēng)取到能使自己在競(jìng)爭(zhēng)中獲得最大效益的方法,是通過(guò)決策雙方的相互作用使決策雙方利益最大化的一種理論。該模型的參與人是網(wǎng)絡(luò)的攻擊者和防御者,即。假設(shè)攻擊者和防御者各有n種對(duì)應(yīng)的攻擊和防御戰(zhàn)略,則攻擊者和防御者兩方的戰(zhàn)略集合可分別表示為,。根據(jù)攻防雙方做出的不同戰(zhàn)略選擇即可形成不同的戰(zhàn)略組合,進(jìn)而得到支付函數(shù)即參與人雙方在不同戰(zhàn)略組合在下的收益。得到的支付矩陣如表1所示。

表1 攻防雙方的支付矩陣
其中,U11表示攻擊者選擇攻擊戰(zhàn)略1、防御者選擇防御戰(zhàn)略1下雙方的支付函數(shù),其他情況類比即可得到[3]。
靜態(tài)博弈是指參與人同時(shí)采取行動(dòng),或者盡管參與者行動(dòng)的采取有先后順序,但后行動(dòng)的人不知道先采取行動(dòng)的人采取的是什么樣的行動(dòng)且一旦選擇某項(xiàng)戰(zhàn)略后就不能再改變[4]。在該模型中,攻擊者通常有兩種戰(zhàn)略選擇-一直攻擊和可能攻擊,防御者通常也有兩種戰(zhàn)略選擇-反擊和不反擊。由于雙方是在靜態(tài)博弈下做出的選擇,所以尤其對(duì)防御者來(lái)說(shuō),它不能根據(jù)攻擊者的選擇適時(shí)調(diào)整自己的戰(zhàn)略選擇。
如果攻擊者選擇攻擊,意味著它會(huì)一直進(jìn)行攻擊,如果防御者選擇反擊,依舊阻擋不了攻擊者選擇攻擊的戰(zhàn)略,所以從節(jié)約成本的角度考慮使這場(chǎng)博弈結(jié)束,防御者應(yīng)該選擇不反擊的戰(zhàn)略并時(shí)刻監(jiān)測(cè)和觀察攻擊者攻擊的內(nèi)容,在最短的時(shí)間內(nèi)建立反饋機(jī)制并找到盡可能降低該攻擊的方法。隨著防御者反饋機(jī)制的建立,攻擊者的攻擊成功率逐漸遞減,當(dāng)攻擊著的攻擊成功率下降到0使,該博弈就結(jié)束了。所以當(dāng)攻擊者選擇攻擊時(shí),防御者的最佳戰(zhàn)略選擇是不反擊。
如果攻擊者選擇可能攻擊,防御者可以選擇反擊,這使得防御者期望攻擊者不攻擊,即攻擊者的攻擊成功率為0,博弈結(jié)束。防御者也可以選擇不反擊,當(dāng)攻擊者攻擊的時(shí)候就建立反饋機(jī)制使攻擊者的攻擊成功率逐漸遞減為0,攻擊者不攻擊時(shí)博弈自然結(jié)束。

表2 靜態(tài)博弈下防御者的支付矩陣
綜上所述,該模型在靜態(tài)博弈下有攻擊者和防御者兩個(gè)參與人,攻擊者的戰(zhàn)略集合為{一直攻擊,可能攻擊},防御者的戰(zhàn)略集合為{反擊,不反擊},防御者的支付函數(shù)如表2所示。
表2中O表示防御者不可能防御成功,P表示防御者可能防御成功。由于靜態(tài)博弈只要做出選擇就不得更改的特點(diǎn),導(dǎo)致防御者在面對(duì)攻擊者的兩種戰(zhàn)略選擇時(shí),只有都選擇不反擊才有防御成功的可能性。所以在計(jì)算機(jī)網(wǎng)絡(luò)攻防靜態(tài)博弈模型中,防御者的最佳戰(zhàn)略選擇是不反擊。
基于博弈論的計(jì)算機(jī)網(wǎng)絡(luò)對(duì)抗防御研究是一個(gè)起步較晚、比較年輕的領(lǐng)域,本文將計(jì)算機(jī)網(wǎng)絡(luò)的對(duì)抗防御策略與靜態(tài)博弈結(jié)合起來(lái),分析了在靜態(tài)博弈下作為計(jì)算機(jī)網(wǎng)絡(luò)對(duì)抗中的防御者應(yīng)采取的最佳策略。總體來(lái)說(shuō),目前對(duì)該領(lǐng)域的研究并沒(méi)有形成一個(gè)完整的體系構(gòu)架。計(jì)算機(jī)網(wǎng)絡(luò)的不確定性、復(fù)雜性、攻防雙方的戰(zhàn)略選擇、攻防成功的概率等都很難估計(jì),再加上信息時(shí)代網(wǎng)絡(luò)的高速發(fā)展更要求該領(lǐng)域研究的與時(shí)俱進(jìn)和開拓性思維。
[1]王長(zhǎng)春,陳志杰.基于博弈論計(jì)算機(jī)網(wǎng)絡(luò)對(duì)抗問(wèn)題研究[J].火力與指揮控制,2015(3):1-5.
[2]朱建明,王秦.基于博弈論的網(wǎng)絡(luò)空間安全若干問(wèn)題分析[J].網(wǎng)絡(luò)與信息安全學(xué)報(bào),2015,1(1):43-49.
[3]王曉丹,黃炎焱,王建宇.計(jì)算機(jī)網(wǎng)絡(luò)防御策略分析[J].指揮信息系統(tǒng)與技術(shù),2014,5(5):13-19.
[4]吳新民.論靜態(tài)與動(dòng)態(tài)博弈中的邏輯推理[J].求是學(xué)刊,2008,35(2):51-55.
Research on computer network confrontation and defense based on Game Theory
LiuJingyu
(School of management science and engineering,Shandong Normal University,Jinan,250000,China)
With the advent of the information age,network attacks have gradually entered the public view,and the analysis of the process of computer network based confrontation and defense has also become the focus of research.In view of the complexity and causes of computer network confrontation and defense problems,we start from the defensive’s static game theory,focusing on analysis of the offensive and the defensive in the game between the strategic choice and defense between the mutual dependence,putting forward to the best strategy that the offensive and the defensive take facing different environment.Finally,through the analysis of the strategy,it points out the shortcomings of this research and looks forward to the future of the study.
computer network defense;computer network confrontation;static game