◎樊曉龍 孫海燕 李鵬
大數(shù)據(jù)安全防御模型構(gòu)建研究
◎樊曉龍 孫海燕 李鵬
傳統(tǒng)網(wǎng)絡(luò)安全管理體系在大數(shù)據(jù)時(shí)代已顯現(xiàn)不足,本文通過構(gòu)建大數(shù)據(jù)安全架構(gòu)層次,詳細(xì)定義大數(shù)據(jù)安全防御體系,結(jié)合粒子群算法思想,提出了大數(shù)據(jù)安全防御模型,具有較強(qiáng)的理論價(jià)值和實(shí)踐意義。
大數(shù)據(jù)是指攜帶巨量信息的高增長率和多樣化的信息資產(chǎn),正處蓬勃發(fā)展階段,怎樣保證其安全可靠是一個(gè)亟待解決的問題。病毒探測、主動(dòng)防御等傳統(tǒng)安全防護(hù)體系,無法適用大數(shù)據(jù)的可靠性管理。大數(shù)據(jù)安全防御的重點(diǎn)是構(gòu)建可行的防御模型。本文基于大數(shù)據(jù)可靠性需求,提出一種動(dòng)態(tài)安全算法,構(gòu)建了大數(shù)據(jù)安全防御模型。
2.1安全架構(gòu)層次設(shè)計(jì)
本文將大數(shù)據(jù)安全架構(gòu)劃分為以下4個(gè)層次:
(1)數(shù)據(jù)拆分層,主要按照數(shù)據(jù)拆分策略對大數(shù)據(jù)進(jìn)行分布式管理,通過聚類算法對所獲取的數(shù)據(jù)集進(jìn)行分類和預(yù)處理。
(2)數(shù)據(jù)分析層,主要分析預(yù)處理之后的大數(shù)據(jù),分析目標(biāo)包括可疑病毒、非法任務(wù)等。發(fā)現(xiàn)的風(fēng)險(xiǎn)因素會(huì)被立即隔離。
(3)數(shù)據(jù)包裝層,主要實(shí)現(xiàn)大數(shù)據(jù)的有效封裝。封裝時(shí)要充分考慮信息的加密需求,確保封裝后數(shù)據(jù)的隱私性、準(zhǔn)確性和安全性。
(4)客戶應(yīng)用層,主要是大數(shù)據(jù)的使用者和分析報(bào)告的上傳者。
2.2安全防御體系的定義
本文以粒子群算法為基礎(chǔ),構(gòu)建大數(shù)據(jù)安全防御體系。
首先為計(jì)算出大數(shù)據(jù)的信任度,提出以下4個(gè)定義:
定義1:如果信任度的起始與個(gè)體最好值)1(-mTold相等,則進(jìn)行迭代操作的時(shí)候不再改變;假若信任度的起始值比上一值更優(yōu),則根據(jù)粒子群算法的規(guī)則,以起始值替換上一值:


表示,耦合度的大小與數(shù)據(jù)的分散程度有關(guān),當(dāng)耦合度接近于1的時(shí)候,證明局部最優(yōu)解已經(jīng)形成。
定義4:結(jié)合以上3個(gè)定義,能夠?qū)?dòng)態(tài)信任因子表示為:

基于上述研究成果,為描述大數(shù)據(jù)安全防御行為,提出以下5個(gè)定義:
定義5:假若大數(shù)據(jù)可靠度處在信任因子范圍內(nèi),則可以視為大數(shù)據(jù)是強(qiáng)安全的,表示為:infosuperi,j=1,iflevelmax<usi≤wmax0,others
定義6:假若大數(shù)據(jù)可靠度處在信任因子范圍內(nèi),但對于其他的訪問者處在“開放訪問”狀態(tài),則被視為弱安全,表示為:
infoweaki,j=1,ifusi≤wmax1-wmax-usi/levelmaxwmax,others
定義7:在合法性方面,假若大數(shù)據(jù)處在最高合法水平,并且對于其他的訪問者處在“不可訪問”狀態(tài),則大數(shù)據(jù)被視為強(qiáng)合法狀態(tài)。表示為:lawsuperi,j=1,if uli≤wmax0,others
定義8:假若大數(shù)據(jù)處在最高合法水平,并且對于其他的訪問者處在“驗(yàn)證訪問”狀態(tài),則大數(shù)據(jù)被視為弱合法狀態(tài)。表示為:
lawweaki,j=1,if uli≤wmax1-exp-wmax+1-uliexpwmax-1,others
定義9:假若大數(shù)據(jù)處在“開放訪問”狀態(tài),則大數(shù)據(jù)被視為不合法狀態(tài)。表示為:
最后,客戶的操作請求與大數(shù)據(jù)可靠度間的關(guān)系表示為:

2.3安全防御體系證據(jù)分析
為保證大數(shù)據(jù)的“強(qiáng)安全”與“合法狀態(tài)”,假設(shè)大數(shù)據(jù)服務(wù)信息系統(tǒng)共擁有m臺服務(wù)器,在m臺服務(wù)器中,提取n臺作為構(gòu)建安全防御體系的數(shù)據(jù)樣本。進(jìn)一步假設(shè),從n臺服務(wù)器所獲取的樣本數(shù)據(jù)α∈泊松分布,則這些樣本在服務(wù)器輸入端以排隊(duì)的方式等候處理和傳輸,等候時(shí)間為1/α。如果一段數(shù)據(jù)信息的等候時(shí)間超時(shí),則可視為信息已被丟棄。此時(shí)會(huì)生成一個(gè)反饋信息,通知信息的發(fā)送者重發(fā)信息。結(jié)合馬爾科夫定律,在這種數(shù)據(jù)傳輸環(huán)境中,可靠度不足的信息識別是符合遍歷準(zhǔn)則的。
2.4安全防御模型實(shí)現(xiàn)流程
綜上所述,完整的大數(shù)據(jù)可靠性防御模型實(shí)現(xiàn)流程為:
(1)安全防御的初始化過程,新任務(wù)加入等待隊(duì)列。如果輪到該任務(wù)進(jìn)行處理,便將其信息從數(shù)據(jù)存儲區(qū)提取出來,按照數(shù)據(jù)預(yù)處理策略進(jìn)行分布式管理和數(shù)據(jù)集分類。
(2)當(dāng)判定數(shù)據(jù)為有效信息之后,將任務(wù)提交數(shù)據(jù)拆分層進(jìn)行信息拆分處理。在信息拆分之前,系統(tǒng)預(yù)置了信息判定單元,這個(gè)單元的功能是對所有的信息處理過程引入來自云端的可靠性監(jiān)控。
(3)如果信息中所含有的任務(wù)之和能夠進(jìn)行分解,使之成為n個(gè)子任務(wù),則分割函數(shù)可以表示為:

(4)將拆分形成的子任務(wù)提交數(shù)據(jù)分析層進(jìn)行分析處理。如果子任務(wù)信息已經(jīng)在任務(wù)數(shù)據(jù)庫中存在,則判斷為重復(fù)任務(wù),將其刪除以保證數(shù)據(jù)庫的低冗余。
(5)分析處理完畢的子任務(wù),提交到數(shù)據(jù)包裝層。依據(jù)其獨(dú)有的索引代碼,形成哈希表,將其重新連接為一個(gè)整體的任務(wù)單元,并進(jìn)行加密封裝,之后傳輸至客戶應(yīng)用層。
(6)判斷是否存在下一個(gè)需要處理的任務(wù);如果存在,則轉(zhuǎn)至第一步。
本文提出的大數(shù)據(jù)安全防御模型,基于動(dòng)態(tài)安全算法,能夠克服傳統(tǒng)網(wǎng)絡(luò)安全管理體系不足,在信息安全受到威脅之前定位和清除隱患。該模型成功實(shí)現(xiàn)了基于云計(jì)算環(huán)境下的大數(shù)據(jù)安全隱私保護(hù),符合大數(shù)據(jù)可靠性管理要求,具有較高推廣價(jià)值。大數(shù)據(jù)時(shí)代,現(xiàn)有的數(shù)據(jù)隱私保護(hù)技術(shù)還不夠完善,需要從科研和技術(shù)層面加大對云平臺的大數(shù)據(jù)安全隱私保護(hù)的研究。
(作者單位:1. 31433部隊(duì);2. 31438部隊(duì))