趙思佳 尹 婷
(湖南環(huán)境生物職業(yè)技術(shù)學(xué)院,湖南 衡陽(yáng) 421005)
隨著信息技術(shù)的不斷發(fā)展,信息互聯(lián)已經(jīng)成為工作和生活中重要的組成部分,其中有希望廣為傳播的大眾信息,也有只希望個(gè)人或限定幾個(gè)人了解的隱私信息,甚至還有一些不經(jīng)意間泄露出來(lái)的個(gè)人敏感信息。由于隱私信息保護(hù)不夠嚴(yán)密而造成的信息泄露逐漸成為危害網(wǎng)絡(luò)世界秩序的重點(diǎn)、難點(diǎn)問題,其不僅帶來(lái)個(gè)人財(cái)產(chǎn)損失、公司保密信息泄密等財(cái)物方面的不可控風(fēng)險(xiǎn),還會(huì)成為惡意竊取信息、“人肉搜索”等網(wǎng)絡(luò)暴力的幫兇,破壞社會(huì)良好的公序良俗,甚至觸犯法律。信息保護(hù)是網(wǎng)絡(luò)技術(shù)發(fā)展的核心內(nèi)容之一。大數(shù)據(jù)分析是建立在對(duì)歷史數(shù)據(jù)和擴(kuò)展信息進(jìn)行綜合研判的基礎(chǔ)上,提取其中價(jià)值信息的方法,是一種新型的技術(shù)手段。應(yīng)用大數(shù)據(jù)分析技術(shù)對(duì)隱私信息進(jìn)行保護(hù),既符合網(wǎng)絡(luò)環(huán)境下的信息互聯(lián)、共享的大背景,又具有不斷自我完善的AI特性,是一種“治標(biāo)治本”的隱私信息保護(hù)手段。因此,該文進(jìn)行建模分析,設(shè)計(jì)新型算法,并采取必要措施,以期實(shí)現(xiàn)在大數(shù)據(jù)分析技術(shù)路徑下的隱私信息保護(hù)。
該文設(shè)計(jì)的基于大數(shù)據(jù)分析的隱私保護(hù)策略結(jié)構(gòu),立足于保護(hù)隱私信息,因此在組件構(gòu)成中增加了放大器模塊,用以采集信號(hào)并實(shí)施關(guān)鍵信息過濾檢索,并在該模塊框架層面,建立了3個(gè)角色的服務(wù)框架模型,用于服務(wù)注冊(cè)代理,即其在網(wǎng)絡(luò)中充當(dāng)了服務(wù)提供者和服務(wù)請(qǐng)求者之間的通信中介。為了保證通信性能與帶寬不受影響,放大器模塊需要與原框架能夠較好地兼容,并能夠支持通信系統(tǒng)的擴(kuò)展性,因此該模塊采用轉(zhuǎn)發(fā)式架構(gòu),對(duì)原通信協(xié)議不會(huì)產(chǎn)生影響。由此而生的附加字段需要能夠理解這樣的協(xié)議,為解決技術(shù)問題的解析協(xié)議理解起來(lái)并不困難,只需要添加協(xié)議棧模塊的功能,使服務(wù)注冊(cè)代理可以同時(shí)為多個(gè)服務(wù)提供者服務(wù),其結(jié)構(gòu)模型如圖1所示。
服務(wù)框架模型的設(shè)計(jì)理念是讓服務(wù)注冊(cè)代理充當(dāng)網(wǎng)絡(luò)服務(wù)請(qǐng)求者和服務(wù)提供者的中轉(zhuǎn)角色,在網(wǎng)絡(luò)服務(wù)過程中對(duì)隱私信息進(jìn)行甄別并提供保護(hù)。服務(wù)注冊(cè)代理對(duì)服務(wù)提供者進(jìn)行管理,對(duì)其發(fā)布的信息進(jìn)行甄別與審核,對(duì)隱私信息內(nèi)容進(jìn)行保護(hù)并限制傳輸。服務(wù)注冊(cè)代理審核服務(wù)提供者,審核提供者的傳遞請(qǐng)求后,根據(jù)請(qǐng)求信息生成相應(yīng)的模塊,將服務(wù)地址作為服務(wù)發(fā)布地址放入服務(wù)注冊(cè)列表,并向公眾發(fā)布。服務(wù)請(qǐng)求者需要與網(wǎng)絡(luò)綁定,明確自身身份角色信息,并判斷自身使用權(quán)限。當(dāng)服務(wù)請(qǐng)求者與服務(wù)提供者建立鏈路后,管理模塊處于后臺(tái)監(jiān)管狀態(tài),并設(shè)置服務(wù)有效期。過期時(shí)模塊會(huì)自動(dòng)失效,服務(wù)提供者需要向服務(wù)注冊(cè)代理申請(qǐng)一個(gè)新模塊。
當(dāng)用戶需要某種類型的Web服務(wù)時(shí),可通過服務(wù)注冊(cè)代理的內(nèi)部檢索,匹配相應(yīng)的注冊(cè)服務(wù),將檢索獲得的地址異步映射(Asynchronous Mapping Procedure ,AMP)對(duì)應(yīng)相應(yīng)的服務(wù),從而實(shí)現(xiàn)與服務(wù)提供者的交互訪問,獲得相應(yīng)的服務(wù)。用戶在使用業(yè)務(wù)前,服務(wù)商預(yù)定隱私策略,根據(jù)用戶的偏好設(shè)定參數(shù),從而實(shí)現(xiàn)個(gè)性化保護(hù)。
AMP模塊由連接池、休眠池、純管理模塊、策略管理模塊和策略存儲(chǔ)模塊組成。連接池生成一定數(shù)量的存儲(chǔ)服務(wù)注冊(cè)機(jī)構(gòu)和有效的參數(shù),作為為用戶提供服務(wù)的基本單位存儲(chǔ)于休眠池中,并發(fā)布給服務(wù)用戶池中休眠的狀態(tài)稱為冬眠,經(jīng)過一段時(shí)間仍舊沒有接到服務(wù)請(qǐng)求則撤銷服務(wù)狀態(tài),返回連接池,等待再次被分配。策略管理模塊管理所有策略,為自定義策略修改參數(shù)表,形成新策略文件,并記錄下自定義的客戶信息,以便在后續(xù)服務(wù)中執(zhí)行新策略。策略存儲(chǔ)模塊是記載中心,存儲(chǔ)所有的策略文件。訪問服務(wù)時(shí),該模塊根據(jù)“用戶簡(jiǎn)介”章節(jié),將用戶信息中涉及個(gè)人隱私的內(nèi)容導(dǎo)入相應(yīng)的臨時(shí)信息中,并制作“與臨時(shí)信息相關(guān)的隱私信息文件”章節(jié)。該臨時(shí)信息既可以存儲(chǔ)在相應(yīng)策略中,完成相應(yīng)的策略應(yīng)答,也可以存儲(chǔ)在策略存儲(chǔ)模塊中,作為備份留待后續(xù)使用。策略存儲(chǔ)模塊將臨時(shí)信息或用戶審計(jì)結(jié)果發(fā)送給服務(wù)提供商,此時(shí)用戶可以從服務(wù)提供商獲取相應(yīng)的服務(wù)。當(dāng)請(qǐng)求的服務(wù)執(zhí)行完畢后,用戶將被釋放,策略管理模塊被設(shè)置為休眠狀態(tài),進(jìn)入休眠池中,操作將根據(jù)配置文件的 “隱私保護(hù)策略”中的定義對(duì)服務(wù)過程中基于用戶的信息進(jìn)行刪除或保存用戶隱私保護(hù)級(jí)別。為了節(jié)省資源,在休息一段時(shí)間后,策略管理模塊會(huì)再次單純地進(jìn)入連接池為用戶提供服務(wù)。
為區(qū)別對(duì)待用戶的不同類型需求,可根據(jù)不同類型選擇不同的Agent算法。享有高等級(jí)權(quán)限的用戶可以使用獨(dú)立的選擇策略,自主性更強(qiáng),即可以指定使用基于大數(shù)據(jù)分析的Agent保護(hù)信息算法,對(duì)普通權(quán)限用戶,則在休眠池中隨機(jī)選擇算法進(jìn)行處理,選擇過程不能干預(yù),以避免非法用戶快速獲取目標(biāo)。在引入隨機(jī)態(tài)處理算法的離散性基礎(chǔ)上,根據(jù)不同的應(yīng)用場(chǎng)景和需求,可以更換不一樣的計(jì)算方法來(lái)進(jìn)行計(jì)算,該文將介紹基于大數(shù)據(jù)分析的Agent保護(hù)信息算法。
在大數(shù)據(jù)中選擇隨機(jī)事件有多種方式。例如當(dāng)用戶按住鼠標(biāo),在計(jì)算機(jī)屏幕上隨機(jī)滑動(dòng)時(shí),鼠標(biāo)軌跡形成的曲線是隨機(jī)的。換句話說(shuō),即使是同一個(gè)用戶也不能畫出完全一致的曲線。對(duì)于該大數(shù)據(jù)事件選擇,可在用戶獲得服務(wù)的某段時(shí)間內(nèi),對(duì)鼠標(biāo)曲線進(jìn)行時(shí)間采樣。如果需要生成一個(gè)01位的序列,則以1/N的間隔對(duì)大數(shù)據(jù)進(jìn)行采樣,得到N個(gè)采樣點(diǎn),每個(gè)采樣點(diǎn)以鼠標(biāo)點(diǎn)在屏幕中的坐標(biāo)值表示。然后對(duì)坐標(biāo)值進(jìn)行降級(jí)處理,橫縱坐標(biāo)值相加,取最大整數(shù)。再對(duì)此結(jié)果進(jìn)行二值化處理,偶數(shù)記為0,奇數(shù)記為1,則得到一個(gè)由0和1組成的隨機(jī)數(shù)序列,即Seed[i](其中i=0,1,…,N-1)。具體獲取的Agent目標(biāo)的概率如公式(1)所示。

圖1 隱私信息保護(hù)結(jié)構(gòu)模型

式中:S為第一次的大數(shù)據(jù)捕捉結(jié)果;n為大數(shù)據(jù)中的有效代理個(gè)數(shù)。
利用線性同余法對(duì)大數(shù)據(jù)序列進(jìn)行進(jìn)一步處理,得到新的組合數(shù)序列,并得到N個(gè)位置在[0,N-1]之間的隨機(jī)數(shù),該隨機(jī)數(shù)可以記為A[j](其中j=0,1,…,N-1)。具體到某個(gè)目標(biāo)測(cè)試樣本時(shí),其加權(quán)頻率計(jì)算公式如公式(2)所示。

式中:TF為Agent算法中的加權(quán)頻率;w為數(shù)據(jù)權(quán)重;TF為大數(shù)據(jù)中所涵蓋的數(shù)量;D為有效時(shí)間內(nèi)的文本頻率。
隱私信息的竊取行為具有頻發(fā)性的特性,即實(shí)施者不會(huì)僅針對(duì)某些特定信息進(jìn)行竊取,而是通過頻繁地攻擊,用數(shù)量彌補(bǔ)成功概率低的問題。因此可在防護(hù)中抓住這一特點(diǎn),作為隱私信息竊取行為的標(biāo)簽,實(shí)施防衛(wèi)保護(hù)。另外,竊取隱私信息行為的搜索關(guān)鍵詞也具有典型特征,與被保護(hù)隱私的屬性、特點(diǎn)等向量值具有匹配性,這些關(guān)鍵信息恰恰是隱私信息保護(hù)的重點(diǎn)目標(biāo)。因此在算法設(shè)計(jì)中,可對(duì)不同的信息賦予不同的權(quán)重,區(qū)分普通信息與核心信息,實(shí)現(xiàn)有重點(diǎn)的保護(hù)。當(dāng)服務(wù)提供商向AMP服務(wù)注冊(cè)代理機(jī)構(gòu)提交申請(qǐng)時(shí),服務(wù)注冊(cè)代理機(jī)構(gòu)會(huì)進(jìn)行加密計(jì)算,根據(jù)計(jì)算結(jié)果確定參數(shù)配置標(biāo)準(zhǔn)以及相應(yīng)的接口,分配給服務(wù)提供商。服務(wù)提供商可以根據(jù)自己的需求對(duì)每個(gè)配置文件進(jìn)行參數(shù)配置。隱私保護(hù)可制定AMP多元化大數(shù)據(jù)策略,使用者可以根據(jù)自己的想法和需求來(lái)制定計(jì)劃,從而形成個(gè)人化的隱私保護(hù)管理機(jī)制。AMP模塊還有其他隱私保護(hù)參數(shù),可甄別出使用量大的參數(shù)信息,實(shí)現(xiàn)保護(hù)策略的多樣性,應(yīng)對(duì)更為多樣化的非授權(quán)獲取行為,達(dá)到平衡隱私保護(hù)和信息傳輸效率的較佳狀態(tài)。該文設(shè)計(jì)的隱私信息保護(hù)策略提供了一個(gè)可擴(kuò)展、非受控的平臺(tái),可以根據(jù)設(shè)計(jì)需要自行定義參數(shù),添加限定條件,實(shí)現(xiàn)多維度的隱私信息保護(hù)。
在大數(shù)據(jù)時(shí)代,控制隱私數(shù)據(jù)的信息安全和隱私保護(hù)是相當(dāng)重要的。但其保護(hù)手段的構(gòu)建存在一些限制因素,具體表現(xiàn)如下:首先,在大數(shù)據(jù)環(huán)境下,不好對(duì)信息角色做出構(gòu)建預(yù)設(shè)。其次,在信息安全管理過程中,計(jì)算機(jī)信息安全管理者沒有足夠的空間來(lái)獲取和訪問數(shù)據(jù)資源。再次,在信息分析中,一些信息用戶無(wú)法獲得系統(tǒng)的信息資源。在發(fā)生機(jī)制和隱私披露方面,第一步是建立完善的用戶信息隱私機(jī)制模型。用戶隱私披露點(diǎn)和發(fā)生機(jī)制之間的連接如圖2所示。
用戶不匿名使用網(wǎng)絡(luò)服務(wù),會(huì)導(dǎo)致隱私泄露。用戶個(gè)人信息被網(wǎng)絡(luò)服務(wù)方充分掌握的形式為隱私攻擊者對(duì)信息進(jìn)行攻擊,導(dǎo)致信息泄露;大數(shù)據(jù)從網(wǎng)絡(luò)服務(wù)接收信號(hào)、挖掘信息,然后開始挖掘第三方數(shù)據(jù)。但由于信息加密無(wú)法得到有效的結(jié)果,從而導(dǎo)致用戶信息泄露。用戶在使用網(wǎng)絡(luò)時(shí),留下的信息被隱私攻擊者竊取,進(jìn)而導(dǎo)致隱私信息泄露的主要原因是用戶對(duì)隱私保護(hù)的意識(shí)不強(qiáng),沒有使用有效的保護(hù)方法。一般來(lái)說(shuō),數(shù)據(jù)的存儲(chǔ)主要由網(wǎng)絡(luò)用戶、可信組織和驗(yàn)證者組成。網(wǎng)絡(luò)用戶使用可信組織將本地?cái)?shù)據(jù)信息存儲(chǔ)在云中,減少了本地存儲(chǔ)的負(fù)擔(dān),并允許合法用戶訪問他們的數(shù)據(jù)。在數(shù)據(jù)存儲(chǔ)過程中,可信組織對(duì)數(shù)據(jù)進(jìn)行塊化處理并生成密鑰,以保證后續(xù)數(shù)據(jù)具有一定的驗(yàn)證程度,然后將塊化數(shù)據(jù)分發(fā)到不同的節(jié)點(diǎn),并建立相應(yīng)的列表,再驗(yàn)證者檢查數(shù)據(jù)的完整性,并向云服務(wù)集群提出申請(qǐng)。當(dāng)云服務(wù)得到反饋結(jié)果時(shí),即對(duì)反饋結(jié)果進(jìn)行驗(yàn)證。在該過程中,如果有不能通過校驗(yàn)的塊數(shù)據(jù),就可以定位該塊數(shù)據(jù),并對(duì)其進(jìn)行適當(dāng)?shù)奶幚恚曰謴?fù)該塊數(shù)據(jù)。

圖2 用戶隱私與發(fā)生機(jī)制關(guān)系圖
該文在大數(shù)據(jù)分析的基礎(chǔ)上提出了大數(shù)據(jù)隱私保護(hù)策略研究,隱私保護(hù)框架模塊采用AMP模塊。AMP模塊具有良好的獨(dú)立性、擴(kuò)散性和兼容性,能在滿足大部分場(chǎng)合需求的情況下,建立隱私保護(hù)規(guī)則,形成個(gè)性化的隱私保護(hù)機(jī)制。AMP模塊還支持多種通信協(xié)議,可以在不改變?cè)锌蚣芙Y(jié)構(gòu)的情況下進(jìn)行通信,在不影響框架結(jié)構(gòu)的基礎(chǔ)上應(yīng)用于各種業(yè)務(wù)。該文的實(shí)驗(yàn)平臺(tái)是一個(gè)獨(dú)立于具體應(yīng)用的軟件平臺(tái),可根據(jù)不同顧客的不同需求,采取不同的隱私保護(hù)措施。開發(fā)保護(hù)策略的主要目的是為了保護(hù)用戶在使用服務(wù)時(shí)的個(gè)人信息。為了驗(yàn)證所提出的基于大數(shù)據(jù)的隱私保護(hù)模塊較好的性能,該文設(shè)計(jì)了面向服務(wù)參與者的隱私保護(hù)仿真試驗(yàn),以仿真試驗(yàn)中基于框架的部分使用設(shè)計(jì)為例,進(jìn)行的試驗(yàn)說(shuō)明,3個(gè)參與者分別是提供服務(wù)者、提供注冊(cè)信息者以及最后需要使用這項(xiàng)服務(wù)的用戶。2個(gè)模塊包括互聯(lián)網(wǎng)通信協(xié)議(Internet Protocol version,IPV)模塊和AMP模塊。具體破解率如公式(3)所示。

式中:S為所求破解率;n為代理個(gè)數(shù);t為有效時(shí)間;s為破解過程中的變化數(shù)值;s為在j點(diǎn)時(shí)的數(shù)據(jù)數(shù)值。
在試驗(yàn)過程中,用戶的隱私信息只提交給Agent,由于該試驗(yàn)使用了大數(shù)據(jù)連接休眠技術(shù),增強(qiáng)了服務(wù)提供者身份的隱秘性,其服務(wù)提供過程更不易被挾持,因此非授權(quán)的信息獲取方很難獲得對(duì)應(yīng)的Agent進(jìn)行破解,也無(wú)法獲得純包括用戶信息的服務(wù)提供者身份,在隱私信息的破解過程中不易找到準(zhǔn)確目標(biāo),在時(shí)間維度上造成了“波門選擇”效應(yīng),將非授權(quán)獲取信息行為屏蔽在外。即使獲取到零散信息,也僅是暫時(shí)掌握了用戶零碎的信息片段,所以服務(wù)提供者仍然不知道用戶的真實(shí)信息。從以上2點(diǎn)可以看出,AMP模塊有效地保護(hù)了用戶的隱私信息。
鑒于試驗(yàn)的隨機(jī)性,該試驗(yàn)將100次試驗(yàn)的數(shù)據(jù)為一組,在有效期內(nèi)選取5組試驗(yàn)的破解率為試驗(yàn)破解率值的代表。該試驗(yàn)設(shè)保護(hù)目標(biāo)為一個(gè)有效期內(nèi)的第一個(gè)服務(wù)用戶,并假定非法用戶采用破解手段試圖獲取其隱私信息。為降低干擾,在有效期內(nèi)不再提供其他服務(wù)。普通連接策略與大數(shù)據(jù)策略的試驗(yàn)結(jié)果對(duì)比見表1。
試驗(yàn)數(shù)據(jù)表明,在傳統(tǒng)網(wǎng)絡(luò)保護(hù)策略下,非法用戶的破解率均高于采用大數(shù)據(jù)分析的策略的破解率,同等有效時(shí)間下,基于大數(shù)據(jù)分析的隱私信息保護(hù)策略能有效減少隱私信息的破解,使用該方法時(shí)隱私保護(hù)效果有較大提升。通過對(duì)比傳統(tǒng)方式與基于大數(shù)據(jù)的隱私信息保護(hù)方式的破解率可以看出,在代理個(gè)數(shù)從20個(gè)增長(zhǎng)到100個(gè)的各個(gè)數(shù)據(jù)節(jié)點(diǎn)中,后者的破解率明顯低于前者,說(shuō)明后者可以更好地破解出入侵信息的病毒及隱私“窺探者”。隱私是當(dāng)今社會(huì)的熱點(diǎn)問題,而個(gè)人隱私保護(hù)的研究是一個(gè)新的課題。雖然該研究在試驗(yàn)設(shè)計(jì)和研究方法上具有一定創(chuàng)新性,但在隱私保護(hù)策略的細(xì)分、個(gè)人隱私的偏好程度等方面的研究仍存在不足,即對(duì)每個(gè)人對(duì)隱私的態(tài)度還沒有進(jìn)行深入研究。需要在今后進(jìn)一步發(fā)展。

表1 試驗(yàn)數(shù)據(jù)對(duì)比
事實(shí)上,將關(guān)于自己的隱私信息進(jìn)行處理和保護(hù)是一個(gè)復(fù)雜且困難的事情,是一個(gè)涉及線上秩序以及線下道德體系的綜合問題,其關(guān)系到個(gè)人、企業(yè)以及社會(huì)群體的切身利益,需要采用法律手段,結(jié)合社會(huì)監(jiān)督和有序懲戒,建立符合社會(huì)倫理規(guī)范的法律約束體系,形成以各方自律且有法可依的良性局面,對(duì)建立良好的網(wǎng)絡(luò)使用秩序具有重要意義。該文對(duì)機(jī)密計(jì)算機(jī)信息系統(tǒng)網(wǎng)絡(luò)安全影響因素進(jìn)行分析,發(fā)現(xiàn)人為因素和自然因素都對(duì)當(dāng)前的網(wǎng)絡(luò)安全產(chǎn)生了影響。因此,應(yīng)結(jié)合現(xiàn)代網(wǎng)絡(luò)安全監(jiān)控技術(shù),將加密技術(shù)、防火墻技術(shù)和入侵檢測(cè)技術(shù)應(yīng)用到對(duì)機(jī)密計(jì)算機(jī)信息系統(tǒng)的網(wǎng)絡(luò)安全監(jiān)控中,以提高當(dāng)前的網(wǎng)絡(luò)安全水平。