于景茹
(鄭州大學(xué)體育學(xué)院 體育教育系,河南 鄭州450044)
大數(shù)據(jù)是描述人們?cè)诟戮W(wǎng)絡(luò)搜索和索引過(guò)程中,需要進(jìn)行批量處理或分析的大量數(shù)據(jù)的集合。針對(duì)大量動(dòng)態(tài)數(shù)據(jù)的定向管理而保證用戶的隱私安全,是當(dāng)前最為嚴(yán)重的社會(huì)問(wèn)題。目前利用傳統(tǒng)的大數(shù)據(jù)隱私保護(hù)方法,已經(jīng)很難保證用戶使用數(shù)據(jù)的絕對(duì)安全性[1]。因此,本文將高等數(shù)學(xué)中交替方向乘子法,應(yīng)用于大數(shù)據(jù)隱私保護(hù)中,來(lái)切實(shí)有效的提高用戶的數(shù)據(jù)安全性。交替方向乘子法是現(xiàn)代高等數(shù)學(xué)中一種針對(duì)龐大數(shù)據(jù)進(jìn)行優(yōu)化和分類(lèi)的方法。由于其具有操作簡(jiǎn)單、容易理解并且工作效率高等特點(diǎn),所以被廣泛應(yīng)用于大數(shù)據(jù)處理工作中,尤其在針對(duì)大數(shù)據(jù)的保護(hù)環(huán)節(jié)中。
1.1 建立大數(shù)據(jù)隱私保護(hù)框架。想要提高大數(shù)據(jù)隱私保護(hù)的成功率,第一步就是建立大數(shù)據(jù)隱私保護(hù)的基本框架。建立框架的首要工作就是清楚大數(shù)據(jù)隱私保護(hù)過(guò)程中的大數(shù)據(jù)基本組成成分[2]。大數(shù)據(jù)的基本組成成分包括即數(shù)據(jù)采集、數(shù)據(jù)計(jì)算、數(shù)據(jù)整合、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析等五個(gè)基本模塊;清楚這些模塊,就等于清楚了需要數(shù)據(jù)保護(hù)的工作任務(wù),即大數(shù)據(jù)在整條工作鏈上的全部隱私保護(hù)工作。其次則為基于交替方向乘子法針對(duì)隱私保護(hù)的全部工作內(nèi)容,其中包括了主要工作內(nèi)容為分類(lèi)大數(shù)據(jù)資源和繪制隱私保護(hù)處理網(wǎng)格。
1.2 分類(lèi)大數(shù)據(jù)資源。采用有中交替方向乘子法對(duì)大數(shù)據(jù)進(jìn)行分步處理數(shù)據(jù)的過(guò)程中,首先找出大數(shù)據(jù)中的客戶發(fā)射中心,并以此作為數(shù)據(jù)處理的核心環(huán)節(jié)。利用交替方向乘子法,將中心節(jié)點(diǎn)以函數(shù)的形式表達(dá)出來(lái),并通過(guò)對(duì)比其它數(shù)據(jù)于中心節(jié)點(diǎn)之間函數(shù)至的大小關(guān)系,將數(shù)據(jù)以函數(shù)節(jié)點(diǎn)為界限,分為兩大類(lèi)進(jìn)行處理,其中用到的交替方向乘子法公式如下所示:

式中:x0為中心節(jié)點(diǎn)所在數(shù)據(jù)中的編號(hào);g(x0)為中心節(jié)點(diǎn)數(shù)據(jù)數(shù)對(duì)應(yīng)的函數(shù)值;A、B 為數(shù)據(jù)與函數(shù)值之間對(duì)應(yīng)的特定常數(shù);x 為數(shù)據(jù)的特定編號(hào);f1(x)為小于中心節(jié)點(diǎn)的函數(shù)值;f2(x)為大于中心節(jié)點(diǎn)的函數(shù)值。將數(shù)據(jù)信息進(jìn)行分類(lèi)處理后,以中心節(jié)點(diǎn)為起點(diǎn),對(duì)全網(wǎng)內(nèi)所有數(shù)據(jù)信息進(jìn)行融合式信的數(shù)據(jù)調(diào)度行為。在數(shù)據(jù)調(diào)度過(guò)程中,針對(duì)中心分布式數(shù)據(jù)處理方式,網(wǎng)絡(luò)中所有節(jié)點(diǎn)具有相同地位,超過(guò)中心節(jié)點(diǎn)的數(shù)據(jù)歸為一類(lèi)由協(xié)調(diào)全網(wǎng)處理,信息只在鄰近節(jié)點(diǎn)間相互傳遞。為超過(guò)中心節(jié)點(diǎn)函數(shù)值的數(shù)據(jù)需要中心節(jié)點(diǎn)去統(tǒng)籌全局?jǐn)?shù)據(jù)并進(jìn)行集中式優(yōu)化[3]。關(guān)于是否超過(guò)中心節(jié)點(diǎn)函數(shù)值的問(wèn)題,在分類(lèi)大數(shù)據(jù)資源中網(wǎng)絡(luò)中每個(gè)數(shù)據(jù)僅跟其鄰近節(jié)點(diǎn)進(jìn)行有限的數(shù)據(jù)兌換,能利用本地?cái)?shù)據(jù)實(shí)現(xiàn)自主的分布式優(yōu)化。當(dāng)網(wǎng)絡(luò)規(guī)模與數(shù)據(jù)量增大時(shí),有中心分布式算法需要大量本地?cái)?shù)據(jù)傳遞至中心節(jié)點(diǎn),通信負(fù)擔(dān)重,且易受節(jié)點(diǎn)損壞與鏈路中斷等異常情況的影響;而無(wú)中心分布式算法則無(wú)需全局?jǐn)?shù)據(jù)的定向傳遞,僅由鄰居節(jié)點(diǎn)交換有限的信息以協(xié)調(diào)優(yōu)化進(jìn)程,通信負(fù)擔(dān)低,魯棒性強(qiáng);并且從網(wǎng)絡(luò)拓?fù)涞挠^點(diǎn)去考察這兩種分布式算法,可以發(fā)現(xiàn)有中心分布式算法基于的星型拓?fù)淦鋵?shí)可以看成是無(wú)中心分布式算法基于的隨機(jī)拓?fù)涞囊粋€(gè)特例。因此,為了成功使用交替方向乘子法實(shí)現(xiàn)針對(duì)大數(shù)據(jù)隱私的保護(hù)作用,就必須以中心節(jié)點(diǎn)為界限對(duì)數(shù)據(jù)資源進(jìn)行分類(lèi)。
1.3 繪制隱私保護(hù)處理網(wǎng)格。將大數(shù)據(jù)資源進(jìn)行了系統(tǒng)的分類(lèi)之后,就到了最核心的隱私保護(hù)大數(shù)據(jù)資源的環(huán)節(jié)。針對(duì)數(shù)據(jù)特征指定其特有的隱私保護(hù)函數(shù)。在構(gòu)建函數(shù)的過(guò)程中數(shù)據(jù)的處理速度和處理大小是根據(jù)其性質(zhì)所決定的。因此,基于交替方向乘子法采用了建立函數(shù)的方法來(lái)實(shí)現(xiàn)針對(duì)數(shù)據(jù)流聚類(lèi)的隱私保護(hù)。該方法利用以傳統(tǒng)的平面X&Y 直角坐標(biāo)系為底板,將數(shù)據(jù)所對(duì)應(yīng)的函數(shù)值均表示在所構(gòu)建的直角坐標(biāo)系中,并通過(guò)繪制存儲(chǔ)網(wǎng)格的方法,來(lái)針對(duì)每個(gè)數(shù)據(jù)施行隱私保護(hù)。
根據(jù)中心節(jié)點(diǎn)的特征分為三個(gè)區(qū)域分別為:中心節(jié)點(diǎn)內(nèi)部單元格區(qū)域;中心節(jié)點(diǎn)邊緣區(qū)域和中心節(jié)點(diǎn)外圍區(qū)域。圖中網(wǎng)格的縱坐標(biāo)為r0、r1和r2。以此來(lái)收集大數(shù)據(jù),并進(jìn)行針對(duì)性處理。其中落于r1到r2階段的數(shù)據(jù)為函數(shù)值小于中心節(jié)點(diǎn)的數(shù)據(jù)類(lèi)型,而落于r0到r1階段的數(shù)據(jù)為函數(shù)值大于中心節(jié)點(diǎn)的數(shù)據(jù)類(lèi)型。以這些特定網(wǎng)格為基本處理單位,將數(shù)據(jù)進(jìn)行隱藏處理。將隱匿空間生成時(shí)間以及每個(gè)服務(wù)需求來(lái)完成針對(duì)其數(shù)據(jù)內(nèi)容的隱私保護(hù)工作。
2.1 實(shí)驗(yàn)準(zhǔn)備。本實(shí)驗(yàn)采用為某地的一個(gè)公共廣場(chǎng)作為實(shí)驗(yàn)基地,通過(guò)電子計(jì)算機(jī)技術(shù)來(lái)生成的實(shí)驗(yàn)需要的模擬大數(shù)據(jù)基地,之后將該基地分為四個(gè)實(shí)驗(yàn)場(chǎng)景,實(shí)驗(yàn)場(chǎng)景的具體特征如表1 所示。
根據(jù)上表可知,從場(chǎng)景1 到場(chǎng)景4,用戶的數(shù)據(jù)總數(shù)從4000增長(zhǎng)到5500。因?yàn)橐M日常用戶生活或者辦公時(shí)的要求,所以針對(duì)實(shí)驗(yàn)場(chǎng)景設(shè)備處理的點(diǎn)對(duì)點(diǎn)處理速率為每條數(shù)據(jù)在150毫秒中左右。為了實(shí)驗(yàn)過(guò)程中便于操作,將大數(shù)據(jù)中的資源分類(lèi)為若干個(gè)信息量為128 字節(jié)的小型數(shù)據(jù)庫(kù)。實(shí)驗(yàn)過(guò)程中,采用基于交替方向乘子法的大數(shù)據(jù)隱私保護(hù)方法與傳統(tǒng)的隱私方法同時(shí)對(duì)四個(gè)實(shí)驗(yàn)基地的數(shù)據(jù)進(jìn)行隱私保護(hù)處理,兩種方法的可允許位置信息最長(zhǎng)的操作時(shí)間均為10 秒,最長(zhǎng)等待時(shí)間均為8 秒;最終得到兩種不同的數(shù)據(jù)隱藏處理結(jié)果。通過(guò)對(duì)比兩種方法處理下數(shù)據(jù)隱藏的成功率,來(lái)判定基于交替方向乘子法的大數(shù)據(jù)隱私保護(hù)方法的實(shí)用價(jià)值。

表1 為四個(gè)實(shí)驗(yàn)場(chǎng)景數(shù)據(jù)信息說(shuō)明
2.2 結(jié)果討論。圖1 為兩種處理方法得到的不同成功率對(duì)比結(jié)果。

圖1 為兩種隱私保護(hù)方法成功率對(duì)比圖
根據(jù)圖1 可知,基于交替方向乘子法的大數(shù)據(jù)隱私保護(hù)方法在四個(gè)特定的實(shí)驗(yàn)場(chǎng)景中,其針對(duì)隱私保護(hù)的處理成功率平均值達(dá)到了84%,而傳統(tǒng)隱私保護(hù)方法的成功率僅達(dá)到了78%,因此證明了基于交替方向乘子法的大數(shù)據(jù)隱私保護(hù)方法的實(shí)用價(jià)值。
現(xiàn)代大數(shù)據(jù)技術(shù)已經(jīng)在人民群眾中已經(jīng)達(dá)到了普及階段,因此針對(duì)大數(shù)據(jù)的隱私保護(hù)是當(dāng)下一個(gè)相當(dāng)嚴(yán)峻的工作?;诮惶娣较虺俗臃ǖ膽?yīng)用,可以大大提高隱私保護(hù)的工作效率。但目前,我國(guó)在大數(shù)據(jù)隱私保護(hù)技術(shù)還不成熟,并且針對(duì)隱私保護(hù)的法律法規(guī)也不夠健全。為了保證如今大數(shù)據(jù)的穩(wěn)定發(fā)展,需要當(dāng)代的研究人員和學(xué)者不斷的探索和努力,保證廣大人民群眾的最根本利益。