999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于局部差分隱私的表情包收集機(jī)制

2019-09-24 02:00:29陳航張帥奇曾慶馗
電腦知識與技術(shù) 2019年19期

陳航 張帥奇 曾慶馗

摘要:數(shù)據(jù)分析公司通過收集用戶的信息來了解某一群體的統(tǒng)計(jì)數(shù)據(jù),例如通過收集用戶聊天時發(fā)送的最頻繁的表情包來獲取人群的情感分析。然而這一過程中卻可能存在著隱私泄露的問題,針對這一特殊情景,本文基于局部差分隱私算法,將其應(yīng)用在表情包頻數(shù)收集的環(huán)境當(dāng)中,通過模擬數(shù)據(jù)的多輪測試和實(shí)驗(yàn),得到了該算法的可用性分析,實(shí)驗(yàn)結(jié)果表明本文所采用的方法可以很好地解決表情包收集的隱私保護(hù)問題。

關(guān)鍵詞:局部差分隱私;表情包收集;隱私保護(hù)

中圖分類號:TP311? ? ? 文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2019)19-0208-03

1介紹

伴隨網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)企業(yè)數(shù)量暴增,互聯(lián)網(wǎng)企業(yè)需要對獲得用戶的統(tǒng)計(jì)信息以更好地提供服務(wù)。通常這些公司會將數(shù)據(jù)送往第三方數(shù)據(jù)分析公司進(jìn)行數(shù)據(jù)分析,然而在收集用戶信息以改善用戶體驗(yàn)的過程中也產(chǎn)生了隱私泄漏的問題。包括在數(shù)據(jù)的本地存儲,數(shù)據(jù)的傳輸和數(shù)據(jù)的云端存儲各個環(huán)節(jié)中都有類似的安全事件不斷爆出。例如華住酒店的大量酒店數(shù)據(jù)泄露并在暗網(wǎng)上銷售[1], Facebook泄露用戶隱私并進(jìn)行違法濫用[2]。

面對隱私保護(hù)日益嚴(yán)峻的形勢,如何保障用戶的隱私并解決隱私泄露問題已成為當(dāng)下熱門的討論話題。k-anonymity[3]、l-diversity[4]、t-closeness[5]等方法相繼被提出用于隱私數(shù)據(jù)的保護(hù),這些方法提供了一些隱私保護(hù)思路,但是這類隱私保護(hù)方法會通過不同的攻擊方法而泄露敏感信息例如鏈接攻擊[6]。差分隱私[7]作為目前最為流行的隱私保護(hù)方法,解決了以上方法存在的問題并定義了隱私保護(hù)程度。

傳統(tǒng)的差分隱私模型以中心為基礎(chǔ),用戶收據(jù)收集到服務(wù)商進(jìn)行聚合,對數(shù)據(jù)庫進(jìn)行添加噪聲從而發(fā)布帶有噪聲的中間件以提供查詢服務(wù)。然而,這個過程中存在不可信服務(wù)商的問題,第三方服務(wù)者存在將隱私泄露的風(fēng)險,例如內(nèi)部員工泄露和遭受惡意攻擊。局部差分隱私[8]針對不可信第三方服務(wù)者,提出了更加合理的隱私保護(hù)方法,通過對用戶端發(fā)送的數(shù)據(jù)進(jìn)行擾動,在服務(wù)器端聚合擾動數(shù)據(jù)的方式來提供差分隱私保障。

在不可信第三方數(shù)據(jù)分析平臺分析數(shù)據(jù)時,存在的隱私泄露風(fēng)險可以通過局部差分隱私模型消除。本文以不可信第三方數(shù)據(jù)收集者收集用戶表情包為例,實(shí)現(xiàn)基于局部差分隱私的表情包收集機(jī)制,在提供隱私保障的同時保持較高的數(shù)據(jù)可用性,通過實(shí)際環(huán)境部署進(jìn)行試驗(yàn)測試。

2 基本概念

定義 局部差分隱私:給定n條用戶的隱私記錄,對于數(shù)據(jù)集中的任意兩條記錄d和d′,若算法A作用于兩條記錄的結(jié)果是相同的,且都為[d*],即滿足如下的關(guān)系式,則稱A算法滿足[?]-局部差分隱私,其中e稱為隱私保護(hù)預(yù)算,其值越大,數(shù)據(jù)可用性越高,越小,對用戶隱私保護(hù)的效果越好。

即攻擊者憑借已有的背景知識,即使知道了算法A的輸出也不能輕易推斷出輸入到底是對應(yīng)哪一條記錄,提供了不可確定性。

其中本文應(yīng)用的HCMS(Hadamard Count Mean Sketch)[9]算法引入的隨機(jī)噪音,在原始的輸入上添加噪音,是滿足差分隱私定義的,首先客戶端算法是A,對于兩個數(shù)據(jù)條目d和d′,得到相同的輸出[d*]的概率是相近的。

3 算法

假設(shè)一個用戶a給用戶b發(fā)送了一個表情emo1,客戶端算法首先根據(jù)哈希函數(shù)的范圍初始化一個獨(dú)熱向量v,然后在k個哈希函數(shù)中隨機(jī)選取一個哈希函數(shù)hj,然后通過選取的哈希函數(shù)hj將表情emo1編碼成一個索引,然后把v的第hj(emo1)位比特置為1,然后對向量v進(jìn)行Hadamard基變換得到向量w,然后隨機(jī)選取向量w中的某一位以概率(ee+1)-1進(jìn)行隨機(jī)翻轉(zhuǎn),最后向服務(wù)器端發(fā)送噪聲報告s。

算法1:HCMS(Hadamard Count Mean Sketch)客戶端算法

輸入:用戶的某個屬性值d∈D,隱私預(yù)算[?],哈希散列函數(shù)列表

輸出:擾動位w,哈希函數(shù)索引j,擾動位索引

1) 首先從k個哈希函數(shù)中隨機(jī)選取一個,記下其索引j

2) 初始化一個m位的向量v,初始值為0

3) 把v的第[hj(d)]位設(shè)為1

4) 構(gòu)建一個大小為m的阿達(dá)馬矩陣Hm,使w=Hmv

5) 在v中隨機(jī)抽取一個位,記下其索引l

6) 按概率(ee+1)-1隨機(jī)翻轉(zhuǎn)[wl]比特位,翻轉(zhuǎn)后的向量記為[w]

7) 返回報告s{[w],索引j和索引l)

算法2:HCMS(Hadamard Count Mean Sketch)服務(wù)端算法

輸入:n條用戶記錄{([w(1),j(1),l(1)]),…, ([w(n),j(n),l(n)])},隱私預(yù)算[?],哈希函數(shù)個數(shù)k和向量長度m

1) 使[c?=e?+1e?-1]

2) 初始化長度為n的x二維數(shù)組

3) 對于每一個i∈[n],使[x(i)=k·c?·w(i)]

4) 初始化一個{0}k*m維度的Mh矩陣

5) 通過Mh=MhHmT將矩陣的行轉(zhuǎn)換回來

6) 計(jì)算屬性值d的頻數(shù)[f(d)=(mm-1)(1kl=1kMl,hl(d)-nm)]

7) 返回每個屬性值的頻數(shù)f(d)

為了進(jìn)一步的解釋此算法,假設(shè)用戶訪問網(wǎng)絡(luò)域名www.example.com。客戶端算法從一組候選散列函數(shù){h1,h2,h3,...,hk}中選擇一個隨機(jī)哈希函數(shù),并使用選擇的哈希函數(shù)h1將web域編碼到一個小空間中,我們令h1(www.example.com)=33。這個編碼被寫成一個獨(dú)熱向量v=(0, 0, ..., 0, 1, 0, ..., 0, 0),其中,第33位置的值為1。想要傳輸一個比特,一個簡單的方法就是從向量v中采樣并發(fā)送一個隨機(jī)坐標(biāo),然而,這會顯著增加結(jié)果直方圖中的誤差(方差)。為了減少方差,在v中使用Hadamard基變換矩陣H,以獲得V′=Hv=(+1,?1,…,+1)。例如,有一個從V′中采樣獲得的隨機(jī)坐標(biāo),相應(yīng)的比特以概率(ee+1)-1進(jìn)行翻轉(zhuǎn),從而確保滿足e-差分隱私。發(fā)送到服務(wù)器的報告s包括所選的哈希函數(shù)的索引、采樣的坐標(biāo)索引和隱私化比特。

服務(wù)器端算法使用的是數(shù)據(jù)結(jié)構(gòu)Sketch矩陣M,將從客戶端那里收集到的隱私向量進(jìn)行聚合。M矩陣的行向量為哈希函數(shù)的索引,列向量是由樣本的隨機(jī)坐標(biāo)的索引。矩陣的第(j, l)元素聚合了設(shè)備所提交的隱私化向量,即從向量中選擇第j個哈希函數(shù)hj,并采樣第l個坐標(biāo)。繼而進(jìn)一步對私有化向量進(jìn)行適當(dāng)?shù)臄U(kuò)展,使用可逆Hadamard矩陣將M轉(zhuǎn)換回原來的基底中。在這個階段,矩陣的每一行都有助于為元素的頻率提供一個無偏差估計(jì)量。要計(jì)算一個web域www.example.com的頻率,這個算法首先通過讀取j行的M[j,hj (www.example.com)]以獲得M中每一行的無偏差估計(jì),最后計(jì)算出這些k估計(jì)的平均值以減少方差。

4 實(shí)驗(yàn)

實(shí)驗(yàn)環(huán)境設(shè)置,CPU:i7-7700hq,內(nèi)存:16G,實(shí)驗(yàn)所用數(shù)據(jù)聚為模擬數(shù)據(jù)集使用均勻分布和拉帕拉斯分布隨機(jī)生成的數(shù)據(jù)集。使用MAPE(平均絕對值百分比誤差)作為實(shí)驗(yàn)衡量標(biāo)準(zhǔn),為減小分布偶然性波動對實(shí)驗(yàn)的準(zhǔn)確率影響,每個實(shí)驗(yàn)運(yùn)行10次,以驗(yàn)證概算的可靠性。

在實(shí)驗(yàn)設(shè)置中分別控制m和k不變,以驗(yàn)證e和d的改變對實(shí)驗(yàn)造成的影響,在選定k=8192, m=256, n=100000的條件下生成十組滿足均勻分布的模擬數(shù)據(jù),通過服務(wù)器端算法進(jìn)行聚合獲得每個屬性的估計(jì)值,如圖1所示。

5 結(jié)論

針對收集表情包頻數(shù)這一具體問題,提出了如何保護(hù)用戶隱私的同時高效的收集數(shù)據(jù),采用了局部差分隱私機(jī)制作為收集方法,通過實(shí)際瀏覽器插件模擬真實(shí)收集場景,并部署服務(wù)器端算法以收集數(shù)據(jù)。最后通過仿真實(shí)驗(yàn)對算法機(jī)制進(jìn)行討論,該機(jī)制可以很好地保持原始數(shù)據(jù)分布的特征,在數(shù)據(jù)效用和隱私保障方面有很好的效果。然而還存在一些不足的地方,當(dāng)數(shù)據(jù)量較小時,數(shù)據(jù)可用性較差,以及參數(shù)的最優(yōu)化選取等問題。之后將對這機(jī)制進(jìn)行改進(jìn)研究,更高效的收集數(shù)據(jù)信息同時保護(hù)用戶的隱私。

參考文獻(xiàn):

[1] https://www.sohu.com/a/250601044_100216761

[2] https://www.sohu.com/a/226062595_460436

[3] L. Sweeney. k-anonymity: A model for protecting privacy. International Journal of Uncertainty[J]. Fuzziness and Knowledge-Based Systems,2002,10(5): 557~570.

[4] A. Machanavajjhala, D. Kifer, J. Gehrke and et al..l-diversity: Privacy beyond k-anonymity[C]. ACM Transactions on Knowledge Discovery from Data (TKDD) 1, no. 1 (2007): 3

[5] Li, Ninghui, Tiancheng Li, and Suresh Venkatasubramanian. t-closeness: Privacy beyond k-anonymity and l-diversity[C].2007 IEEE 23rd International Conference on Data Engineering. IEEE, 2007.

[6] 楊高明,方賢進(jìn),肖亞飛.局部差分隱私約束的鏈接攻擊保護(hù)[J].計(jì)算機(jī)科學(xué)與探索,2019, 13(02):251-262.

[7] Dwork, Cynthia. Differential privacy[J]. Encyclopedia of Cryptography and Security ,2011: 338-340.

[8] Duchi, John C., Michael I. Jordan, and Martin J. Wainwright. Local privacy and statistical minimax rates[C].2013 IEEE 54th Annual Symposium on Foundations of Computer Science. IEEE, 2013.

[9] Differential Privacy Team Apple. Learning with privacy at scale. Technical report, Apple, 2017

【通聯(lián)編輯:梁書】

主站蜘蛛池模板: 波多野结衣一区二区三区AV| 国产一区二区三区免费| 在线人成精品免费视频| a毛片在线| 久久国产成人精品国产成人亚洲 | 首页亚洲国产丝袜长腿综合| 一本久道久久综合多人| 尤物在线观看乱码| 国产在线观看成人91| 综合色区亚洲熟妇在线| 最新无码专区超级碰碰碰| 亚洲av无码人妻| 久久国产亚洲欧美日韩精品| 欧美日韩午夜视频在线观看| 91蝌蚪视频在线观看| 国产精品爽爽va在线无码观看| 99草精品视频| 国产欧美中文字幕| 国产一区二区三区精品久久呦| www中文字幕在线观看| 无码区日韩专区免费系列 | 欧美国产综合色视频| 欧美成在线视频| 亚洲成A人V欧美综合天堂| 一级爆乳无码av| 国语少妇高潮| 日韩第一页在线| 国产理论精品| 亚洲日韩精品伊甸| a毛片免费观看| 制服丝袜国产精品| 午夜a视频| 高潮爽到爆的喷水女主播视频| 国产成年女人特黄特色毛片免| 18禁黄无遮挡网站| 亚洲伦理一区二区| 久久一级电影| 园内精品自拍视频在线播放| 久久精品波多野结衣| 久久美女精品| 美女无遮挡拍拍拍免费视频| 成人久久18免费网站| 亚洲一级毛片| 精品视频一区二区观看| 日韩福利在线视频| 71pao成人国产永久免费视频| 国产好痛疼轻点好爽的视频| 特级精品毛片免费观看| 波多野结衣久久精品| 欧美日韩国产系列在线观看| 国产簧片免费在线播放| 91精品人妻一区二区| 欧美不卡在线视频| 亚洲日韩第九十九页| 亚洲不卡网| 日韩欧美91| 午夜性刺激在线观看免费| 国产免费网址| 亚洲成人黄色网址| 99福利视频导航| 免费无遮挡AV| 亚洲色图综合在线| 亚洲中文字幕23页在线| 久久国产精品麻豆系列| 亚洲成人在线免费| 欧美三级视频在线播放| 亚洲精品桃花岛av在线| 国产成人无码播放| 全部免费毛片免费播放| 成人综合网址| 日韩二区三区无| 成人福利视频网| yjizz视频最新网站在线| 激情综合图区| 在线免费不卡视频| 久久久久青草大香线综合精品| 中文字幕免费播放| 在线无码九区| 91一级片| 97人妻精品专区久久久久| 在线网站18禁| 在线观看网站国产|