999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

隨機(jī)投影技術(shù)數(shù)據(jù)挖掘隱私的保護(hù)方法

2015-02-20 01:57:09黃取治
安順學(xué)院學(xué)報(bào) 2015年1期
關(guān)鍵詞:數(shù)據(jù)挖掘

黃取治

(福建師范大學(xué)信息技術(shù)學(xué)院,福建 福州350007)

?

隨機(jī)投影技術(shù)數(shù)據(jù)挖掘隱私的保護(hù)方法

黃取治

(福建師范大學(xué)信息技術(shù)學(xué)院,福建福州350007)

摘要:為確保隱私保護(hù)數(shù)據(jù)挖掘中所存在的維數(shù)災(zāi)難問(wèn)題得到有效解決,文章提出了將基于隨機(jī)投影技術(shù)的一種數(shù)據(jù)挖掘隱私保護(hù)法。這種方法對(duì)攻擊者能夠以隨機(jī)投影矩陣推測(cè)的方式重建原始數(shù)據(jù)進(jìn)行了綜合考慮,首先將安全子空空間概念提出來(lái),再構(gòu)建安全子空間映射,在低失真嵌入實(shí)現(xiàn)的同時(shí),能夠有效確保數(shù)據(jù)安全。通過(guò)實(shí)驗(yàn)證明,在對(duì)數(shù)據(jù)隱私予以保護(hù)的前提下,這種方法為數(shù)據(jù)質(zhì)量提供有效保障。

關(guān)鍵詞:數(shù)據(jù)挖掘;隨機(jī)投影技術(shù);隱私保護(hù)

由于迅猛發(fā)展的信息技術(shù),使得相關(guān)企業(yè)機(jī)構(gòu)能夠收集有效的個(gè)人與組織信息,進(jìn)而實(shí)施數(shù)據(jù)分析及挖掘,以此為機(jī)構(gòu)帶來(lái)更多科研及商業(yè)價(jià)值。然而,在數(shù)據(jù)分布過(guò)程中,人工普查數(shù)據(jù)、醫(yī)療數(shù)據(jù)及交易數(shù)據(jù)等很多個(gè)人隱私信息均存在隱私泄露的問(wèn)題[1]。

1相關(guān)概念

1.1 隨機(jī)投影

1.2 通用哈希函數(shù)

由均勻分布的哈希函數(shù)族中將一個(gè)哈希函數(shù)隨機(jī)選取出來(lái),是通用哈希函數(shù)理念的主要內(nèi)容,基于給定輸入,對(duì)哈希函數(shù)隨機(jī)選擇后,在已知概率范圍中得出相同哈希值,即:從哈希函數(shù)族H中,通過(guò)隨機(jī)選擇的方式給定一個(gè)哈希值y與哈希函數(shù)h,使其滿足y=h(x)的x值是均勻分布的。

2安全子空間方法

3實(shí)驗(yàn)分析

3.1 實(shí)驗(yàn)數(shù)據(jù)與環(huán)境

實(shí)驗(yàn)對(duì)三個(gè)數(shù)據(jù)集進(jìn)行選取,這三個(gè)數(shù)據(jù)集中,有兩個(gè)選于UCI學(xué)習(xí)數(shù)據(jù)庫(kù),即:arr hythmia數(shù)據(jù)集、arcene數(shù)據(jù)集,其中arcene數(shù)據(jù)集中含有1000個(gè)屬性與900個(gè)樣本,這一數(shù)據(jù)集本身屬于二分類問(wèn)題。此外,arr hythmia數(shù)據(jù)集中有279個(gè)屬性與453個(gè)樣本。三個(gè)數(shù)據(jù)集中,還有一個(gè)數(shù)據(jù)集為Reuters-5topic,此為RCVI數(shù)據(jù)集子集。本實(shí)驗(yàn)將320個(gè)實(shí)例選取出來(lái),在將非關(guān)鍵詞匯去除后,將4186個(gè)屬性整理出來(lái)[4]。具體實(shí)驗(yàn)環(huán)境:4GB內(nèi)存,intelcorei5處理器,MicrosoftWindows7,1TB硬盤,對(duì)matlab測(cè)試(32位)予以使用。

3.2 實(shí)驗(yàn)結(jié)果

首先對(duì)比傳統(tǒng)高斯隨機(jī)投影和安全子空間法對(duì)內(nèi)積保護(hù)程度和原始數(shù)據(jù)間距離,評(píng)估在數(shù)據(jù)可用性領(lǐng)域兩種方法的性能,再選取選取K-均值聚類算法與支持向量機(jī)分算法實(shí)施測(cè)試,對(duì)在數(shù)據(jù)挖掘應(yīng)用方面兩者的有效性進(jìn)行評(píng)估,通過(guò)原始數(shù)據(jù)挖掘精度與隱私保護(hù)后挖掘精度比值對(duì)其有效性進(jìn)行度量,如果原始數(shù)據(jù)和隱私保護(hù)數(shù)據(jù)上兩者的挖掘結(jié)果精度分別為C0、Cp,則數(shù)據(jù)有效性Qc=Cp/Co.

哈希函數(shù)在實(shí)驗(yàn)中通過(guò)乘法通用哈希,假設(shè)A={a∣a([2l],a∈奇數(shù)},那么,該通用哈希函數(shù)族:H={ha︱a(A},該公式中,ha(x)=div2l-m(axmod2l),如果d為偶數(shù),則l=log2d,如果dw為奇數(shù),那么l=log2(d+1);如果k∈偶數(shù),那么m=log2k,如果K∈奇數(shù),那么m=log2(k+1),其中k表示子空間維數(shù),d表示原始數(shù)據(jù)維數(shù),div取商整數(shù)部分,mod為模運(yùn)算。

1、實(shí)驗(yàn)一:內(nèi)積和歐式距離

本實(shí)驗(yàn)對(duì)arcene數(shù)據(jù)集進(jìn)行選取,因?yàn)榫仃囯S機(jī)生成,所以實(shí)驗(yàn)各運(yùn)行大約10次,選取誤差平均值,不同投影維數(shù)下,內(nèi)積與歐式距離兩者相對(duì)誤差見(jiàn)圖1,從中可知,安全子空間對(duì)內(nèi)積與歐式距離的保護(hù)大致和高斯投影等同,而且具有越大的投影維數(shù),其結(jié)果與高斯投影越接近,且投影維數(shù)越大,相對(duì)誤差也就越低,如果投影維數(shù)為3000,那么相對(duì)誤差就會(huì)降低0.2%。由此充分表明安全子空間在合理、有效投影維數(shù)內(nèi)能夠確保數(shù)據(jù)可用性[5]。

2、實(shí)驗(yàn)二:聚類

通過(guò)Reuters-5topic數(shù)據(jù)集與K均值算法對(duì)聚類中安全子空間有效性進(jìn)行測(cè)試,分別對(duì)數(shù)據(jù)轉(zhuǎn)換后聚類精度與原始數(shù)據(jù)聚類精度進(jìn)行測(cè)試,假設(shè)K均值算法K=5,以歐式距離作為相似度度量距離,聚類精度在各投影維數(shù)下見(jiàn)表1,在投影維數(shù)大約是原始數(shù)據(jù)維數(shù)1/2時(shí),投影數(shù)據(jù)聚類結(jié)果和實(shí)際聚類相接近,通過(guò)對(duì)比顯示,該實(shí)驗(yàn)數(shù)據(jù)具有比較高的數(shù)據(jù)集維數(shù),具有越高的原始維數(shù),那么安全子空間法就具有越好的應(yīng)用效果。

表1 各投影維數(shù)下聚類準(zhǔn)確率

4結(jié)語(yǔ)

文章基于隨機(jī)投影技術(shù)的一種數(shù)據(jù)挖掘隱私保護(hù)法提出來(lái),并將安全子空間映射與安全子空間的概念提出來(lái),并創(chuàng)建安全子空間映射,通過(guò)投影轉(zhuǎn)換來(lái)保護(hù)原始數(shù)據(jù),利用哈希技術(shù)對(duì)投影矩陣予以加密生成,從數(shù)學(xué)角度證明了安全子空間法本身所具有的有效性,并將相關(guān)理論依據(jù)提供出來(lái),在高位數(shù)據(jù)挖掘處理過(guò)程中,這種方法可以對(duì)隱私問(wèn)題進(jìn)行更好的保護(hù),能夠有效確保數(shù)據(jù)安全。

參考文獻(xiàn):

[1]張鋒,孫雪冬,常會(huì)友等·兩方參與的隱私保護(hù)協(xié)同過(guò)濾推薦研究[J].電子學(xué)報(bào),2009,37(1):84-89.

[2]李光,王亞?wèn)|·一種改進(jìn)的基于奇異值分解的隱私保持分類挖掘方法[J].電子學(xué)報(bào),2012,40(4):739-744.

[3]CC Aggarwal, P S Yu·A General Survey of Privacy-preservingData Mining Models and Algorithms [M] .NewYork:Springer US, 2008:11-52 .

[4]SLee , M G Genton , R B Arellano-Valle .Perturbation of numericalconfidential data via skew-t distributions[J].ManagementScience , 2010, 56(2):318-333.

[5] M Dietzfelbinger , T Hagerup , J Katajainen, M Penttonen.Areliable randomized algorithm for the closest-pair problem[J].Journal of Algorithms,1997,25(1):119 -120.

(責(zé)任編輯:王德紅)

Research on Protection Method of Privacy Random Projection Based on Data Mining Technology

Huang Quzhi

(Information Technology College, Fujian Normal University, Fuzhou350007, Fujian, China)

Abstract:In order to ensure the privacy of data mining in the presence of the curse of dimensionality issues are effectively addressed, this article will dig Privacy Protection Act proposed is based on a random data projection technology. In this way the attacker can be presumed in a random manner as the projection matrix to reconstruct the original data were taken into account, first, the proposed concept of the security sub-blank space, and then build the security sub-space mapping, while embedded achieve low distortion, it is possible to ensure an effective data security. Through experiments proved to be protected under the premise of data privacy, this method provides effective protection for data quality.

Key words:data mining;stochastic projection technology;privacy protection

中圖分類號(hào):TP311

文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1673-9507(2015)01-0129-02

作者簡(jiǎn)介:黃取治(1982.09~),福建師范大學(xué)信息技術(shù)學(xué)院講師。研究方向:計(jì)算機(jī)數(shù)據(jù)挖掘。

收稿日期:2014-11-30

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書(shū)館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開(kāi)發(fā)實(shí)踐
主站蜘蛛池模板: 视频一区视频二区中文精品| 国产欧美在线观看视频| 国产精品久久久久久搜索| 日韩黄色在线| 亚洲av综合网| 国产剧情伊人| 在线无码九区| 日本在线国产| 91久久精品国产| 国产免费黄| 亚洲国产成人自拍| 成人韩免费网站| 亚洲婷婷六月| 无码高潮喷水专区久久| 美女毛片在线| 国产精品妖精视频| 欧美中文字幕第一页线路一| 国产精品国产主播在线观看| 国产精品黑色丝袜的老师| 欧美日韩午夜| 亚洲天堂久久| 久热re国产手机在线观看| 大陆精大陆国产国语精品1024| 色综合久久综合网| 人妻免费无码不卡视频| 成年人国产视频| 免费观看欧美性一级| 欧美精品1区| 久久91精品牛牛| 亚洲欧美日本国产专区一区| 91久草视频| 国产哺乳奶水91在线播放| 亚洲欧美日韩成人高清在线一区| 中文字幕av无码不卡免费| 国产97视频在线观看| 亚洲欧美日韩视频一区| 亚洲综合天堂网| 成人午夜视频网站| 欧美区一区| 国产精品久久久久久搜索| 亚洲天堂网视频| 热这里只有精品国产热门精品| 国产精品成人久久| 色偷偷一区二区三区| 天天综合网亚洲网站| 欧美亚洲欧美| 手机永久AV在线播放| 91人妻日韩人妻无码专区精品| 久久人与动人物A级毛片| 亚洲第一成人在线| jizz亚洲高清在线观看| 色屁屁一区二区三区视频国产| 丁香婷婷久久| 亚洲色图欧美激情| 欧美黄网在线| 欧美日本在线播放| 亚洲欧美一区二区三区麻豆| 色亚洲激情综合精品无码视频| 黄色一级视频欧美| 精品一區二區久久久久久久網站| 国产美女在线观看| 国产97公开成人免费视频| 伊人天堂网| 国产白浆视频| 中文字幕日韩视频欧美一区| 久久性视频| 国产成人精品日本亚洲| 久久精品亚洲中文字幕乱码| 国产精品lululu在线观看| 久久香蕉欧美精品| 国产成+人+综合+亚洲欧美| 中文字幕丝袜一区二区| 91亚洲免费视频| 精品国产成人高清在线| 999福利激情视频| 一边摸一边做爽的视频17国产| 国产丰满大乳无码免费播放| 91麻豆精品国产高清在线| 成人蜜桃网| 国产97视频在线观看| 亚洲aaa视频| 国产自视频|