999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘中的隱私保護技術研究

2008-12-31 00:00:00龔惠群
商場現代化 2008年22期

[摘要] 數據挖掘中的隱私保護問題近年來得到了廣泛研究。本文首先分析了在數據挖掘中進行隱私保護的必要性,隨后對隱私保護的主要技術進行了研究,最后指出了數據挖掘領域中隱私保護方法未來的主要研究方向。

[關鍵詞] 數據挖掘 隱私保護 知識發現

一、引言

在當今社會,企業、政府,以及各類研究機構所收集的海量數據已被認為是一項重要的資源。如何對這些數據進行有效分析與處理,將其轉換為對決策過程有用的各種知識,是當前信息管理領域面臨的重要問題。數據挖掘,也稱為知識發現,主要研究如何從大規模的數據中抽取非平凡的、有潛在使用價值的知識,近年來在眾多領域都得到廣泛的研究與應用。

然而數據挖掘技術在應用過程中也出現了一些問題,隱私保護就是近年來所出現的一類重要問題。主要體現在兩個方面:一方面,供各種挖掘方法使用的數據庫中存儲了大量的敏感信息,其中有些信息是在個人無意識甚至是不知情的情況下被收集的,而網絡及其他媒體對信息的無限制暴露,已經開始對個人隱私構成嚴重威脅;另一方面,各種數據挖掘方法與工具的不斷完善,也為一些普通用戶通過不正當手段(如對信息進行推論)獲取他人隱私信息提供了可能。如何對數據進行有效的挖掘,并同時保證個人的相關隱私不被泄漏,成為近年來數據挖掘領域的一個研究熱點。

二、隱私保護方法的研究維度

隱私保護技術近年來出現了大量的新方法和新技術。主要可以從以下的四個維度進行研究:

1.數據分布方式。數據挖掘的數據一般可分為集中和分布式兩種,分布式數據又可以分為水平和垂直分布兩種。水平分布指數據按記錄分布在不同的站點,垂直分布指數據按屬性分布在不同的站點。不同的數據分布形式會影響隱私保護算法的設計。

2.數據修改方法。數據修改指根據組織的隱私保護政策,在發布數據之前,對原始數據進行適當的修改,達到保護這些數據的目的。常用的修改方法包括隨機化處理、數據加密、數據過濾和數據抽樣等。

3.數據挖掘算法。目前數據挖掘的算法主要可以分為關聯分析、序列分析、分類、聚類,以及異常檢測等幾個類別。根據這個維度,相應的隱私保護算法也可分為這幾大類。

4.數據與規則隱藏。即隱私保護算法是隱藏原始數據還是隱藏挖掘的各種規則。由于規則大多是對數據進行分析得到,因此各種規則比原始數據的抽象層次高、更具有價值,保護敏感規則有時比保護原始數據更重要。

三、隱私保護的主要技術

為保護敏感信息,常見的方法就是對數據進行分片保存,對數據進行水平分割或者垂直分割。水平分割指在每個節點上都保留原始數據的部分完整記錄,各節點數據匯總即得到完整的原始數據。垂直分割指將對象的屬性數據進行分割,在不同的節點上保存對象的部分屬性數據。

對于上述兩種數據分布形式,隱私保護的數據挖掘算法要求各節點在不知道對方數據的基礎上即能完成各種挖掘任務。文獻[1]中實現了數據水平分布時的隱私保護分類挖掘算法;文獻[2]提出一種在數據垂直分布情況下的隱私保護分類挖掘算法;文獻[3]則提出一個從垂直分割的數據中挖掘全局關聯規則的隱私保護算法。

另外,對原始數據進行抽樣、過濾或有目的的修改,也能有效保護隱私。在隱私保護中,推論問題是一個重要的研究內容,指普通用戶使用相關的數據挖掘技術,通過不斷改變算法的參數,從結果中推斷出未經授權的他人隱私信息。

在數據庫中建立隱私約束規則可以限制用戶發現或者訪問某些形式的規則,從而保護相關的隱私。使用數據抽樣方法,每次僅使用隨機得到的部分數據參與挖掘,這樣可以避免惡意的窮舉式訪問竊取相關隱私信息。

對數據進行隨機化修改也稱為數值變形(Value Distortion),在時間序列數據挖掘中經常被使用。該方法對每個原始數據加上一個隨機干擾,其中服從某種統計分布。在此基礎上,使用新的數據替代進行各種挖掘分析。由于使用數據進行各種挖掘分析,并且普通用戶通常無法確認隨機干擾的確切分布形式,因而該方法可有效防止對原始數據的惡意推斷。因此在時間序列數據挖掘中,提出對噪聲不敏感的挖掘算法,對于隱私保護而言同樣具有重要的意義。

四、未來的主要研究方向

1.高性能的方法:提出具有優良性能的相關方法,包括時間性能與空間開銷,以及網絡開銷。

2.高準確度的方法:盡可能完整地生成相應規則,而不遺漏重要規則,并且所生成規則的準確度也不應有明顯的降低。

3.保護程度更高級的方法:應當具有較高的保護級別。

4.適用于分布環境的方法:隨著網絡技術的發展,如何在分布式環境下進行各種隱私保護的數據挖掘,也將是一個重要的研究方向。

參考文獻:

[1]Lindell Y, Pinkas B. Privacy preserving data mining[C]. Proceedings of the 20th AICCAC, 2000, Santa Barbara, USA, 36–54

[2]Du W L, Zhan Z J. Building decision tree classifier on private data. Proceedings of the ICDM, 2002, Maebashi City, Japan, 1-8

[3]Vaidya J, Clifton C. Privacy Preserving Association rule mining in vertically partitioned data[C]. Proceedings of the 8th SIGKDD, 2002, Edmonton,Canada, 639-644

[4]李蒙宋翰濤:數據挖掘中隱私保護的隨機化處理方法.計算機工程與科學, 2005, 27(2): 58-59

[5]黃超朱揚勇:基于回歸系數的時間序列維約簡與相似性查找. 模式識別與人工智能, 2006, 19(1): 52-57

主站蜘蛛池模板: 久青草免费在线视频| 亚洲精品无码久久毛片波多野吉| 亚洲精品爱草草视频在线| 国产丝袜无码精品| 国产一区免费在线观看| 老汉色老汉首页a亚洲| 人妻精品全国免费视频| 亚洲日韩高清无码| 国产精品护士| 国产91丝袜在线播放动漫| 欧美午夜在线观看| 色九九视频| 日韩成人免费网站| 色综合久久综合网| 日本91视频| 国产剧情一区二区| 最新亚洲人成无码网站欣赏网 | 中文字幕av无码不卡免费| 日韩毛片基地| 人妻丰满熟妇αv无码| 久久久久青草大香线综合精品| 国产av无码日韩av无码网站| 国产呦精品一区二区三区下载| 久久精品国产亚洲AV忘忧草18| 女人18毛片水真多国产| 国产亚洲精久久久久久久91| 无码免费的亚洲视频| 97精品久久久大香线焦| 久久久无码人妻精品无码| 在线观看免费黄色网址| 欧美福利在线| 人妻精品久久无码区| 国产99热| 欧美无遮挡国产欧美另类| 重口调教一区二区视频| 亚洲国产精品日韩欧美一区| 91精品国产91久久久久久三级| 一级毛片免费高清视频| 亚洲性日韩精品一区二区| 亚洲视频二| 久热中文字幕在线| 国产在线自揄拍揄视频网站| 波多野结衣一区二区三区AV| 伊人国产无码高清视频| 色综合久久无码网| 亚洲男人天堂2020| a级毛片免费网站| 老司机午夜精品视频你懂的| 91毛片网| 亚洲第一视频免费在线| 最新国产高清在线| 国产精品视频系列专区| 亚洲免费黄色网| 亚洲一区二区约美女探花| 五月婷婷亚洲综合| 国产一级妓女av网站| 老司机aⅴ在线精品导航| 国产凹凸视频在线观看| 91啪在线| 高潮毛片免费观看| 欧美一区二区三区香蕉视| av一区二区无码在线| 日韩天堂网| 亚洲综合婷婷激情| 久久免费视频6| 久久久久久国产精品mv| 色欲不卡无码一区二区| 色婷婷亚洲综合五月| 高清乱码精品福利在线视频| 亚洲欧洲日本在线| 丰满人妻久久中文字幕| 欧美成人日韩| 在线视频亚洲色图| 欧美全免费aaaaaa特黄在线| 免费AV在线播放观看18禁强制| 日本午夜三级| 国产一级裸网站| 国产精品高清国产三级囯产AV| 高清无码不卡视频| 亚洲天堂日韩在线| 亚洲久悠悠色悠在线播放| 色有码无码视频|