摘 要:本篇文章針對大數據安全與隱私保護技術一題進行了深入的分析,其中包括大數據的簡介、大數據所面臨的安全挑戰以及大數據安全與隱私保護的關鍵性技術等,以期能夠對各位同仁帶來一些具有參考性的意見。
關鍵詞:大數據;安全;隱私保護
中圖分類號:TM309 文獻標識碼:A 文章編號:1674-7712 (2015) 02-0000-01
如今,人類儼然已經步入了大數據的時代當中,而大數據這個新興詞語的普及程度和速度也遠遠的超過了我們的想象。在每一個平凡人的生活當中,都或多或少的得到了大數據所帶來的便利和影響,無論是使用大數據來完成的疾病預測、還是通過大數據來實現的智能型交通等,都讓大數據的作用和好處得到了充分的體現。但是不容忽視的是,在大數據時代中,人們雖然自然的享受著各種各樣的便利,但是隨之而來的一些安全隱患以及隱私泄露問題也為我們的生活帶來了諸多的負面影響。為此,如何才能夠讓大數據的安全與隱私的保護技術得到進一步的加強,是我們在當下需要去認真對待的一個問題。
一、大數據簡介
(一)大數據的特點
通俗一些來解釋,大數據就是一個具有超大容量的數據集,并且能夠稱之為大數據的數據集不能夠使用傳統的方法以及工具來對當中的數據內容進行管理和操作。大數據具有四個特點,即為4V,具體包括:體量(Volumes)大,具有一定的規模性;類別(Varlety)多,具有一定的多樣性;速度(Velocity)快,具有一定的高速性;真實度(Veracity)高,具有一定的價值性。
(二)大數據的存在目標
大數據在如今已經被應用到多個行業領域當中,縱觀整個應用現狀來看,無論是醫療業、科研業、通信業以及銷售業等任何一個行業,大數據雖然被應用的方法與途徑各不相同,但是卻存在著即為相似的目標,具體如下:
第一,人們之所以會選擇對已經掌握的數據進行分析,其中最為主要的一個原因就是因為在這個過程當中能夠精準的將所需的信息查找出來。而通過這個信息挖掘的過程則能夠幫助我們更加透徹的看向問題的本質,從而更為精準的將事物的發展動態和規律摸索出來,為企業制定出合理正確的發展方向;
第二,對數據進行長時間的分析不但能夠將受眾群體的各種專屬特點進行總結,同時還可以幫助企業有效的對客戶的行為規范和習慣進行掌握。通過此種方式來對不同的客戶群體制定出不一樣的服務內容;
第三,對數據進行分析和對比可以將數據的真實性進行確定,眾所周知,由于網絡不具備對虛假信息進行過濾和清除的能力,所以在傳播信息的過程當中勢必會讓一些假信息隱藏在其中。而大數據所具備的4V特點則能夠很好的幫助我們對信息進行辨別,從而將一些虛假的信息準確的排除掉。
二、大數據所面臨的安全挑戰
(一)對于用戶隱私的保護
通過多次的證實我們能夠了解到,如果不能夠對大數據進行正確處理的話則會對用戶的隱私構成嚴重的威脅。筆者將對用戶的隱私保護總結成了三個方面,其中包括位置隱私保護、標識符隱私保護以及連接關系隱私保護。如今,大數據時代給用戶帶來的安全隱患還不僅僅是隱私外泄這一個方面,其中還包括著大數據對人們的生活狀態以及行為習慣的預測和分析。大部分企業仍然覺得,對用戶的個人信息匿名顯示并且僅僅將一些并不包括用戶標識符的信息進行公開,這些做法就可以對用戶的隱私信息進行很好的保護,但是從實際上來看,這些方法所產生的效果卻不甚樂觀。目前,在用戶數據采集、儲存、應用以及管理的各個環節中,普遍都存在著規范性差、監管力度低以及缺少成功標準等現象,而作為用戶本身來說根本無法知曉自己的隱私信息被應用到了什么地方。
(二)大數據的可信度
很多人都是這樣認為的,數據是一種信息最為準確的一種表現形式,其所呈現出來的就是最為真實的情況。但是事實卻并非如此,數據的可靠性不僅沒有我們所想的那么高,甚至還存在著非常多的假象。
1.偽造出來的虛假數據
一些人為了能夠達到自己的目的,采用各種各樣的手段來對數據進行虛假制造。這些偽造出來的虛假數據的隱藏性較高,并且常常同一些真實的數據信息混合在一起,從而讓人們很難發現它們的存在。舉例說明,如今很多購物網站中都存在著虛假評論的現象,這些人為制造出來的假信息同其他真信息混合在一起,讓瀏覽者根本無從分辨,以至于誤導他們購買到一些質量低下的商品。
2.傳播中失真的數據
如果在數據的搜集過程中受到了人為的影響,那么就非常容易出現數據失真的現象,繼而讓最終的分析結果出現誤差。除此之外,版本的變更也是造成數據失真的原因之一,如果在數據的傳播過程中出現了情況變化的現象,那么早期的數據也就無法作為正確的依據信息了。舉例說明,一家商店的對外電話已經改變,但是用戶在搜索引擎中得到的仍然是舊的電話,這種現象就會對用戶的正確判斷帶來非常大的影響。
三、大數據安全與隱私保護的關鍵性技術
(一)數據溯源技術
此種技術形式早在大數據出現以前就得到了高度的重視,尤其是在數據庫的范疇當中,數據溯源技術不僅能夠輔助用戶對數據的運算來源進行確定,同時還可以提高分析結果的準確性。數據溯源所采用的方式多為標記法,并且在不斷的實踐和總結當中將Why以及Where這兩種應用形式創造了出來。數據溯源技術發展至今已經取得了非常明顯的成就,其中包括對文件進行溯源和恢復以及云儲存場景的應用等等。
(二)角色挖掘技術
角色挖掘技術在目前得到了比較高的采用率,通過對使用者進行角色分派以及角色權限整合的方式來對使用者的權限進行有效的控制和管理。角色的訪問控制在最開始的時候一般所使用的是“頂點向下”的方式,即通過公司已有的職位來對角色的權限進行劃分。如今,研究者為了能夠讓此項技術更具高效性,從而將目光鎖定在了“底點向上”的方式當中,即為通過對現有用戶授權的現狀進行分析,從而讓角色的提取和優化能夠實現自動化。
角色挖掘技術的應用不但可以對不同用戶給予不一樣的服務,同時還能夠對用戶的行為進行實時監控,從根本上杜絕危險現象的出現。
(三)身份認證技術
身份認證技術主要針對的是用戶本身的行為數據來說的,通過對此項數據的采集和分析來將用戶的行為習慣和特點總結出來。身份認證技術不僅能夠按照所分析出來的用戶特征結果對操作者進行身份驗證,同時還大大的增加了黑客盜取用戶信息的難度。
參考文獻
[1]戈悅迎.大數據時代信息安全與公民個人隱私保護[J].中國信息界,2014(1).
[2]馮登國,張敏,李昊.大數據安全與隱私保護[J].計算機學報,2014(1).
[3]謝邦昌,蔣葉飛.大數據時代隱私如何保護[J].中國統計,2013(6).
簡介:王多鵬,男,出生于1983年11月,甘肅張掖人,西北師范大學計算機科學與工程學院2012級在職碩士學位研究生,主要研究方向:計算思維。
刊物郵遞地址:甘肅省張掖市職業技術教育中心 手機:13993672136