王琦煜
摘 要 當前我們已經進入到大數據時代。大數據給人們的生活與工作帶來了較大積極影響的同時也引發了一定風險。如何確保大數據安全與隱私保護成為了現階段研究較為熱點的問題之一。本文從大數據概述入手,分析了大數據存在的安全問題,并提出了大數據安全與隱私保護對策。
關鍵詞 大數據;安全;隱私保護;探究
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2017)184-0061-02
大數據時代中,數據與信息研究和分析工作更加繁瑣、復雜,整個過程也較難管理。根據大量統計數據表明,僅在過去3年時間內,全球范圍內所產生的數據量也超過了先前500年出現的數據量。隨著數據量的不斷增加,企業與個人對數據隱私性與安全性要求更高,大數據隱私與安全問題也更加的突出,如何應對在大數據背景下的數據安全問題,是全世界范圍內均應當積極思考的問題。
1 大數據概述
1.1 大數據來源與特征
根據大數據來源的不同,大數據可分為3類:其一是來源于人,人們在使用互聯網的過程中所伴生的各種數據,包含視頻、圖片、文字等;其二是來源于機,各種類型的計算機在運行過程中產生的數據,以多媒體、數據庫、文件等形式存在;其三是來自于物。各種類型的數字設備在運行過程中所采集得到的數據,例如:攝像頭采集得到的數字信號等。
1.2 大數據分析目標
當前大數據在商業、醫藥、科學研究等領域應用較多。其用途較多,因此帶來的分析目標也比較多。
其一,推測趨勢與獲取知識。大數據中包含有很多重要信息,通過對大數據的分析工作可以更為深入地把握各種數據背后存在的問題與知識,實現對表層現象的深入挖掘。
其二,研究掌握個性化的特征。以大數據為基礎,通過多角度、長期的數據分析、對比工作,可以將用戶個性化特征分析出來。從而在得到用戶習慣的基礎上,對不同的用戶提供出更為針對性的服務。
2 大數據存在的安全問題
2.1 用戶隱私
若大數據在使用的過程中對用戶數據沒有做到較好保護,那么將直接威脅到用戶隱私與數據的安全性。按照保護內容不同,其可以分為標識符匿名、匿名保護及位置隱私保護等。
在大數據時代下,人們數據安全面臨的問題不僅僅是傳統的個人隱私問題,更多的是根據對人們數據的分析與研究,對人們狀態與行為的針對性預測,例如:零售商可以比家長更加了解自己的孩子的消費習慣等,從而郵寄相關廣告信息等。再如對用戶在網絡上發表的一些狀態內容等,能夠分析這個人的政治傾向、喜歡球隊、消費習慣等隱私信息。目前,很多企業認為對信息進行了匿名處理之后,標識符就會被隱藏,然后信息就能公布了,但現實情況為,僅采用匿名保護的方式并不能實現對隱私的有效保護。例如,某個公司在對3個月之內部分搜索歷史記錄進行匿名處理之后,供人們使用,雖然其中包含的標識信息經過了較為精心的處理,但是其中包含的很多記錄項內容還能夠被精確的定位。
2.2 大數據的可信性
人們普遍認為雖然數據可以在一定程度上說明一些問題,數據自身就是事實,但是現實情況為,若對數據不能進行有效甄別,人們也會被數據欺騙。
其一,不法分子可對大數據中的數據進行刻意編造與偽造,而大數據分析的基礎就是這些數據,錯誤的數據必然導致錯誤的結果。如果數據使用場景較為明確,部分人可能編造數據從而營造出對其有利的數據假象,從而導致人們得出錯誤的判斷。如,某些網站中包含的虛假評論,用戶在看到這些虛假的評論之后,非常容易去購買這些劣質的商品與服務。再加上當前互聯網技術的普及,這些虛假信息帶來的影響是不可估量的,使用信息安全技術對這些數據進行甄別難度也非常大。
其二,大數據在進行傳播過程中可能出現失真的情況,這里主要是由于人們在信息傳播過程中可能出現信息逐步失真的情況。
2.3 大數據訪問控制
因為大數據使用范圍較為廣,來源也較多,對數據設置訪問控制是非常必要的。但是在大數據下,需要對大量的用戶進行權限管理,但是用戶實際需求是未知的,這就導致對角色進行預設是較為困難的。
3 大數據安全與隱私保護對策
3.1 數據發布匿名保護技術
對大數據安全與隱私保護中,數據發布匿名保護的關鍵在于使用的基本手段與關鍵技術,現階段該項工作正處于不斷完善過程中。當前數據發布匿名保護技術仍舊較為復雜,大數據攻擊者能夠從多個方面獲得數據信息,而不單單是某一個數據源。因為匿名模型是對所有屬性集合而設定的,對某個具體的屬性并沒有給予其明確定義,這就導致在處理的過程中較易出現匿名處理不足的可能性,數據攻擊者就能夠將該屬性值確定。因此,應當對數據發布匿名保護技術進行完善,在具體實施時可以使用多樣化匿名,其優勢主要在于在可對每個匿名屬性數據進行多樣化處理,可使用裁剪算法方案與數據置換方案,從而將其中包含的敏感數據平均化,從而可大大增強數據匿名保護的效果,可有效預防數據攻擊者對數據進行的聯合攻擊,有效確保數據匿名特性。
3.2 社交網絡匿名保護技術
大數據的重要來源之一就是社交網絡中產生的數據。因此做好大數據匿名保護是非常重要的。但是在社交網絡中,其中通常包含有大量圖片,因此,若采用傳統的數據結構化匿名保護技術不能滿足社交網絡匿名保護需求。為了確保社交網絡數據安全性,在具體實施中,對圖結構應當從超級節點進行集聚與分割,例如,基于節點聚集的匿名方案、基于基因算法的實現方案、基于模擬退火算法的實現方案以及先填充再分割超級節點的方案。在社交網絡匿名保護當中,關系型預測方法的使用具有較多優點,例如其能夠準確從社交網絡中局部性連接增加密度增長,積聚系數增加進行有效防護。
3.3 數據水印技術
數據水印技術就是將數據中所含的標識信息,再方式嵌入的方式嵌入到其中,從而確保數據安全被使用,可有效解決數據存在的動態性、無序性特征。在具體實施中,可以將數據通過集合的方式嵌入到某一個固定的屬性中,這種方式可有效避免數據攻擊者對水印的破壞。另外,可采用將數據庫指紋信息錄入到水印當中,可以識別出信息的所有者以及被分發的對象,有利于在分布式環境下追蹤泄密者。此外,可采用獨立分析技術,能夠實現無密鑰水印驗證,進一步確保數據安全性。此外,這里還可以使用數據溯源技術,由于數據的來源多樣化,所以有必要記錄數據的來源及其傳播、計算過程,為后期的挖掘與決策提供輔助支持。
4 結論
綜上概述,我們在享受大數據時代給我們帶來便利的同時也應當應對其存在的數據安全與隱私保護帶來的挑戰,增強信息保護與信息安全。如要真正實現大數據時代下數據安全與隱私保護工作,必須對大數據存在的安全漏洞分析入手,充分應用各種類型的數據安全與隱私保護技術措施,同時構建其對應的法律法規,才能確保大數據安全與隱私保護。
參考文獻
[1]雷海.乘大數據東風 揚追越之帆——大數據時代提高航運服務業品質的理念及策略[J].水運管理,2014(5):1-3.
[2]董楊慧,謝友寧.大數據視野下的數據泄露與安全管理——基于90個數據泄露事件的分析[J].情報雜志,2014(11):154-158.
[3]范昱.信息系統安全及數據安全管理的探討[J].技術與市場,2012(5):268-269.
[4]陳靜,孫林夫.基于SaaS的產業鏈協作公共服務平臺數據安全解決方案[J].計算機集成制造系統,2011(6):1317-1324.