◆孫 玲
(哈爾濱石油學院 黑龍江 150028)
隨著互聯網技術的發展,Internet已經成為人們日常生活不可或缺的部分:智能終端、電子銀行、網上購物、網絡通信,瀏覽查詢都離不開網絡,隨之而來大數據技術的普及,給人們提供了很大方便,例如某團的點餐業務通過定位系統提交自己的位置信息,就可以返回最近的餐館,商場,停車場等。帶來方便的同時,隱私信息的泄露在一定程度上使得用戶害怕使用位置服務同時又產生許多安全問題。
位置隱私指的是由于服務或系統需要用戶提供自身的<I,P,T>三元組信息而導致的用戶隱私泄露問題[1]。其中,I是指身份通常用標識用戶的ID表示,該標識可以是身份證號或者任何唯一標識用戶的屬性集;P是指位置通常反映空間坐標中的X坐標和Y坐標,T是指時間通常反映了用戶位置信息的有效的時間點或時間段。通過這個三元組,實際上就泄露了用戶所在時間所處位置,通過這些信息可以預測用戶可能的行為。
與傳統的隱私不同,位置隱私因其特有的屬性,它具有以下特點:
(1)保護位置隱私與享受服務是一對矛盾,想要獲得上文所提到的便享活動,首先就需要開啟定位系統。
(2)位置隱私的多維性,位置隱私受三維立體空間的限制。
(3)位置隱私的即時性和可預測性,位置隱私中包含了時間戳的要素,反映不同時間不同操作,具有時效性的同時也預測一定時間內的位置軌跡隱私性。
(4)位置隱私可滿足查詢請求,同時具有潛在的危險性。
(5)位置隱私需求個性化,體現在位置隱私可用于餐飲、娛樂、醫療等生活的各個方面。
現階段位置隱私泄露所面臨的問題主要有三個:用戶使用移動設備和計算機設備直接受到嗅探攻擊,從而獲取到位置隱私信息;網絡通信傳輸不安全,傳輸的數據被截獲,用戶隱私泄露包括位置隱私;用戶通過智能終端上應用的 APP向服務器提供者提交自己的位置信息服務器不受信任或者信息服務器被攻擊信息泄露[2]。
前兩種情況可以采用信息加密技術來保證設備存儲的信息以及通信信道的安全性,避免信息泄露后顯示明文信息。而后一種情況,既保證信息分享后返回的查詢信息準確,又要保護用戶私密位置信息不被泄露,今年來比較好解決方法是位置隱私保護技術中的K匿名算法。
K匿名算法是指在位置隱私中,為了防止服務器泄露用戶的真正位置,因此,可以模擬出K-1個用戶,與真實的用戶位置組成一個空間區域。這樣使得提出位置服務請求的用戶在該空間區域內,從而了用戶身份隱私。目前研究K匿名算法的熱點是:間隔匿名、Hilbert匿名和連續查詢匿名算法。
間隔匿名算法是建立一個K匿名空間,這個空間是基于一個四叉樹結構,基本思想如下:
(1)將匿名空間分成四個面積相等的正方形;
(2)通過遞歸算法將每個正方形在進行分割;
(3)連續進行分割,直到所有的最小正方形區域的面積為系統要求的用戶最小匿名區面積。
(4)所有的正方形,每一個正方形都是四叉樹的一個節點,整個匿名空間就是由所有的四叉樹節點構成。
Hilbert匿名算法基本思想是:將二維空間映射到一維Hilbert值上,通過B + 樹來索引[2]。列出所有的用戶,按先后順序把取K個用戶作為一組,每個用戶最終的匿名空間,就是包含該用戶的組內的所有成員。
在查詢位置的過程中用戶的位置通常是連續的運動軌跡,這種情況下,攻擊者采用足夠多次位置查詢請求就可以獲得用戶的真實位置[3]。針對這種攻擊類型,提出了一種新的匿名算法——連續查詢匿名算法。這種算法的思想是:在歷史軌跡的數據庫中通過用戶的最新移動位置添加新的運動軌跡,當用戶進行匿名查詢時,不但要返回其他k-1個用戶的位置,還需要在軌跡數據庫中搜索具有相似路徑的k-1個用戶,并對這k-1個用戶進行處理,使其軌跡與當前查詢用戶的軌跡相似。
對K匿名算法進行分析,得到間隔匿名算法、Hilbert匿名算法和連續查詢匿名三種算法比較如表1。

表1 位置隱私保護技術方法比較

連續查詢匿名插值處理 集中式高;基于用戶歷史軌跡分析添加假軌跡良好,運行效率和服務質量都有提高防止連續查詢攻擊擬合運動軌跡時出現查詢節點缺席情況
本文在大數據背景下,研究了位置隱私保護技術 K匿名算法,并對目前比較流行三種算法進行分析和比較。