王媛媛
(北京天融信網絡安全技術有限公司安全服務北京中心 北京 100086) (wang_yuanyuan@topsec.com.cn)
從本質上來說,所謂的云計算大數據隱私安全其實就是整個生命周期中數據的安全[1].在云計算平臺中用戶的數據存儲、數據計算都發生在云端,導致基于云計算的用戶數據隱私保護問題比以往的Web應用中的用戶數據隱私保護問題更加嚴峻,數據安全保護要求更高[2].由于用戶數據存在商業價值,很多不法分子通過非法手段攻擊云平臺,竊取用戶數據然后倒賣獲得利益;還有些卑劣的云計算服務商在未經用戶允許私自對用戶數據進行統計分析,非法獲取用戶的行為數據;此外,還有些云計算服務提供商的員工也會監守自盜,竊取云端的用戶數據.而相較于傳統計算機網絡,云計算具有通用性、共享性等特點[3],傳統的用戶數據隱私保護技術往往不適用[4].由此可見,用戶數據隱私保護問題已經成為制約云計算發展的重要問題,如果不妥善解決該問題,云計算的推廣應用將會受到極大地制約.基于此,本文基于云計算的用戶數據隱私保護問題展開探討,深入研究了相關的用戶數據隱私保護關鍵技術,以有效解決制約云計算發展的用戶數據安全問題.
和加密機制相比,隱式機制的主要優點是很好地解決了密鑰管理問題.在本節中我們將探討運用隱式機制的云平臺安全隱私保護方案.在該方案中,如果有人想竊取數據就必須要知道相關矩陣中每一個元素的信息,這樣的機制顯著提升了大數據的隱私安全性.
本方案根據有限域中多項式解代數密碼學原理,將數據d(d∈p)隨機劃分為k個部分,將k個值視為一元k次多項式的根,并分別存儲在不同的云服務器中(如圖1所示),我們將這個不加密數據存儲方式稱為隱式機制[5].在這個方案中,只有當所有存儲數據的云服務器合謀時才有可能導致數據泄露,數據存儲的安全性更高.

圖1 基于隱式機制的用戶數據存儲方案
根據代數學基本定理,每個k次方程有k個根,如該方案中的k階方程:
xk+mk-1xk-1+…+m1x+m0=0.
已知方程根的數量和其中任意一個數據子塊時,我們可以計算出全部的數據子塊,我們就能重新構建數據,這樣會非常不安全.因此,我們在該方案中的唯一限制是方程的系數不能同時為0.因為系數的選擇是隨機的,當至少1個系數不為0時,只要知道任意k-1個根的信息我們就可以推導出另外一個根:
rk=d(r1,r2,…,rk-1)-1modp.
隨著信息技術的發展,數據信息規模的不斷擴大以及云計算、大數據技術的出現和發展,數據擁有者將數據存儲在云平臺上以便縮減數據存儲成本,需要使用時隨時可以恢復到本地.為了提高數據的安全性,數據擁有者需要加密數據,在使用云平臺時需要進行身份認證,但是這樣必然會加大用戶密朗管理的負擔,而且這種模式無法體現云計算的優勢.以往我們使用全同態加密機制計算加密數據,全同態加密協議雖然可以有效地保護數據的安全隱私,但依然需要密鑰管理,如果在平臺上存儲密鑰,云服務器不可靠時密鑰加密的作用就失效了[6].為此,Parakh等人提出了基于隱式機制的云平臺數據計算安全隱私保護協議.Parakh等人提出了3個云服務器的模型,2個云服務器用于存儲,另一個云服務器專門用于數據計算.在該協議中,用戶同時擁有m和n這2份數據,其中數據m被分成m1和m2,同理,數據n可以分成n1和n2,用戶可以將數據m和數據n的前半部分存儲到第1個云服務器上,將數據m和數據n的后半部分儲存到第2個服務器上.通過一定的數學關系,方案可以成功實現x+ymodp的計算和x×ymodp的計算.

圖2 3個云服務器的數據存儲模型
如圖2所示,在該方案中,云服務器Server1擁有數據m的部分信息m1和數據n的部分信息n1.云服務器Server1無法了解云服務器Server2中關于m2,n2的信息,因此,云服務器Server1無法獲得完整的數據m和n的信息.同理,云服務器Server2也無法在剛開始就獲得完整的數據m和n的信息.在基于隱式機制的云平臺數據安全隱私保護方案中,假如數據竊取者想獲得數據就必須獲得數據矩陣中的所有元素的信息,增加了數據被竊取的難度,有效地保護了數據的隱私安全[7].
當前用戶上傳至互聯網中的數據面臨著不容忽視的安全威脅,網絡中的個人隱私泄露問題日益嚴峻.近年來,我國發生過多次Web(World Wide Web)應用數據庫中的用戶數據被非法竊取的網絡安全事件,導致眾多用戶隱私泄露,給用戶造成巨大損失[8].可見,用戶數據隱私保護是網絡安全中非常重要的課題.而作為以互聯網為載體的計算技術,云計算也面臨用戶數據隱私保護問題.基于此,文本探討了基于隱式機制的云端用戶數據存儲和計算方案,有效避免了云端用戶數據被竊取.