王彬菁

摘要:伴隨著大數(shù)據(jù),云計(jì)算時(shí)代的到來(lái),社會(huì)各個(gè)行業(yè)對(duì)用戶及產(chǎn)品數(shù)據(jù)的依賴程度與越來(lái)越高,然而,他們面臨一個(gè)不可避免的問(wèn)題是所需要的數(shù)據(jù)庫(kù)服務(wù)器價(jià)格昂貴且數(shù)據(jù)維護(hù)成本高。因此許多企業(yè)選擇將數(shù)據(jù)外包到公共云環(huán)境下的數(shù)據(jù)庫(kù)系統(tǒng)中,讓云服務(wù)提供商為其服務(wù),這就對(duì)云數(shù)據(jù)庫(kù)中數(shù)據(jù)的安全性與私密性保護(hù)提出挑戰(zhàn),也吸引國(guó)內(nèi)外專家學(xué)者對(duì)該問(wèn)題進(jìn)行研究。該文提出了一種基于保序加密方法的數(shù)據(jù)安全保護(hù)技術(shù),對(duì)云數(shù)據(jù)庫(kù)中的隱私數(shù)據(jù)屬性進(jìn)行加密,保障了密文數(shù)據(jù)與明文數(shù)據(jù)的順序一致,不改變數(shù)據(jù)庫(kù)中數(shù)據(jù)的查詢與索引結(jié)構(gòu)的基礎(chǔ)上,對(duì)云數(shù)據(jù)庫(kù)中的部分核心數(shù)據(jù)進(jìn)行加密,從而解決數(shù)據(jù)安全性與私密性保護(hù)的問(wèn)題。
關(guān)鍵詞:云計(jì)算;保序加密;數(shù)據(jù)安全
中圖分類號(hào):TP393 ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)15-0023-02
隨著近幾年云計(jì)算,智慧云服務(wù)技術(shù)的不斷發(fā)展,越來(lái)越多的企業(yè)和政府機(jī)構(gòu)選擇租用云服務(wù)提供商平臺(tái)來(lái)存放和處理用戶或產(chǎn)品數(shù)據(jù),這些用戶可以通過(guò)租用云服務(wù)器(IaaS)去實(shí)現(xiàn)質(zhì)優(yōu)價(jià)廉的大數(shù)據(jù)管理需求。一些用戶甚至可以免除手動(dòng)安裝配置數(shù)據(jù)庫(kù)的繁瑣步驟,直接使用云服務(wù)提供商的數(shù)據(jù)庫(kù)(DBaaS),從而達(dá)到存放和處理數(shù)據(jù)的目的,比如亞馬遜的Web服務(wù),EnterpriseDB,谷歌的Cloud SQL等,[1]這些云服務(wù)提供商都將數(shù)據(jù)整合遷移到自營(yíng)的云數(shù)據(jù)庫(kù)中,在自營(yíng)平臺(tái)對(duì)客戶數(shù)據(jù)提供管理服務(wù)。云數(shù)據(jù)庫(kù)作為一種云計(jì)算的具體應(yīng)用,具備了云計(jì)算快捷方便,可靠,靈活性高的優(yōu)點(diǎn),在用戶享受便捷服務(wù)的同時(shí),是個(gè)人隱私數(shù)據(jù)外泄的擔(dān)憂也隨即增加,甚至有些云服務(wù)商會(huì)采用最大努力確保數(shù)據(jù)安全的方式規(guī)避數(shù)據(jù)泄露對(duì)企業(yè)造成損失的責(zé)任,另外,像金融證券,國(guó)防工業(yè)企業(yè)中包含大量高敏感、高價(jià)值的數(shù)據(jù),他們對(duì)于數(shù)據(jù)外包服務(wù)的安全性問(wèn)題顧慮重重。因此,有關(guān)數(shù)據(jù)的安全性和用戶隱私數(shù)據(jù)的保護(hù)成為各大云服務(wù)商亟待解決的難題。有關(guān)數(shù)據(jù)庫(kù)系統(tǒng)中數(shù)據(jù)的安全性問(wèn)題研究一般包括以下三方面內(nèi)容:數(shù)據(jù)的機(jī)密性即可信任性、數(shù)據(jù)的完整性與一致性、數(shù)據(jù)的可用性。與傳統(tǒng)數(shù)據(jù)庫(kù)安全性保護(hù)不同,云數(shù)據(jù)庫(kù)安全保護(hù)的要求和難度更大。我們?cè)诩俣ㄓ脩敉耆湃危淮嬖谠品?wù)提供服務(wù)人員主動(dòng)進(jìn)行信息竊取、泄密的情況下,來(lái)討論關(guān)于與數(shù)據(jù)庫(kù)機(jī)密性保護(hù)的技術(shù),為保護(hù)云數(shù)據(jù)庫(kù)中數(shù)據(jù)的機(jī)密性,最直接,方便的方法是對(duì)數(shù)據(jù)進(jìn)行加密操作,加密算法也有許多,對(duì)稱加密算法和非對(duì)稱加密算法,但加密過(guò)以后的數(shù)據(jù)如何高效使用,需要研究人員充分地平衡數(shù)據(jù)庫(kù)的安全性和性能性,本文在考慮兩大因素的基礎(chǔ)上采用一種基于保序加密算法的云數(shù)據(jù)庫(kù)安全保護(hù)技術(shù)。
1 云計(jì)算
云計(jì)算作為一種基于互聯(lián)網(wǎng)的新型計(jì)算模式,通過(guò)互聯(lián)網(wǎng)上異構(gòu)和自治的服務(wù)為個(gè)人和企業(yè)用戶提供自身需要的數(shù)據(jù)、信息和計(jì)算[2]目前有關(guān)云計(jì)算的權(quán)威性定義還未出現(xiàn),不同的提供云服務(wù)的生產(chǎn)商針對(duì)用戶應(yīng)用場(chǎng)景不同,從各個(gè)角度為云計(jì)算下定義。“云”思想最早起源于電話網(wǎng),業(yè)內(nèi)將透明的、黑箱的電話傳輸網(wǎng)稱之為“云”;[2]現(xiàn)如今云計(jì)算的概念已經(jīng)不斷延伸,不僅僅涉及網(wǎng)絡(luò)底層的基礎(chǔ)設(shè)施,也包括云服務(wù)器等。IDC咨詢機(jī)構(gòu)認(rèn)為云計(jì)算是一種新興的IT技術(shù)發(fā)展、部署及發(fā)布模式,該技術(shù)利用互聯(lián)網(wǎng)實(shí)時(shí)的提供用戶所需的產(chǎn)品,服務(wù)和決策方案。云計(jì)算具有共享資源,按需分配,彈性調(diào)度,普遍介入和動(dòng)態(tài)可擴(kuò)展服務(wù)等特點(diǎn),使用虛擬化技術(shù)實(shí)現(xiàn)資源的共享和遷移;適當(dāng)?shù)氖褂脭?shù)據(jù)加密算法對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)實(shí)行安全保護(hù)。云計(jì)算按給用戶提供的服務(wù)類型不同分為偏重于基礎(chǔ)服務(wù)設(shè)施的Iaas(Infrastructure as a Service)、偏重于應(yīng)用服務(wù)器平臺(tái)的Paas(Platform as a Service)和偏重于軟件程序服務(wù)的Saas(Software as a Service ),這些服務(wù)均來(lái)自與云計(jì)算提供商,同時(shí)依賴于互聯(lián)網(wǎng)技術(shù)的發(fā)展。按部署劃分有公共云、私有云和混合云。有關(guān)云計(jì)算的安全性威脅來(lái)自于物理設(shè)備層、數(shù)據(jù)存儲(chǔ)層、網(wǎng)絡(luò)層、系統(tǒng)層、平臺(tái)層、數(shù)據(jù)庫(kù)層和應(yīng)用層等,比如在數(shù)據(jù)庫(kù)層需要注意來(lái)自SQL注入攻擊,使用數(shù)據(jù)加密與數(shù)據(jù)備份等技術(shù)防止存儲(chǔ)在云數(shù)據(jù)中的數(shù)據(jù)泄露或惡意篡改。云數(shù)據(jù)庫(kù)系統(tǒng)作為云計(jì)算的核心,其安全性防護(hù)十分重要。目前云數(shù)據(jù)庫(kù)五級(jí)安全防范模型是云數(shù)據(jù)安全保障的通用模型,針對(duì)信息泄露的風(fēng)險(xiǎn)等級(jí)不同,適應(yīng)的安全技術(shù)也不同,一般從外部攻擊者換照系統(tǒng)接口,外存數(shù)據(jù),內(nèi)存數(shù)據(jù),程序狀態(tài)和訪問(wèn)模式五大步驟,按難易程度,漏洞大小有選擇性地攻擊,在選擇防御技術(shù)的時(shí)候也要充分評(píng)估利弊,使用有效的安全保護(hù)手段。
2 數(shù)據(jù)庫(kù)安全應(yīng)用技術(shù)
為保障數(shù)據(jù)的安全,我們通常注意在數(shù)據(jù)收集,數(shù)據(jù)存儲(chǔ),數(shù)據(jù)處理幾個(gè)階段均實(shí)行對(duì)應(yīng)的安全防御措施,將內(nèi)存數(shù)據(jù)與外存數(shù)據(jù)隔離,通過(guò)部署硬件設(shè)備,如防火墻、IPS/IDS入侵防御檢測(cè)系統(tǒng)、防御DDoS攻擊設(shè)備、以及在入口交換機(jī)旁路部署NIP系統(tǒng),對(duì)訪問(wèn)系統(tǒng)的流量進(jìn)行實(shí)時(shí)監(jiān)測(cè),對(duì)內(nèi)部數(shù)據(jù)進(jìn)行訪問(wèn)控制和安全審計(jì)等。通過(guò)分層部署安全應(yīng)用系統(tǒng)和安全防護(hù)措施,實(shí)現(xiàn)軟硬件防護(hù)技術(shù)的結(jié)合,來(lái)保護(hù)數(shù)據(jù)庫(kù)系統(tǒng)的安全。在數(shù)據(jù)處理的全部階段,數(shù)據(jù)面向多種安全風(fēng)險(xiǎn):
2.1 數(shù)據(jù)收集和存儲(chǔ)階段
在數(shù)據(jù)收集階段,攻擊者會(huì)竊取客戶的關(guān)鍵隱私數(shù)據(jù),使得數(shù)據(jù)庫(kù)喪失了對(duì)重要數(shù)據(jù)的控制,從而導(dǎo)致信息泄露。在數(shù)據(jù)存儲(chǔ)階段,系統(tǒng)不對(duì)關(guān)鍵數(shù)據(jù)進(jìn)行數(shù)據(jù)加密,導(dǎo)致客戶關(guān)鍵重要數(shù)據(jù)使用明文存儲(chǔ)方式保存,會(huì)造成數(shù)據(jù)的濫用和被盜用的風(fēng)險(xiǎn)。現(xiàn)階段基于密碼學(xué)的數(shù)據(jù)庫(kù)密文查詢技術(shù),對(duì)內(nèi)存數(shù)據(jù)進(jìn)行加密,不僅增強(qiáng)數(shù)據(jù)機(jī)密性,而且該加密算法不會(huì)破壞數(shù)據(jù)庫(kù)各類查詢操作在密文上的執(zhí)行效果。但算法會(huì)增加數(shù)據(jù)處理的運(yùn)算時(shí)間代價(jià),拖低數(shù)據(jù)處理的運(yùn)行性能。
2.2 數(shù)據(jù)挖掘階段
在數(shù)據(jù)挖掘階段,會(huì)出現(xiàn)對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)的進(jìn)行非授權(quán)的訪問(wèn),或者在更新系統(tǒng)數(shù)據(jù)時(shí),將原始數(shù)據(jù)清除,造成重要數(shù)據(jù)遺失。數(shù)據(jù)挖掘的主要方法包括關(guān)聯(lián)規(guī)則算法Apriori算法,通過(guò)關(guān)聯(lián)分析可查找出數(shù)據(jù)與樣本數(shù)據(jù)的相似性為用戶推送信息;另外在數(shù)據(jù)挖掘階段還是用聚類分析對(duì)數(shù)據(jù)集進(jìn)行分類,通過(guò)一些預(yù)測(cè),建立時(shí)序模型和偏差分析算法等對(duì)數(shù)據(jù)進(jìn)行綜合處理,最終挖掘出對(duì)用戶來(lái)說(shuō)更加富有價(jià)值的數(shù)據(jù)信息。在數(shù)據(jù)挖掘階段通過(guò)對(duì)算法的優(yōu)化與改進(jìn),會(huì)提高數(shù)據(jù)的準(zhǔn)確性,降低數(shù)據(jù)的冗余程度,保證數(shù)據(jù)的一致性和完整性。最終維護(hù)了數(shù)據(jù)庫(kù)中數(shù)據(jù)的安全性,進(jìn)一步保證了云數(shù)據(jù)庫(kù)核心數(shù)據(jù)的安全性,發(fā)現(xiàn)更具價(jià)值的數(shù)據(jù)信息,完成數(shù)據(jù)挖掘的目的,使得數(shù)據(jù)更加符合用戶的需求,擴(kuò)展了數(shù)據(jù)的市場(chǎng)應(yīng)用前景。
2.3 數(shù)據(jù)應(yīng)用階段
客戶會(huì)對(duì)云服務(wù)商提供的數(shù)據(jù)庫(kù)主觀不信任,對(duì)計(jì)費(fèi)產(chǎn)生疑慮。在數(shù)據(jù)交付使用時(shí)會(huì)有不符合規(guī)則的數(shù)據(jù)分析結(jié)果,造成客戶不滿意。另外,數(shù)據(jù)的收集處理分析過(guò)程沒(méi)有形成可查詢的完整鏈條,趙成數(shù)據(jù)泄露無(wú)法追溯的隱患。
針對(duì)以上安全問(wèn)題,本文重點(diǎn)從數(shù)據(jù)加密保護(hù)技術(shù)的角度研究去解決隱私數(shù)據(jù)保護(hù)的問(wèn)題,提出了一種基于保序加密方法的數(shù)據(jù)安全保護(hù)技術(shù),對(duì)云數(shù)據(jù)庫(kù)中的隱私數(shù)據(jù)屬性進(jìn)行加密,保障了密文數(shù)據(jù)與明文數(shù)據(jù)的順序一致,不改變數(shù)據(jù)庫(kù)中數(shù)據(jù)的查詢與索引結(jié)構(gòu)的基礎(chǔ)上,對(duì)云數(shù)據(jù)庫(kù)中的部分核心數(shù)據(jù)進(jìn)行加密。
3 基于保序加密方法的數(shù)據(jù)安全保護(hù)技術(shù)
保序加密(Order-Preserving Encryption)簡(jiǎn)稱OPE,是由Agrawal等人提出的一種保持?jǐn)?shù)據(jù)密文與明文數(shù)據(jù)值大小一致的方法,使用該方法數(shù)據(jù)管理人員可以在密文直接做SQL查詢操作;有關(guān)數(shù)值范圍查詢,數(shù)值最大、最小查詢,分組排序,關(guān)于數(shù)據(jù)的索引查詢也同樣可以操作。該方法既可以在不泄露明文概率分布的情況下,保證明文與密文的數(shù)據(jù)順序一致,在不解密的情況下能夠?qū)用軘?shù)據(jù)進(jìn)行比較操作。OPE的基本算思想是關(guān)于字符型數(shù)據(jù)的數(shù)據(jù)庫(kù)加密方法,按照一定的規(guī)則對(duì)數(shù)據(jù)進(jìn)行模糊排序。該算法的時(shí)間復(fù)雜度高,執(zhí)行代價(jià)大,并且只可針對(duì)純數(shù)值型或純字符型數(shù)據(jù),數(shù)據(jù)庫(kù)中其他的數(shù)據(jù)類型不適合該類算法。Boldyreva等人提出了一種對(duì)數(shù)據(jù)進(jìn)行嚴(yán)格安全性分析與定義的OPE+算法,該算法基于隨機(jī)保序函數(shù)和超幾何關(guān)系,攻擊者只會(huì)得到密文數(shù)據(jù)的順序,不會(huì)造成密文內(nèi)容的泄露。為了更好地解決數(shù)據(jù)庫(kù)中數(shù)據(jù)的安全性,還應(yīng)該在保序加密算法的基礎(chǔ)引入劃分桶的算法,做粗顆粒的索引操作,使用二叉搜索樹描述數(shù)據(jù)的索引結(jié)構(gòu),將數(shù)據(jù)庫(kù)表中的關(guān)鍵字和敏感數(shù)據(jù)劃分到N個(gè)大小相同的桶中,如圖1所示。
4 結(jié)束語(yǔ)
云計(jì)算,大數(shù)據(jù)技術(shù)的不斷發(fā)展,社會(huì)各行各業(yè)對(duì)數(shù)據(jù)的存儲(chǔ)與處理需求強(qiáng)烈,有關(guān)云數(shù)據(jù)庫(kù)數(shù)據(jù)安全性的研究成為近期研究熱點(diǎn),本文在查閱近幾年關(guān)于云計(jì)算環(huán)境下數(shù)據(jù)安全性保護(hù)相關(guān)文獻(xiàn)后,提出了一種適合云數(shù)據(jù)庫(kù)中數(shù)據(jù)隱私性與安全性保護(hù)的技術(shù),一種基于保序加密算法的數(shù)據(jù)安全保護(hù)技術(shù),該技術(shù)保障了數(shù)據(jù)明文與密文順序的一致性,方便用戶直接在密文上進(jìn)行數(shù)據(jù)查詢操作,降低了數(shù)據(jù)泄露的危險(xiǎn)。該算法在具體實(shí)施過(guò)程中依然純?cè)趩?wèn)題,比如不可以滿足云數(shù)據(jù)庫(kù)中復(fù)雜多樣的數(shù)據(jù)形式,缺乏對(duì)算法進(jìn)行準(zhǔn)確的安全分析等問(wèn)題,這些問(wèn)題需要在后期算法中做優(yōu)化改進(jìn)。
參考文獻(xiàn):
[1] 田洪亮,張勇,李超,等.云環(huán)境下數(shù)據(jù)庫(kù)機(jī)密性保護(hù)技術(shù)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2017,40(10):2245-2270.
[2] 張尼,張?jiān)朴?大數(shù)據(jù)安全技術(shù)與應(yīng)用[M].北京:人民郵電出版社,2014.
[3] 孫鳳文,張婷.BSS系統(tǒng)應(yīng)用云數(shù)據(jù)庫(kù)和云計(jì)算技術(shù)[J].數(shù)字通信世界,2018(12):60.
[4] 李超零,陳越,譚鵬許,等.基于分解與加密的云數(shù)據(jù)庫(kù)隱私保護(hù)機(jī)制研究[J].信息工程大學(xué)學(xué)報(bào),2012,13(03):376-384.
【通聯(lián)編輯:代影】