內(nèi)蒙古電力(集團)有限責(zé)任公司信息通信分公司 汪 嘯 李 晶 張 翼 張 瑜
關(guān)于企業(yè)數(shù)據(jù)保護方式的對比研究
內(nèi)蒙古電力(集團)有限責(zé)任公司信息通信分公司 汪 嘯 李 晶 張 翼 張 瑜
數(shù)據(jù)安全是企業(yè)管理信息系統(tǒng)建設(shè)和運維工作的重中之重。隨著信息化工作的不斷深入,數(shù)據(jù)價值日顯重要,數(shù)據(jù)安全風(fēng)險日益嚴(yán)重。依照數(shù)據(jù)安全保障規(guī)定,應(yīng)同時規(guī)劃、同時設(shè)計、同時建設(shè)、同步維護的數(shù)據(jù)安全保障系統(tǒng),隨著企業(yè)信息化走向深入,數(shù)據(jù)安全風(fēng)險還面臨著工作安全管理規(guī)定陳舊、保障能力不足、保障成本過高,保障效率低下等問題。為應(yīng)對上述問題,本文在基于充分調(diào)查研究的基礎(chǔ)上,依據(jù)實際情況進行分析、研究、比較,通過對比研究各類型數(shù)據(jù)保障方案的優(yōu)勢與不足,針對可能產(chǎn)生的問題提出相應(yīng)的應(yīng)對思路,可提高數(shù)據(jù)安全保障的工作效率,降低綜合運行成本。基于對企業(yè)數(shù)據(jù)中心的實際情況,提出有針對性的意見,繼而對企業(yè)數(shù)據(jù)安全保障方式進行了較為深入的分析和探討。
企業(yè)數(shù)據(jù)安全數(shù)據(jù)中心;數(shù)據(jù)庫;數(shù)據(jù)一致性;數(shù)據(jù)摘要驗證技術(shù)
隨著企業(yè)信息化建設(shè)工作走向深入,企業(yè)信息系統(tǒng)數(shù)據(jù)的安全性逐漸受到管理人員和技術(shù)人員的重視。隨IT項目同步計劃、同步實施、同步運維的數(shù)據(jù)安全系統(tǒng)已經(jīng)成為數(shù)據(jù)安全保障的支撐。
數(shù)據(jù)安全可分為數(shù)據(jù)可用性和數(shù)據(jù)保密性兩個方面。數(shù)據(jù)可用性在英文文獻中對應(yīng)Data Safety,而數(shù)據(jù)保密性對應(yīng)Data Security,在部分中文文獻中區(qū)分為“安全(SA)”和“安全(SE)”以指代上述名詞。在技術(shù)方面,存在著可用性和保密性互為支撐、發(fā)揮協(xié)同效應(yīng)的現(xiàn)象。如在數(shù)據(jù)在線復(fù)制、離線備份中采用加密形式進行數(shù)據(jù)的傳輸和存儲,實現(xiàn)了多份數(shù)據(jù)的加密以滿足用戶特定需求。在密鑰制作、保存,數(shù)據(jù)加密、解密,數(shù)據(jù)脫敏、利用的過程中則需要借助數(shù)據(jù)復(fù)制、備份技術(shù)實現(xiàn)多副本利用。數(shù)據(jù)可用性依靠存儲設(shè)備進行數(shù)據(jù)在線冗余存儲或離線歸檔達到的能夠在設(shè)備災(zāi)難來臨時進行恢復(fù)的能力,其主要指標(biāo)為恢復(fù)時間目標(biāo)(Recovery Time Objective,RTO)和恢復(fù)點目標(biāo)(Recovery Point Objective,RPO)。數(shù)據(jù)保密性指數(shù)據(jù)在使用和保存的過程中能夠按照合法使用者的目的進行交互,不能夠被非授權(quán)者獲取、更改,任何獲取和修改數(shù)據(jù)的記錄必須完整可追溯。因篇幅所限,本論文著重討論數(shù)據(jù)可用性(即安全-SA)這一方面。
作為數(shù)據(jù)安全最后一道防線的數(shù)據(jù)保護系統(tǒng)在大數(shù)據(jù)時代顯得尤為重要。一個可靠的數(shù)據(jù)保護系統(tǒng)可以有效降低信息系統(tǒng)的安全風(fēng)險,提高系統(tǒng)健壯性,實現(xiàn)信息系統(tǒng)高可用性。如何經(jīng)濟高效地進行數(shù)據(jù)保護系統(tǒng)的建設(shè)已經(jīng)成為亟待解決的重要問題。
目前,數(shù)據(jù)保護方式可根據(jù)保存形式分為數(shù)據(jù)鏡像、數(shù)據(jù)備份、數(shù)據(jù)容災(zāi)、數(shù)據(jù)快照等多個方面。數(shù)據(jù)鏡像常見部署模式為使用兩臺配置相同的磁盤陣列存儲應(yīng)用數(shù)據(jù),并建立同等的連接關(guān)系,且兩臺磁盤陣列處于雙活或主備模式,可以在一臺設(shè)備出現(xiàn)故障的情況下實現(xiàn)業(yè)務(wù)的連續(xù)運行。數(shù)據(jù)備份常見部署模式為配置備份用磁帶庫和相關(guān)備份軟件與在運系統(tǒng)連接,實現(xiàn)數(shù)據(jù)的在線備份、離線保存。在發(fā)生數(shù)據(jù)丟失和損毀的情況下,可以通過載入離線備份數(shù)據(jù)進行恢復(fù),良好的備份系統(tǒng)和備份策略可有效降低RTO和RPO指標(biāo)。數(shù)據(jù)容災(zāi)可依據(jù)數(shù)據(jù)中心的地理距離分為本地容災(zāi)和異地容災(zāi),其技術(shù)架構(gòu)為依托遠程高帶寬的IP網(wǎng)絡(luò)進行數(shù)據(jù)的異步更新。在實現(xiàn)目標(biāo)方面,可分為應(yīng)用級容災(zāi)、數(shù)據(jù)級容災(zāi)和離線容災(zāi)。應(yīng)用級容災(zāi)又可分為主備數(shù)據(jù)中心模式和多活數(shù)據(jù)中心模式,其不同點在于業(yè)務(wù)數(shù)據(jù)的流向是集中于一個數(shù)據(jù)中心后進行變更分發(fā)還是分別流向多個數(shù)據(jù)中心后進行相互同步。數(shù)據(jù)快照是確定某個時間點的可用數(shù)據(jù)文件拷貝,此拷貝即為相對應(yīng)數(shù)據(jù)在該時間點的完全映像。數(shù)據(jù)快照是其對應(yīng)的數(shù)據(jù)的邏輯副本,也可以是其對應(yīng)的數(shù)據(jù)的物理副本。在具體技術(shù)實現(xiàn)上,可設(shè)為基礎(chǔ)數(shù)據(jù)與指定時間點歸檔文件或數(shù)據(jù)塊的組合。對于回溯類型的快照,也可采用地址指針的存檔的辦法完成。快照的時間區(qū)分顆粒度一般在分鐘級,相對于前者鏡像的時間區(qū)分顆粒度可達到秒級以下、而備份、數(shù)據(jù)容災(zāi)的顆粒度在小時級以上。隨著技術(shù)的發(fā)展,將各種技術(shù)融合的方案也應(yīng)運而生,即時間區(qū)分顆粒度向秒級以下發(fā)展,數(shù)據(jù)復(fù)制范圍則由文件向數(shù)據(jù)塊級別以下發(fā)展。
在數(shù)據(jù)鏡像、數(shù)據(jù)備份、數(shù)據(jù)容災(zāi)、數(shù)據(jù)快照等數(shù)據(jù)保護方式的具體技術(shù)實現(xiàn)上,可依據(jù)技術(shù)手段、地理概念、行業(yè)標(biāo)準(zhǔn)、應(yīng)用模式等方式進行區(qū)分。在技術(shù)手段區(qū)分方面,既可以通過基于存儲磁盤陣列、服務(wù)器等底層設(shè)備實現(xiàn)基礎(chǔ)架構(gòu)層面、比特層級的物理實現(xiàn),又可以通過操作系統(tǒng)、數(shù)據(jù)庫等系統(tǒng)軟件實現(xiàn)支撐架構(gòu)層面、數(shù)據(jù)塊層級的邏輯實現(xiàn)。在地理概念區(qū)分方面,可分為近程災(zāi)備和遠程災(zāi)備。在行業(yè)標(biāo)準(zhǔn)方面,可分為災(zāi)備、備份、鏡像等。災(zāi)備可以在線或離線方式保存實時數(shù)據(jù),主要以應(yīng)對數(shù)據(jù)介質(zhì)物理損壞。備份以在線或離線方式保存階段性歸檔數(shù)據(jù)數(shù)據(jù),主要以應(yīng)對數(shù)據(jù)的邏輯損壞,主要有病毒、誤操作、黑客因素等。在應(yīng)用模式方面,既有完全基于存儲或備份技術(shù)的單一數(shù)據(jù)保護型產(chǎn)品,也有具有融合特點的產(chǎn)品。在項目實例中,既有本地鏡像、快照、多副本備份組成的多層數(shù)據(jù)恢復(fù)體系,也有遠端容災(zāi)、遠端備份組成的多地址數(shù)據(jù)歸檔體系。既有基于數(shù)據(jù)庫技術(shù)的雙活數(shù)據(jù)中心模式,也有基于存儲或磁帶(物理或虛擬)的數(shù)據(jù)級災(zāi)難恢復(fù)模式。
TRAP(timely recovery to any point-in-time)是結(jié)構(gòu)化評估數(shù)據(jù)恢復(fù)能力的重要手段,可根據(jù)技術(shù)實現(xiàn)定義為1至4級。備份和快照技術(shù)在在線(on-line)模式下進行會占用系統(tǒng)I/O,耗費存儲資源并影響在運系統(tǒng)的生產(chǎn)業(yè)務(wù)。在數(shù)據(jù)恢復(fù)情況下,PRO和RTO相對較長,可評估為TRAP-1。具有版本控制(歸檔文件存取)功能的系統(tǒng)可隨時調(diào)閱或回退至指定時間點(指定版本),因其讀寫機制是基于文件系統(tǒng)層面實現(xiàn)的,性能較直接讀寫數(shù)據(jù)塊差,故定義為TRAP-2。常見的符合TRAP-2的技術(shù)為運行歸檔模式下的Oracle數(shù)據(jù)庫,其日志具有時間戳,可滿足相關(guān)要求,以邏輯方式實現(xiàn)的Oracle-Dataguard亦符合此要求。在TRAP-2級系統(tǒng)上實現(xiàn)數(shù)據(jù)塊讀取,可按時間(版本)進行追溯的系統(tǒng)被稱之為連續(xù)數(shù)據(jù)保護(continuous data protection,CDP)系統(tǒng),可定義為TRAP-3。實現(xiàn)ASM管理、在歸檔模式下運行的Oracle可滿足此要求,以物理方式實現(xiàn)的Oracle-Dataguard亦符合此要求。
TRAP-4是一種改進的CDP機制,其要求是基于初始數(shù)據(jù)去評估變量并進行壓縮,一般以比對初始數(shù)據(jù)和變更時間點數(shù)據(jù)的組成塊哈希值為手段,用指針代替恒定量,并追加保存變量實現(xiàn)備份數(shù)據(jù)的壓縮。近程鏡像、遠程復(fù)制卷等技術(shù)中的緩存部分是基于此原理進行開發(fā)和實現(xiàn)。由于比對工作需要高性能CPU、大容量內(nèi)存的硬件平臺以及支持,一般常見于高端磁盤陣列和高端磁帶庫(物理/虛擬)或數(shù)據(jù)庫/備份一體化套件,也稱之為數(shù)據(jù)復(fù)制壓縮技術(shù)。
在理想狀態(tài)下,RPO與RTO均應(yīng)無限趨近于零,極低RTO和RPO系統(tǒng)在運維階段也需要投入足夠多的資金、時間和人力成本,需要較多的資源,導(dǎo)致建設(shè)成本上升,這是需要企業(yè)管理層給予足夠的重視。考慮到公有云的快速發(fā)展,可以在滿足業(yè)務(wù)合規(guī)性的前提下將部分高價值、低敏感的數(shù)據(jù)或業(yè)務(wù)遷移至公有云。同時,以RTO、RPO級別選擇和考核云服務(wù)供應(yīng)商。
[1]陳莉君.康華.賈威威.云存儲日志文件系統(tǒng)中快照的設(shè)計與實現(xiàn)[J].計算機應(yīng)用與軟件,2013,7.
[2]趙建黨.銀行計算機網(wǎng)絡(luò)高可用模型研究[D].鄭州大學(xué),2009.
[3]周煒.基于存儲虛擬化的快照與CDP設(shè)計[D].湖南大學(xué),2011.
[4]蒲波.涉密局域網(wǎng)數(shù)據(jù)智能備份研究與實現(xiàn)[D].四川大學(xué),2005.
[5]鄒強.高可用系統(tǒng)設(shè)計與實現(xiàn)[D].復(fù)旦大學(xué),2012.
[6]海杰.設(shè)備層多版本快照的設(shè)計與實現(xiàn)[D].華中科技大學(xué),2008.
汪嘯(1986—),碩士,工程師,研究方向為信息系統(tǒng)架構(gòu)分析。