摘要:分析了威脅高校數(shù)據(jù)中心安全的各類因素,介紹了容災(zāi)系統(tǒng)的基礎(chǔ)知識(shí),詳細(xì)論述了基于網(wǎng)絡(luò)環(huán)境下的高校數(shù)據(jù)中心容災(zāi)系統(tǒng)設(shè)計(jì)的原則策略,并對(duì)主要模塊和功能結(jié)構(gòu)進(jìn)行了分析與研究。
關(guān)鍵詞:數(shù)據(jù)備份;容災(zāi)系統(tǒng);遠(yuǎn)程鏡像
中圖分類號(hào):TP309.3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-2163(201I)04-0065-04
0 引言
高校的數(shù)據(jù)中心是教學(xué)、科研、管理等信息資源的集中地,是各應(yīng)用系統(tǒng)的數(shù)據(jù)倉(cāng)庫。數(shù)據(jù)中心的建設(shè),花費(fèi)了高校大量的人力、物力和財(cái)力,其存儲(chǔ)數(shù)據(jù)的重要性已經(jīng)遠(yuǎn)遠(yuǎn)超過了物理存儲(chǔ)的載體本身。隨著建設(shè)的深入,數(shù)據(jù)中心的數(shù)據(jù)呈現(xiàn)幾何式增長(zhǎng)。當(dāng)數(shù)據(jù)中心出現(xiàn)軟硬件故障、人為操作失誤或非法訪問者對(duì)數(shù)據(jù)實(shí)施破壞時(shí),常見的本地容災(zāi)技術(shù),如服務(wù)器集群、磁帶備份、服務(wù)器快照、數(shù)據(jù)鏡像等備份方法就可以發(fā)揮作用,可以在一定程度上恢復(fù)各類業(yè)務(wù),保障數(shù)據(jù)和系統(tǒng)安全。但當(dāng)面臨大范圍、突發(fā)性事件以及自然災(zāi)害等不可抗力的情況下,上述技術(shù)就無能為力了。數(shù)據(jù)中心一旦遭到破壞,造成的損失是顯而易見的,各項(xiàng)業(yè)務(wù)停滯,數(shù)據(jù)可能丟失,并且丟失后也無法彌補(bǔ)。因此,建立一套基于網(wǎng)絡(luò)的數(shù)據(jù)中心遠(yuǎn)程容災(zāi)系統(tǒng)可以將被破壞的數(shù)據(jù)迅速恢復(fù),確保各類應(yīng)用系統(tǒng)正常運(yùn)行,提高數(shù)據(jù)中心的安全性和可靠性。
1 數(shù)據(jù)中心信息安全的威脅因素
數(shù)據(jù)中心災(zāi)害的發(fā)生有許多因素,根據(jù)發(fā)生的性質(zhì)可以主要分為三類。
1.1不可抗力災(zāi)害
不可抗力災(zāi)害主要指破壞力大、帶有突發(fā)性且不可預(yù)測(cè)的自然災(zāi)害,如大規(guī)模的水災(zāi)和火災(zāi)、雷電、強(qiáng)地震、海嘯以及突發(fā)性災(zāi)難事件性質(zhì)的區(qū)域性災(zāi)害。這些災(zāi)害具有不確定性、強(qiáng)破壞性、瞬時(shí)性等特點(diǎn),一般難以預(yù)測(cè)和防范,因此一旦這些災(zāi)害在高校數(shù)據(jù)中心及其周圍發(fā)生,就會(huì)對(duì)數(shù)據(jù)中心的物理硬件造成嚴(yán)重破壞,致使系統(tǒng)癱瘓、數(shù)據(jù)丟失、服務(wù)中斷,并且很難恢復(fù),對(duì)數(shù)據(jù)中心的破壞是毀滅性的。
1.2設(shè)備故障災(zāi)害
為了使各類應(yīng)用不間斷運(yùn)行,數(shù)據(jù)中心的網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備、存儲(chǔ)設(shè)備等要求7×24小時(shí)運(yùn)行,因此對(duì)硬件設(shè)備的持續(xù)性工作要求較高;而由于受到數(shù)據(jù)中心環(huán)境,比如溫度、濕度、灰塵、靜電以及硬件設(shè)備老化、突然斷電等因素的影響,則容易使硬件設(shè)備發(fā)生損壞。這類事故影響范圍小,一旦出現(xiàn),可以備用件來替換,相比自然災(zāi)害而言,屬于易于恢復(fù)一類。
1.3人為破壞行為
人為破壞行為主要分為兩種,一種是系統(tǒng)管理員在系統(tǒng)操作過程中產(chǎn)生的錯(cuò)誤,比如對(duì)服務(wù)器及網(wǎng)絡(luò)設(shè)施的錯(cuò)誤配置、對(duì)應(yīng)用程序的誤操作等;另一種是非法侵人造成的系統(tǒng)癱瘓,比如黑客入侵、病毒傳播等。上述兩種破壞行為,主要是人的主觀因素造成的,對(duì)數(shù)據(jù)中心的破壞較小。系統(tǒng)管理員如果能夠提高業(yè)務(wù)水平,加強(qiáng)安全防范技術(shù)措施,完全可以避免這類事故破壞的發(fā)生。
2 容災(zāi)系統(tǒng)基本知識(shí)概述
2.1容災(zāi)系統(tǒng)的定義
容災(zāi)(Disaster Recovery)是一個(gè)廣義的概念,任何可以確保各類業(yè)務(wù)連續(xù)可用的方案均可稱之為容災(zāi)。針對(duì)數(shù)據(jù)中心而言,容災(zāi)就是通過容災(zāi)機(jī)制減弱或防止各種災(zāi)難帶來的破壞,并且在災(zāi)害對(duì)業(yè)務(wù)和數(shù)據(jù)造成破壞后能夠在最短的時(shí)間內(nèi)恢復(fù),保證系統(tǒng)數(shù)據(jù)的正確性和完整性,同時(shí)確保系統(tǒng)能夠持續(xù)性地穩(wěn)定工作。
網(wǎng)絡(luò)環(huán)境下的容災(zāi)系統(tǒng)就是通過網(wǎng)絡(luò)異地建立的與本地?cái)?shù)據(jù)系統(tǒng)相同的冗余備份系統(tǒng),可防止各類災(zāi)害發(fā)生對(duì)數(shù)據(jù)中心造成破壞,從而使其提供的業(yè)務(wù)服務(wù)不致中斷。備份系統(tǒng)與數(shù)據(jù)中心系統(tǒng)保持網(wǎng)絡(luò)連通,當(dāng)數(shù)據(jù)中心正常運(yùn)行時(shí),容災(zāi)系統(tǒng)就會(huì)將主中心的數(shù)據(jù)通過網(wǎng)絡(luò)通道備份到異地冗余備份系統(tǒng)中心,并保持?jǐn)?shù)據(jù)同步性。當(dāng)災(zāi)害發(fā)生后,備份中心可將數(shù)據(jù)重新傳遞到主中心數(shù)據(jù)庫,從而迅速恢復(fù)各項(xiàng)業(yè)務(wù)系統(tǒng),提高服務(wù)的快速響應(yīng)時(shí)間。由此可見,基于網(wǎng)絡(luò)環(huán)境下的容災(zāi)系統(tǒng)就是通過在異地構(gòu)建、維護(hù)一個(gè)備份系統(tǒng),利用地理空間上的異構(gòu)來提高系統(tǒng)和數(shù)據(jù)應(yīng)對(duì)突發(fā)性、災(zāi)難性事件的防范反應(yīng)能力,保障和支持業(yè)務(wù)的連續(xù)性。容災(zāi)系統(tǒng)的通用模型如圖1所示。

2.2容災(zāi)系統(tǒng)的分類
根據(jù)對(duì)業(yè)務(wù)和數(shù)據(jù)恢復(fù)的方式,可以將容災(zāi)系統(tǒng)分為兩類:一類是數(shù)據(jù)類容災(zāi),一類是應(yīng)用類容災(zāi)。
(1)數(shù)據(jù)類容災(zāi)技術(shù)的基本方法是在數(shù)據(jù)中心外的異地,構(gòu)建一套數(shù)據(jù)備份系統(tǒng)。該系統(tǒng)可以將數(shù)據(jù)中心的關(guān)鍵數(shù)據(jù)在異地實(shí)現(xiàn)備份,當(dāng)災(zāi)害出現(xiàn)時(shí),關(guān)鍵數(shù)據(jù)不至于丟失。主要采用數(shù)據(jù)備份和復(fù)制技術(shù)來實(shí)現(xiàn)。
(2)應(yīng)用類容災(zāi)是建立在數(shù)據(jù)類容災(zāi)的基礎(chǔ)之上的,其基本構(gòu)建思路是在異地建立一套和數(shù)據(jù)中心應(yīng)用業(yè)務(wù)完全相同的備份系統(tǒng)。應(yīng)用類容災(zāi)比數(shù)據(jù)類容災(zāi)更為復(fù)雜,因其不僅需要建立完整的業(yè)務(wù)備份系統(tǒng),還需要搭建與數(shù)據(jù)中心相似的使用環(huán)境,比如網(wǎng)絡(luò)環(huán)境、業(yè)務(wù)環(huán)境等,根據(jù)業(yè)務(wù)處理的特點(diǎn)來完成應(yīng)用和數(shù)據(jù)處理的同步。
容災(zāi)系統(tǒng)是一項(xiàng)系統(tǒng)性的綜合工程,并不單指某些硬件或軟件。在網(wǎng)絡(luò)環(huán)境下,應(yīng)該綜合各種策略,構(gòu)建多層次的、立體的容災(zāi)體系。只有這樣,才可以真正實(shí)現(xiàn)完全容災(zāi)。
3 網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)中心遠(yuǎn)程容災(zāi)系統(tǒng)體系研究
容災(zāi)系統(tǒng)設(shè)計(jì)的主要目標(biāo)就是要確保數(shù)據(jù)中心業(yè)務(wù)的連續(xù)性和可恢復(fù)性,鑒于高校數(shù)據(jù)中心遠(yuǎn)程容災(zāi)的重要性,結(jié)合高校數(shù)據(jù)中心的特點(diǎn),下面對(duì)網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)中心遠(yuǎn)程容災(zāi)系統(tǒng)體系進(jìn)行分析與研究。
3.1系統(tǒng)設(shè)計(jì)原則
為了滿足遠(yuǎn)程容災(zāi)需求,系統(tǒng)在設(shè)計(jì)思想上應(yīng)該體現(xiàn)如下原則:
(1)提高系統(tǒng)的實(shí)用性。實(shí)用性是系統(tǒng)的根本,高校數(shù)據(jù)中心擔(dān)負(fù)著重要的數(shù)據(jù)應(yīng)用任務(wù),系統(tǒng)的設(shè)計(jì)應(yīng)該最大限度地滿足實(shí)際應(yīng)用需求;結(jié)構(gòu)應(yīng)盡可能地簡(jiǎn)化,易于管理員操作,提高系統(tǒng)實(shí)用性,并利于系統(tǒng)的擴(kuò)展和維護(hù)。同時(shí)還要盡可能地減少由于容災(zāi)而造成的系統(tǒng)負(fù)擔(dān)。
(2)保證系統(tǒng)的先進(jìn)性。能夠讓系統(tǒng)隨著容災(zāi)技術(shù)的發(fā)展而靈活變化并及時(shí)更新,不斷提高系統(tǒng)的先進(jìn)性。
(3)確保系統(tǒng)的可靠性。容災(zāi)系統(tǒng)只有穩(wěn)定可靠的運(yùn)行,才能保證數(shù)據(jù)的一致性。因而需要科學(xué)設(shè)計(jì)網(wǎng)絡(luò)架構(gòu),通過防火墻、入侵檢測(cè)、防病毒軟件等技術(shù),提高容災(zāi)系統(tǒng)中數(shù)據(jù)的穩(wěn)定可靠性。
3.2系統(tǒng)總體結(jié)構(gòu)框架
基于網(wǎng)絡(luò)的容災(zāi)系統(tǒng)主要由幾大部分組成:本地應(yīng)用系統(tǒng)、本地鏡像備份系統(tǒng)、遠(yuǎn)程鏡像備份系統(tǒng)、災(zāi)害檢測(cè)與恢復(fù)系統(tǒng)、網(wǎng)絡(luò)通道組件和配置管理系統(tǒng)。這些部分共同實(shí)現(xiàn)了本地?cái)?shù)據(jù)與服務(wù)的跨地域容災(zāi)。總體框架拓?fù)淙鐖D2所示。

根據(jù)抽象模型圖可知,在數(shù)據(jù)中心中,本地應(yīng)用和備份系統(tǒng)共同組建了高速的本地鏡像備份系統(tǒng),為了提高數(shù)據(jù)備份的效率,采用數(shù)據(jù)同步算法,在提高鏡像數(shù)據(jù)效率的同時(shí),減少了系統(tǒng)資源的開銷。容災(zāi)管理系統(tǒng)將本地系統(tǒng)上的重要數(shù)據(jù)實(shí)時(shí)鏡像到本地鏡像網(wǎng)關(guān)上,能夠確保硬件毀壞等災(zāi)難造成的本地系統(tǒng)的備份和恢復(fù)。網(wǎng)絡(luò)通道主要包括防火墻集、入侵檢測(cè)IDS系統(tǒng)等,主要功能是在本地和異地之間建立起一條基于網(wǎng)絡(luò)的安全通道,將本地鏡像網(wǎng)關(guān)上的數(shù)據(jù)傳遞到遠(yuǎn)程數(shù)據(jù)中心網(wǎng)關(guān)上實(shí)現(xiàn)異地?cái)?shù)據(jù)傳送,并保障整個(gè)網(wǎng)絡(luò)通道的安全和暢通。
3.3系統(tǒng)功能模塊分析
根據(jù)系統(tǒng)需求分析,可以將上述抽象結(jié)構(gòu)模型劃分為不同的功能模塊,如圖3所示。

3.3.1本地備份模塊
本地備份模塊包括兩部分內(nèi)容,分別是服務(wù)器集群和心跳應(yīng)答。服務(wù)器集群的功能是收集、整理、釋放服務(wù)器資源,并對(duì)資源信息進(jìn)行封裝,通過心跳應(yīng)答向本地和遠(yuǎn)程備份系統(tǒng)進(jìn)行回復(fù)。
3.3.2監(jiān)控管理模塊
監(jiān)控管理模塊功能是根據(jù)服務(wù)器集群反饋的資源信息情況,確定采用的備份方式。當(dāng)服務(wù)器集群資源和負(fù)載緊張時(shí),監(jiān)控管理模塊中的資源管理功能就開始發(fā)揮作用,根據(jù)具體情況確定是進(jìn)行本地備份或者是遠(yuǎn)程異地備份。
3.3.3災(zāi)難檢測(cè)和恢復(fù)模塊
災(zāi)難檢測(cè)模塊和災(zāi)難恢復(fù)模塊均分為本地和遠(yuǎn)程兩部分。在災(zāi)難檢測(cè)模塊中,本地模塊檢測(cè)集群中服務(wù)器節(jié)點(diǎn)及其工作狀態(tài)并通過心跳技術(shù)調(diào)用本地災(zāi)難恢復(fù)模塊或遠(yuǎn)程災(zāi)難檢測(cè)模塊,由本地或遠(yuǎn)程災(zāi)難恢復(fù)模塊進(jìn)行恢復(fù)工作。而在災(zāi)難恢復(fù)模塊中,本地災(zāi)難恢復(fù)由集群系統(tǒng)自動(dòng)實(shí)現(xiàn)。遠(yuǎn)程災(zāi)難恢復(fù)模塊則需根據(jù)災(zāi)害發(fā)生時(shí)系統(tǒng)的環(huán)境狀態(tài)和應(yīng)用系統(tǒng)對(duì)數(shù)據(jù)的恢復(fù)要求進(jìn)行遠(yuǎn)程數(shù)據(jù)備份恢復(fù)。
4 遠(yuǎn)程鏡像系統(tǒng)的實(shí)現(xiàn)
由上述分析可知,遠(yuǎn)程鏡像技術(shù)是指鏡像的數(shù)據(jù)拷貝分布在多個(gè)異地站點(diǎn)之間的技術(shù)。在整套網(wǎng)絡(luò)環(huán)境下的遠(yuǎn)程容災(zāi)體系中,遠(yuǎn)程鏡像系統(tǒng)的實(shí)現(xiàn)是遠(yuǎn)程容災(zāi)體系構(gòu)建中最為關(guān)鍵的部分。在使用遠(yuǎn)程鏡像系統(tǒng)時(shí)主要注意以下幾個(gè)方面:
(1)本地鏡像和遠(yuǎn)程鏡像要保持?jǐn)?shù)據(jù)的緊密性和同步性,能及時(shí)將本地鏡像數(shù)據(jù)和遠(yuǎn)程鏡像對(duì)接,將災(zāi)難發(fā)生時(shí)丟失數(shù)據(jù)的風(fēng)險(xiǎn)降到最低。
(2)設(shè)計(jì)遠(yuǎn)程鏡像系統(tǒng)時(shí)應(yīng)考慮本地應(yīng)用系統(tǒng)工作的可持續(xù)性,盡量減小對(duì)應(yīng)用程序正常工作的影響。
(3)必須具備處理異構(gòu)數(shù)據(jù)庫的能力,盡可能保證異構(gòu)數(shù)據(jù)庫恢復(fù)的可用性。
(4)在設(shè)計(jì)策略上,還應(yīng)該考慮鏡像備份的方式,比如是采用完全備份、差異備份還是增量備份,是實(shí)時(shí)備份還是定時(shí)備份等。
遠(yuǎn)程鏡像系統(tǒng)的設(shè)計(jì),以管理類命令和I/0類流程兩條主線來構(gòu)架。
4.1遠(yuǎn)程鏡像用戶消息處理流程
消息處理流程是本地和遠(yuǎn)程鏡像溝通的橋梁。在處理系統(tǒng)消息時(shí),遠(yuǎn)程鏡像系統(tǒng)消息模塊首先接收消息,并對(duì)相應(yīng)的系統(tǒng)傳遞消息進(jìn)行審核,檢查其合法性以及正確性,若審核不通過,則向系統(tǒng)反饋失敗消息;若通過,則調(diào)用系統(tǒng)請(qǐng)求處理模塊,根據(jù)不同的命令碼生成相應(yīng)的任務(wù)加入隊(duì)列執(zhí)行。當(dāng)任務(wù)需要到遠(yuǎn)端執(zhí)行時(shí),則調(diào)用網(wǎng)絡(luò)通道模塊將任務(wù)發(fā)送到遠(yuǎn)端備份陣列;遠(yuǎn)端通訊模塊收到任務(wù)后,再對(duì)任務(wù)進(jìn)行相應(yīng)的相關(guān)性檢查,若通過檢查,調(diào)用用戶請(qǐng)求處理模塊對(duì)任務(wù)進(jìn)行處理。任務(wù)在遠(yuǎn)端執(zhí)行完成以后,再通過通訊模塊發(fā)送回接收用戶命令端,任務(wù)繼續(xù)執(zhí)行,直到任務(wù)執(zhí)行結(jié)束。
4.2遠(yuǎn)程鏡像I/O處理流程
I/0處理模塊的主要功能是對(duì)上一層模塊的I/0請(qǐng)求進(jìn)行處理,上層模塊對(duì)收到的I/0請(qǐng)求進(jìn)行解析,解析之后提交給I/0處理模塊。I/0請(qǐng)求一般分為兩類,一類是I/0讀請(qǐng)求,一類是I/0寫請(qǐng)求。讀請(qǐng)求是將收到的請(qǐng)求進(jìn)行地址映射,然后發(fā)送給底層的物理磁盤讀取數(shù)據(jù)元。寫請(qǐng)求是將處理后的數(shù)據(jù)元寫到主端的卷中,然后通知復(fù)制模塊開始發(fā)送數(shù)據(jù),同時(shí)數(shù)據(jù)處理模塊將請(qǐng)求地址重映射后寫入本地實(shí)際磁盤。I/0寫請(qǐng)求根據(jù)鏡像類型又分為同步和異步兩種,雖然兩類方法不同,但功能相同,都是要確保鏡像數(shù)據(jù)的一致性和完整性。
遠(yuǎn)程鏡像I/0處理模塊技術(shù)主要是利用位圖原理來實(shí)現(xiàn),也就是通過位圖差異對(duì)主從卷之間需要復(fù)制的數(shù)據(jù)元進(jìn)行判斷,以確保數(shù)據(jù)的一致性。當(dāng)兩個(gè)數(shù)據(jù)元位圖差異為“1”時(shí),表明主、從卷上的數(shù)據(jù)元有差異;位圖差為“0”時(shí),表明主、從卷上的數(shù)據(jù)元一致。具體工作流程如圖4所示。

5 結(jié)束語
目前,各類災(zāi)害性事件頻繁發(fā)生,如何確保高校數(shù)據(jù)中心的安全穩(wěn)定運(yùn)行,就成為了一個(gè)重要的研究課題。在設(shè)計(jì)網(wǎng)絡(luò)環(huán)境下的高校數(shù)據(jù)中心遠(yuǎn)程異地容災(zāi)系統(tǒng)時(shí),應(yīng)該全方位、多角度地進(jìn)行考慮,同時(shí)還應(yīng)兼顧系統(tǒng)實(shí)現(xiàn)的目標(biāo)、成本、運(yùn)營(yíng)費(fèi)用等因素,只有這樣,才能為高校數(shù)據(jù)中心避免風(fēng)險(xiǎn)和災(zāi)難、實(shí)現(xiàn)數(shù)據(jù)保護(hù)提供堅(jiān)實(shí)的保障。