摘要:SRDF是EMC公司推出的一種基于存儲(chǔ)系統(tǒng)的遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù),具有維護(hù)方便,對(duì)生產(chǎn)主機(jī)性能消耗小,技術(shù)成熟等特點(diǎn)。該文通過對(duì)比不同的數(shù)據(jù)復(fù)制方案,選擇SRDF設(shè)計(jì)并實(shí)現(xiàn)了企業(yè)IDC的災(zāi)備,在實(shí)際中取得了較好的效果。
關(guān)鍵詞:SRDF;災(zāi)備;應(yīng)用
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)32-9075-02
SRDF Technology in the Enterprise IDC Disaster Recovery System
ZHANG Gui-hong
(Department of Electron and Computer, Wuhan Technical College of Communications, Wuhan 430065, China)
Abstract: SRDF is the EMC Corporation introduced a remote data storage system-based replication technology, with easy maintenance, the production host performance consumption of small, mature technology and so on. Paper by comparing the different data replication program, select the SRDF is designed and implemented a disaster recovery company IDC, in practice, achieved good results.
Key words: SRDF; disaster recovery; application
1 背景
為了保障業(yè)務(wù)的連續(xù)性,減少各種未知災(zāi)難帶來的損失,建設(shè)災(zāi)備系統(tǒng)就成了企業(yè)數(shù)據(jù)中心(簡(jiǎn)稱IDC)必然的選擇。建設(shè)災(zāi)備系統(tǒng),既需要合理利用現(xiàn)有系統(tǒng)資源,避免不必要的浪費(fèi),又必須在災(zāi)難發(fā)生時(shí),能夠迅速及時(shí)地恢復(fù)業(yè)務(wù)。
2 常用遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù)比較
容災(zāi)要實(shí)現(xiàn)的首要功能就是在異地有一份數(shù)據(jù)的拷貝,遠(yuǎn)程容災(zāi)最核心的技術(shù)就是遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù)。常用的遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù)如下:
2.1 基于存儲(chǔ)系統(tǒng)的遠(yuǎn)程數(shù)據(jù)復(fù)制
存儲(chǔ)系統(tǒng)的遠(yuǎn)程數(shù)據(jù)復(fù)制實(shí)際上是基于磁盤陣列控制器的遠(yuǎn)程數(shù)據(jù)復(fù)制,它有主副兩套存儲(chǔ)子系統(tǒng),通過存儲(chǔ)子系統(tǒng)之間數(shù)據(jù)的鏡像實(shí)現(xiàn)數(shù)據(jù)的復(fù)制。該方案對(duì)主機(jī)的資源占用很小,能保證業(yè)務(wù)正常運(yùn)行下的I/O響應(yīng)。缺點(diǎn)是主副兩套存儲(chǔ)子系統(tǒng)必須是同構(gòu)的。該方案適用于實(shí)時(shí)性要求較高,IO量較大的系統(tǒng)容災(zāi)。[1]
2.2 基于存儲(chǔ)卷的數(shù)據(jù)復(fù)制
存儲(chǔ)卷的數(shù)據(jù)復(fù)制實(shí)際是主機(jī)系統(tǒng)數(shù)據(jù)復(fù)制的一種,即利用存儲(chǔ)卷復(fù)制技術(shù)將本地存儲(chǔ)卷復(fù)制到異地存儲(chǔ)上。復(fù)制基于Volume進(jìn)行。該方案優(yōu)點(diǎn)是支持存儲(chǔ)卷上的所有數(shù)據(jù)類型復(fù)制,兩套存儲(chǔ)子系統(tǒng)可以是異構(gòu)的。缺點(diǎn)是占用主機(jī)CPU資源較高,源和目標(biāo)操作系統(tǒng)和相同的數(shù)據(jù)庫(kù)版本必需是相同的,且占用較多的網(wǎng)絡(luò)帶寬資源。該方案比較典型的是Veritas的VVR數(shù)據(jù)復(fù)制。該方案適用于異構(gòu)存儲(chǔ)環(huán)境下的容災(zāi)。
2.3 基于數(shù)據(jù)庫(kù)邏輯的數(shù)據(jù)復(fù)制
該方式通過直接捕獲源數(shù)據(jù)庫(kù)的交易,將數(shù)據(jù)庫(kù)的改變邏輯復(fù)制到目標(biāo)系統(tǒng)數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)源系統(tǒng)和目標(biāo)系統(tǒng)數(shù)據(jù)的一致性。該方案比較典型的是利用DSG RealSync實(shí)現(xiàn)數(shù)據(jù)復(fù)制。RealSync在源和目標(biāo)系統(tǒng)端分別安裝Agent進(jìn)程,源端的Agent進(jìn)程對(duì)ORACLE日志進(jìn)行監(jiān)控,發(fā)現(xiàn)改變及時(shí)對(duì)目標(biāo)數(shù)據(jù)庫(kù)進(jìn)行更新。當(dāng)應(yīng)用系統(tǒng)在源端向數(shù)據(jù)庫(kù)進(jìn)行任何操作時(shí)時(shí),這些信息都將在Redo Log中保存,RealSync Agent通過對(duì)實(shí)時(shí)獲取的Log日志進(jìn)行分析,獲得本次操作的交易指令和交易數(shù)據(jù),然后將這些交易指令和交易數(shù)據(jù)通過網(wǎng)絡(luò)傳送到目標(biāo)系統(tǒng)。該種方案的優(yōu)點(diǎn)是不依賴于硬件環(huán)境,對(duì)源和目標(biāo)的存儲(chǔ)、操作系統(tǒng)、數(shù)據(jù)庫(kù)版本沒有嚴(yán)格要求,缺點(diǎn)是對(duì)于IO交易量較大的數(shù)據(jù)庫(kù),有較大延時(shí)。且只能復(fù)制數(shù)據(jù)庫(kù),對(duì)文件系統(tǒng)無能為力。該方案適用于IO量不大,且對(duì)實(shí)時(shí)性要求較高的災(zāi)備環(huán)境。
3 SRDF在企業(yè)IDC災(zāi)備系統(tǒng)中的應(yīng)用
衡量災(zāi)備有兩個(gè)技術(shù)指標(biāo),一個(gè)是RPO(Recovery Point Objective):即數(shù)據(jù)恢復(fù)點(diǎn)目標(biāo),主要指的是業(yè)務(wù)系統(tǒng)所能容忍的數(shù)據(jù)丟失量;另一個(gè)是RTO(Recovery Time Objective):即恢復(fù)時(shí)間目標(biāo),主要指的是所能容忍的業(yè)務(wù)停止服務(wù)的最長(zhǎng)時(shí)間,也就是從災(zāi)難發(fā)生到業(yè)務(wù)系統(tǒng)恢復(fù)服務(wù)功能所需要的最短時(shí)間周期。
遠(yuǎn)程數(shù)據(jù)復(fù)制一般分為同步遠(yuǎn)程復(fù)制和異步遠(yuǎn)程復(fù)制,同步復(fù)制技術(shù)是指通過遠(yuǎn)程復(fù)制軟件,將本地?cái)?shù)據(jù)以完全同步的方式復(fù)制到異地。同步復(fù)制能保障遠(yuǎn)程數(shù)據(jù)拷貝與本地的內(nèi)容相匹配。但它存在往返傳播造成延時(shí)較長(zhǎng)的缺點(diǎn),適用于較近距離。異步復(fù)制技術(shù)先完成本地存儲(chǔ)系統(tǒng)的基本I/O操作,再由本地存儲(chǔ)系統(tǒng)提供給遠(yuǎn)程I/O操作并完成確認(rèn)信息。遠(yuǎn)程的數(shù)據(jù)復(fù)制是以后臺(tái)同步的方式進(jìn)行的,這使本地系統(tǒng)性能受到的影響很小,傳輸距離長(zhǎng),對(duì)網(wǎng)絡(luò)帶寬要求小。但是,由于遠(yuǎn)程的存儲(chǔ)子系統(tǒng)的寫沒有得到確認(rèn),當(dāng)某種因素造成數(shù)據(jù)傳輸失敗,可能出現(xiàn)數(shù)據(jù)一致性問題。
根據(jù)遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù)方案特點(diǎn),對(duì)實(shí)時(shí)性要求較高的企業(yè),在建設(shè)IDC災(zāi)備系統(tǒng)時(shí),往往要求RPO為0,RTO近可能短,這時(shí),EMC的SRDF技術(shù)進(jìn)行數(shù)據(jù)的實(shí)時(shí)同步就是不錯(cuò)的選擇。
3.1 SRDF技術(shù)原理及特點(diǎn)
SRDF是Symmetrix Remote Data Facility的縮寫,是EMC公司的一種存儲(chǔ)智能復(fù)制技術(shù),實(shí)際上是一種基于存儲(chǔ)系統(tǒng)的遠(yuǎn)程數(shù)據(jù)復(fù)制方案。SRDF數(shù)據(jù)復(fù)制方式如下:
SRDF擁有兩套磁盤子系統(tǒng),分別稱之為R1和R2,存放數(shù)據(jù)拷貝的R2子系統(tǒng)被安置在災(zāi)備機(jī)房,這樣就確保了在主中心發(fā)生故障時(shí),R2系統(tǒng)仍然是可用的,而且與R1是同步的。由于使用了不同的子系統(tǒng),所以可對(duì)R1和R2分別進(jìn)行尋址。第二個(gè)數(shù)據(jù)拷貝(R2)可以按照只讀模式供附加在第二個(gè)子系統(tǒng)上的第二個(gè)處理器使用。總的來說,SRDF基本上就是存儲(chǔ)控制器上的鏡像實(shí)現(xiàn),只不過這時(shí)磁盤子系統(tǒng)被分為本地(R1)和遠(yuǎn)程(R2)兩個(gè)部分,任何寫入R1的數(shù)據(jù)都會(huì)同時(shí)被自動(dòng)復(fù)制到R2之上[2]。
SRDF具有以下優(yōu)點(diǎn):
1) 對(duì)生產(chǎn)系統(tǒng)性能消耗非常小
使用SRDF復(fù)制方案,主中心和災(zāi)備中心兩套磁盤陣列之間數(shù)據(jù)一致性依靠磁盤陣列本身的SRDF來完成,完全不依賴主機(jī)系統(tǒng),因此現(xiàn)有主機(jī)性能幾乎不受影響。
2) 可以保證數(shù)據(jù)的實(shí)時(shí)性和完整性
3) 對(duì)應(yīng)用、主機(jī)、數(shù)據(jù)庫(kù)等存儲(chǔ)系統(tǒng)之上的層面幾乎不需做任何改動(dòng)
4) 系統(tǒng)可用性強(qiáng),系統(tǒng)切換簡(jiǎn)單,減低了維護(hù)和操作風(fēng)險(xiǎn)
3.2 企業(yè)IDC災(zāi)備系統(tǒng)中SRDF技術(shù)實(shí)現(xiàn)
一般企業(yè)IDC災(zāi)備系統(tǒng)包括:
1) 2套EMC存儲(chǔ)系統(tǒng)
2) 主中心和災(zāi)備中心各自的存儲(chǔ)光纖交換機(jī)
3) 每個(gè)EMC存儲(chǔ)的SRDF微碼許可證
4) 主中心和災(zāi)備中心間的若干對(duì)裸光纖鏈路
5) SRDF系統(tǒng)軟件、控制進(jìn)程及其相關(guān)環(huán)境
當(dāng)部署完災(zāi)備系統(tǒng),建立起物理連接,我們確定了主中心哪些邏輯設(shè)備需要遠(yuǎn)程復(fù)制之后,就開始啟動(dòng)指定設(shè)備的同步處理,同時(shí)R1設(shè)備數(shù)據(jù)向R2設(shè)備進(jìn)行拷貝。在初始同步過程中,可將應(yīng)用I/O指定給R1單元,表示該應(yīng)用I/O在數(shù)據(jù)同步過程中要優(yōu)先處理。最后所有設(shè)備都進(jìn)入同步狀態(tài)(也稱為穩(wěn)定狀態(tài)),連接鏈路就只需傳送有變化的數(shù)據(jù)了。
由于RPO要求為0,即容災(zāi)點(diǎn)的數(shù)據(jù)狀態(tài)和生產(chǎn)點(diǎn)必須保持足夠一致,SRDF災(zāi)備系統(tǒng)同步模式下的數(shù)據(jù)處理過程如下:
1) 數(shù)據(jù)被寫到本地EMC存儲(chǔ)的緩存中;
2) 將一個(gè)輸入項(xiàng)置于SRDF更新數(shù)據(jù)的FIFO隊(duì)列中;
3) 第一個(gè)可用的RLA從隊(duì)列中提取第一個(gè)輸入項(xiàng),并通過鏈路將其送到遠(yuǎn)程EMC存儲(chǔ)的緩存;
4) 遠(yuǎn)程EMC存儲(chǔ)發(fā)送數(shù)據(jù)接收確認(rèn)信號(hào);
5) 修改磁道表;
6) 向發(fā)出請(qǐng)求的主機(jī)發(fā)回設(shè)備結(jié)束信號(hào);
由于采用同步模式,如果某個(gè)盤卷已經(jīng)啟動(dòng)了寫操作,則所有該盤卷以后的讀寫訪問都將被放到隊(duì)列中等待,直到該寫操作被遠(yuǎn)程確認(rèn)。這樣就保證了主中心和災(zāi)備中心數(shù)據(jù)的完全一致。
4 小結(jié)
在設(shè)計(jì)災(zāi)備方案時(shí),除了考慮RPO(數(shù)據(jù)恢復(fù)點(diǎn)目標(biāo))和RTO(恢復(fù)時(shí)間目標(biāo))外,還要充分利用現(xiàn)有硬件資源。基于SRDF技術(shù)實(shí)現(xiàn)的遠(yuǎn)程復(fù)制災(zāi)備系統(tǒng),可以滿足系統(tǒng)業(yè)務(wù)持續(xù)性、高可用性的要求,具有實(shí)時(shí)性強(qiáng),易于維護(hù)等優(yōu)點(diǎn)。
參考文獻(xiàn):
[1] 劉曉鵬.容災(zāi)關(guān)鍵技術(shù)分析及方案設(shè)計(jì)[J].科技資訊,2006(25):213-214.