賈棟
當今的世界,計算機技術在不斷告訴發展,各大、中型企業的日常運營及業務發展都已離不開信息系統,因此往都建立自己的信息中心及業務系統,并為此投入大量的財力物力,購置大量的IT設備,不動資產動則幾億甚至幾十億。但仔細推敲下來,企業信息中心里,最寶貴的并不是這些設備,而是無形資產,即設備上承載的數據及業務。試想下如果銀行丟失了儲戶信息;通信公司中斷了通信業務,哪怕只是停止一天,那么這些企業在當下競爭激烈的市場中,還能生存下去嗎?答案必然是否定的。
因此當企業發展到一定規模后,完全有必要建立起災備中心,在災備中心對核心生產系統的數據進行實時或準實時復制,同時建立一套業務系統的運行環境。在生產中心發生故障或受損后,在保證在備份中心數據的完整性的基礎之上,利用災備側業務系統將生產業務迅速切換到災備系統,恢復生產業務的繼續運行。
一、災備中心架構模式
災備中心建設前,需要先根據生產中心和災備中心承擔的業務情況進行分類,確定其災備的架構模式,目前主要分為主備中心、雙中心互備、讀寫分離雙活,讀寫并行雙活四類。
主備中心模式:生產中心承擔生產業務,災備中心主要承擔容災功能,生產中心與災備中心為主備關系。在這種方式下災備中心也有可能承擔輔助生產業務,如:承擔軟件開發、性能測試、個性化統計或臨時的統計分析功能,但要注意不能影響容災的功能。
雙中心互備模式:生產中心和災備中心均承擔生產業務,兩個中心互為災備,負荷分擔,具體業務可按照系統功能域或地域劃分,中心間基本對等。該模式在提供容災功能的基礎上,提高了資源的利用率,但也使容災實現技術復雜化,實施及維護成本均加大,人員能力也隨之增加,投資規模較主備模式也有一定上升。
讀寫分離雙活模式:兩個中心同時承擔生產業務,中心間能力基本對等,應用層都承擔對外服務,在數據層,其中一端承載讀寫業務,另外一端承載只讀業務。一個中心平時承載讀寫類的生產業務,另一個中心平時為只讀,當其中一個中心出現故障后將數據層讀寫角色轉換,再通過接入層的全局負載均衡機制或按照DNS進行應用指向切換即可,該模式對應用及數據一致性有一定要求。
讀寫并行雙活模式:兩個中心同時承擔生產業務,中心間能力基本對等,應用層都承擔對外服務,在數據層兩端同時承載讀寫業務,對應用透明任何一個中心出現故障,另外一個中心自動接管業務,無須切換過程。中心間業務接入可根據前端的全局負載均衡機制或按照DNS將不同業務區的業務接入到不同中心。
從上述四個架構中來看,讀寫并行雙活模式大幅提升了資源利用率,不但使應用層全部實現生產功能,而且使數據層實現日常可以讀寫訪問,結合應用部署改造,可實現災難情況下快速自動切換,實現無縫接管。但由于基于跨中心模式,具體技術實現比較復雜,對中心間距離、時延、傳輸帶寬、傳輸鏈路的穩定性相比其他方式帶來更高的要求,且由于架構的特性可能出現“腦裂”的情況,降低整個系統的穩定性,因此可以根據局房地址,投資情況,人員能力等實際情況進行選擇。
二、切換技術分析
災備中心的建設,最主要考慮的兩個指標就是RTO(恢復時間目標)和RPO(恢復點目標),RTO(恢復時間目標)指標主要通過切換技術實現,RPO(恢復點目標)指標主要通過數據同步復制技術實現。
目前,通常的切換技術主要有以下幾種:
DNS:采用DNS域名切換技術,所有的應用需根據域名來訪問,而不是直接根據主機的IP地址來訪問。可通過修改域名服務器上配置來進行切換。
LDAP:采用LDAP(輕量目錄訪問協議)技術,所有的應用只需配置一個簡單的LDAP連接串,之后通過LDAP服務器來解析數據庫的實際連接串(含IP,SID或SERVICE等配置信息)。可通過修改LDAP服務器中的配置來進行切換。
TNS配置文件:通過在客戶端主機上設置一個TNS配置文件,應用程序通過TNS配置文件中來獲得數據庫的相關信息,并以此來連接數據庫。可通過修改該配置文件來進行切換。
L4/7 SWITCH:將L4交換機放置在客戶端的出口處,對于客戶端來說,訪問的始終是一個虛擬地址,這個虛擬地址由L4交換機進行判斷解析,始終將之映射到現在正常工作的數據庫上。可通過修改L4交換機的配置來進行切換。
上述四種切換技術中,DNS、LDAP比較突出,其中DNS具有簡單,快速,費用低的優點;LDAP具有簡單,快速,費用較低的優點,此外還能修改連接串的具體內容。因此通常建議主要考慮采用這兩種切換方式。
三、同步技術分析
容災數據同步技術則主要分為如下幾種:
數據庫層復制:復制的粒度是數據庫內數據操縱動作,復制的范圍為單個數據庫。在對數據操縱動作的執行過程中,將一組整體完成的動作集合作為交易記錄來進行管理,可利用數據庫本身的重做日志記錄交易的變更情況,利用歸檔日志定期將聯機日志進行切割、保留。其同步方式為同時傳輸重做日志(如DSG)和歸檔日志(如dataguard),最終兩側數據庫中已提交執行的事物一致性。
存儲底層復制:基于存儲鏡像復制技術的災備方案的核心是利用存儲陣列自身的盤陣對盤陣的數據塊復制技術實現對生產數據的遠程拷貝,從而實現生產數據的容災保護。在主數據中心發生故障時,可以利用災備中心的數據在災備中心建立業務運行環境,為業務繼續運營提供IT支持。同時,也可以利用災備中心的數據恢復主數據中心的業務系統,從而能夠讓業務運營快速回復到災難發生前的正常運營狀態。如:IBM PPRC,EMC SRDF
操作系統卷復制:基于操作系統卷復制技術工作在主機的卷管理器這一層,通過磁盤卷的鏡像或復制,實現數據的容災。通常通過安裝卷管理軟件來實現,遠程復制控制管理軟件將主用節點系統的卷上每次I/O的操作數據實時或準實時復制到遠程節點的相應卷上,實現遠程兩個卷之間的數據同步或準同步。主、備節點之間需要相應帶寬的IP通道。如:Symantec VVR
遠程擴展集群技術:通過數據庫擴展集群技術結合邏輯卷鏡像技術,將生產、災備兩地的磁盤遠程鏡像后生成邏輯卷,將IO的讀寫同時應用在兩地的磁盤陣列上,實現雙中心磁陣的實時同步;再通過數據庫的遠程擴展集群技術,在兩側機房分別搭建出數據庫節點,形成兩地的數據庫集群。最終實現底層存儲數據實時同步,兩地數據庫同時打開,對外提供服務。如:VERITAS SF + ORACLE Extend RAC。
基于歸檔文件的數據庫層復制技術的主要優點:能和生產庫保持物理上完全一致,且實現相對簡單,主要缺點是,災備側數據庫無法打開。
基于重做日志的數據庫層復制技術的主要優點:能將災備端的數據庫打開,實現雙中心雙活。主要缺點是:邏輯一致,兩側執行計劃可能不一致。
存儲底層復制技術的主要優點:兩側完全一致,數據丟失為零,部署簡單。主要缺點是:災備端數據庫無法打開;設備及投資費用較高。
操作系統卷復制技術的主要優點:投資少;兼容不同品牌。主要缺點是:對生產環境的性能有一定影響。
遠程擴展集群技術的主要優點:能將兩側數據庫同時打開實現雙活,切換速度快。主要缺點是:網絡要求極高,部署復雜維護困難。
四、總結
企業級災備中心的建設及技術類型有多種組合可以選擇,具體實施時還需根據公司的運營情況,業務特點,對外影響,預算情況等進行綜合評估后。比如:企業業務復雜,對外敏感,無法接受數據丟失的選擇“雙中心互備模式+DNS+存儲底層復制”;企業業務簡單,但不允許中斷的選擇“讀寫并行雙活模式+LDAP+遠程擴展集群技術”。