文/梁藝軍 陳子建
同校異地實現數據級容災
文/梁藝軍 陳子建
為給各個應用系統提供一個具有高可用性的、可擴展的、可管理的數據保護環境,中國人民大學建立了校園數據資源異地容災系統,實現數字信息的不可丟失性。

我校數據存儲的狀況是:數字校園存儲和郵件服務存儲放在同一個機房內,其中,數字校園存儲采用FCSAN,并通過光纖交換機與服務器做全冗余聯結,而郵件存儲采用IP SAN。校園卡存儲存在同校異地,與數字校園機房距離小于1公里,并且有光纖線通達,校園卡存儲也采用FCSAN,與服務器直聯。
數據類型
需要保護的數據類型包括6種:1.數據庫數據:主要以Oracle為主,以SQL Server為輔;2.文件型數據:包括桌面文檔、報告、論文等;3.程序代碼;4.課件;5.多媒體格式的數據結構:主要表現為新聞影像、網絡電視記錄等;6.其它類型數據。
最主要的數據是數據庫數據和課件數據:數據庫數據支持應用,是學校業務運行的依據;而課件數據是學校的無形資產。
數據環境
我校的數據環境的具體情況如下:
1.服務器:硬件主要以SUN 大型機為主,其余均為普通的 PC服務器;
2.操作系統:操作系統主要是Solaris(1 0)、Windows;
3.網絡:目前各個源數據點和容災點有光纖聯通,隨著應用的發展,源數據點和容災點沒有光纖聯通的情況將會出現,但會有網絡,需要異步方式;
4.數據加密:業務信息管理和容災管理職責不同,有敏感數據加密問題,另外,一些文檔也對密文容災;
5.進程代理:在服務器內存駐留代理的情況需要慎重,這源自于數據的敏感性和對CPU與內存效率的影響;
6.存儲的異構性:多個廠家的多個存儲系統同時運行著,而且不是早期型號就是低端系統。
在規劃系統時,我們必須站在全局的高度進行全面的規劃和相關技術的分析,以確保今后系統能夠平穩過渡并最大程度保護現有投資。因此,我們需要構建一套先進的、可擴展的、高性能的異地容災系統,但是考慮到投資、發展和先有后優的原則,我們先進行少量投資建立可行的同校異地數據災備系統,對現有系統的數據完成數據級容災標準的保護措施。
根據上述目標和當前環境的分析,容災的需求如下:
1.數據中心關鍵系統的數據要求完成異地的同步容災備份;
2. 根據其余業務系統的數據的重要程度,要求完成異步的數據復制或定期的數據復制;
3.對于同步數據可以定時進行快照保護,通過多重技術對于數據進行多層次的保護,避免物理故障或邏輯錯誤對于數據的影響;
4.在容災備份中心通過快照數據創建復制卷,使其用于生成報告、開發應用程序或測試等目的;
5.后期還需要考慮學校師生的桌面級數據備份需求。
系統的設計過程遵循5個原則。
安全性/高可用性原則
考慮到各應用系統的具體情況,在完成數據的同步或異步復制時,盡量不占用或少占用主機的資源。
管理性/系統高效原則
為保證數據存儲的可管理性,方案設計要減少管理的復雜性,應采用先進的數據保護技術,保證數據的一致性。
先進性/可擴展性原則
不但要能夠完成現有數據保護的要求,而且要具有靈活的擴展性,可以在原有建設的基礎上,根據客戶后期的需求進行整體方案的平滑升級。
分步實施原則
方案的實施可以是有選擇性的實施,根據客戶目前的現狀和要求進行分期部署與實施,并且在后期的升級過程中,能夠有效使用前期的設備,達到整體投資的合理利用,無需重復投資。
投資最有效原則
系統方案應具有高性能價格比,具有較高實用性。
數據復制的分類比較
容災系統的保護級別可以分為數據級容災和應用級容災。在第一階段,我們要實現的是數據級容災(亦稱作數據災備)。數據級容災指的是對生產機的業務數據定期進行異機保存,當生產機的業務數據由于災難而損失時,待生產機修復之后,利用異機保存的數據來恢復業務。
根據容災系統所采用的數據復制實現層次的不同,又可分為基于主機層的復制、基于陣列層的復制和基于中間設備的復制。
1.基于主機層的復制
實現方式:由主機操作系統安裝容災軟件方式來實現,不同操作系統使用軟件包組件不一樣,成本不一樣,安裝維護的方式也有不同。
優點: 支持異構的存儲系統,比較容易實現。
缺點:
(1)因為復制是建立在其對應的數據庫或者卷管理基礎上,有一定的局限性;
(2)需要在每一臺應用服務器上安裝;
(3)系統運行占用主機資源,會影響主機的系統運行性能;
(4)操作系統的版本和存儲軟件的版本兼容性需要一一確認。
2.基于陣列層的復制
實現方式:存儲陣列支持遠程鏡像和復制功能的設備,實現兩地存儲設備間數據的容災。
優點: 鏡像和復制功能與主機無關,不占用主機資源。
缺點:
(1)兼容性比較差,通常要求容災兩側的存儲設備為同一個型號或系列;
(2)對陣列的要求和網絡要求條件要求較高,成本高。
3.基于中間設備的復制
實現方式 :通過專用設備,實現對接管存儲的數據的全部容災。
優點:
(1)基于網絡層,與主機及陣列無關,即不占用主機和陣列資源,對陣列功能特性沒有特殊要求;
(2)能夠實現全網存儲的統一災備;(3)支持多點對一點的集中容災;(4)支持網絡傳輸帶寬的限制和容災策略配置。
缺點:需要額外購買設備,成本高。
容災方案的選擇
在本方案設計中,針對學校的不同應用系統的實際情況、業務特點及災備需求,可以選擇不同的數據保護方案,在此,我們主要有兩種數據保護方案。
1.基于鏡像的實現
這種方案適用于對業務連續性要求很高、災備中心和生產中心距離不遠(一般要求小于100KM),同時能提供較大互聯帶寬(最好是能提供光纖直連)的場景。
2.基于復制的實現
這種方案適用于災備中心和生產中心距離較遠(大于100KM)、互聯帶寬成本較低(如租用線)的場景。
我們現在采取方案1,在校內完成數據異地災備系統,同時也考慮方案2,為以后遠距離異步容災或者針對不能提供較大互聯帶寬的校內數據源容災做好準備。
基于鏡像的容災實現
綜合考慮學校數據中心關鍵業務系統對容災要求業務連續性較高,而容災備份中心擬建在校園內,兩個中心距離不遠且裸光纖直連,因此,在第一階段,我們使用基于鏡像實現的數據容災,見圖2。

圖2 基于鏡像的數據級容災方案
總體方案如下:
1.在數據中心配置一臺容災控制器,對SAN網絡內的存儲進行統一管理,對于IP SAN存儲,管理方式相同;
2. 在容災備份中心配置一臺備份陣列,通過裸光纖連接到生產中心的光纖交換機上,采用FC接口協議;
3. 生產中心和災備中心陣列(可以是異構陣列)在容災控制器上配置鏡像關系;
4. 主機的任何寫操作,經容災控制器分發后同步寫到生產中心和容災備份中心的磁盤陣列上,生產中心和災備中心磁盤陣列寫完成后,通過容災控制器同時向主機報告寫完成信號,實時保證數據的嚴格一致。
數據容災實現的流程是:
1. 在容災控制器上配置生產陣列和備份陣列為鏡像關系;
2. 在正常情況下,主機下發寫命令到容災控制器,控制器同時寫生產卷和鏡像卷;
3. 生產卷和鏡像卷數據保持嚴格一致,主機只見到一個卷,對鏡像過程無感知;
4. 生產或備份任一陣列損壞,不影響業務正常操作;
5. 在線更換損壞陣列,重新在控制器上配置鏡像關系;
6. 原有數據自動遷移到新加入陣列,保持數據一致性,過程無需暫停業務。
(作者單位為中國人民大學網絡與教育技術中心)